Mit OpenAIs GPT-5.5 setzt das Unternehmen stärker auf ein Modell, das auf agentisches Arbeiten ausgelegt ist. Es soll Fragen nicht nur beantworten, sondern Aufgaben eigenständiger verstehen, strukturieren und über mehrere Schritte hinweg umsetzen. Besonders bei komplexeren Problemen soll sich das in besserem Umgang mit Kontext, längeren Handlungsketten und der Nutzung von Tools zur Überprüfung und Weiterverarbeitung von Ergebnissen zeigen.
Laut Tests soll GPT-5.5 bei Reasoning und Autonomie gegenüber GPT-5.4 und Claude Opus 4.7 deutlich zugelegt haben. Hervorgehoben wird, dass das Modell Probleme früher erkennt und Prüf- oder Testschritte teilweise antizipiert, ohne dass dies explizit im Prompt vorgegeben werden muss.
Auch OpenAI veröffentlichte Benchmarks, die Verbesserungen beim Reasoning erfassen sollen. Besonders beim anspruchsvolleren Benchmark ARC-AGI-2 für mehrschrittiges Denken, Generalisierung und komplexe Problemlösung legte GPT-5.5 laut OpenAI gegenüber GPT-5.4 um mehr als 10 Prozentpunkte zu und erreichte rund 85%. Das deutet vor allem auf Fortschritte bei abstrakterem und robusterem Schlussfolgern hin.
Von Ida Kandler
Quelle: OpenAI, 23.04.2026, von Redaktion
