GPT-5 ist da: Beeindruckende Zahlen, aber Claude bleibt mein Co-Dev
Vor drei Tagen hat OpenAI GPT-5 veröffentlicht. Nach intensiven Tests mit dem neuen Modell möchte ich meine Eindrücke teilen - als jemand, der täglich mit KI-Tools entwickelt. Seit April 2025 nutze ich Claude als primären Co-Developer, nachdem ich zuvor mit OpenAI o3, GPT-4 und GPT-4.1 gearbeitet habe.
Die technischen Daten
OpenAI präsentiert beeindruckende Spezifikationen:
Die Community-Reaktionen auf X sind gemischt. Viele Nutzer berichten von Einschränkungen bei den Rate Limits, vermissen die Persönlichkeit früherer Modelle und merken an, dass die Benchmark-Ergebnisse nicht unbedingt die Praxis widerspiegeln. Einige bevorzugen weiterhin GPT-4o, während andere das neue Modell für alltägliche Aufgaben als sehr gut bewerten.
Mein Test mit AIpuna Code
Ich habe GPT-5 mit denselben Aufgaben getestet, die ich auch bei anderen Modellen verwende:
Die Aufgabe:
Refactoring eines komplexen Flutter-Widgets mit Dart, State Management und Stripe Payment Integration.
GPT-5 liefert funktionierenden Code, das ist unbestritten. Die Qualität ist gut für Coding-Aufgaben. Aber im direkten Vergleich fehlt mir das, was Claude auszeichnet: Claude fühlt sich wie ein echter Senior Co-Developer an, der die praktischen Anforderungen in Production-Umgebungen versteht.
Der grosse Kontext: Theorie vs. Praxis
500k Token Kontext - Eigentlich genau was wir brauchen
Grosser Kontext ist für Entwicklungsaufgaben tatsächlich sehr wichtig. Das Problem ist nicht die Grösse, sondern die Umsetzung:
Das eigentliche Problem:
Die hohe Nachfrage übersteigt wahrscheinlich OpenAIs Computing-Kapazität. Die Benchmark-Performance ist nur bei optimalen Bedingungen erreichbar - in der Realität kämpft das System mit der Last.
Google Gemini 2.5 Pro als Alternative:
Interessanterweise bietet Google Gemini 2.5 Pro eines der grössten Kontextfenster auf dem Markt und ist ebenfalls sehr gut für Entwicklungsaufgaben geeignet. In manchen Situationen liefert es stabilere Ergebnisse als GPT-5.
Benchmarks und Realität
GPT-5 zeigt starke Benchmark-Ergebnisse:
In der praktischen Anwendung beobachte ich:
Community-Feedback auf X
Die Diskussionen auf X zeigen ein differenziertes Bild:
Häufig genannte Kritikpunkte:
Positive Stimmen:
Der Vergleich: GPT-5 vs Claude 4.1 vs Gemini 2.5 Pro
Nach drei Tagen intensiver Nutzung:
GPT-5 - Beobachtungen:
Claude 4.1 - Meine Erfahrung:
Gemini 2.5 Pro - Die Ăśberraschung:
Payment Integration und Spezifika
Bei Payment-spezifischen Anforderungen zeigen sich Unterschiede:
Stripe Integration:
GPT-5 kennt Stripe gut und kann solide Implementierungen liefern. Claude versteht jedoch besser die Nuancen von Webhook-Handling, Idempotenz und Edge-Cases bei Payment-Flows.
Flutter-spezifische Patterns:
Alle drei Modelle beherrschen Flutter, aber Claude zeigt oft pragmatischere Ansätze bei State Management und Widget-Architektur. Gemini 2.5 Pro überrascht mit detailliertem Flutter-Wissen.
Workarounds fĂĽr GPT-5
Um mit GPT-5 effektiv zu arbeiten, habe ich folgende Strategien entwickelt:
Sequential Tasks:
Memory Management:
Präzise Regeln:
Mein persönliches Fazit
GPT-5 ist ein gutes Modell für Coding - das möchte ich klar festhalten. Es leistet solide Arbeit und wird von vielen Entwicklern geschätzt. Die technischen Verbesserungen sind real.
Aber für meine spezifischen Anforderungen bei der AIpuna-Entwicklung bleibe ich bei Claude 4.1. Nicht weil GPT-5 schlecht ist, sondern weil Claude sich für mich wie ein echter Senior Co-Developer anfühlt. Nach vier Monaten intensiver Zusammenarbeit versteht Claude meine Arbeitsweise und liefert pragmatische, produktionsreife Lösungen.
Meine Toolchain:
Empfehlungen
Für wen GPT-5 interessant sein könnte:
Wann Claude 4.1 die bessere Wahl ist:
Wann Gemini 2.5 Pro überraschen könnte:
Ausblick
Die Entwicklung geht weiter. GPT-5 wird sich verbessern, sobald OpenAI die Infrastruktur ausbaut. Gemini 2.5 Pro zeigt, dass Google ernsthaft mitspielt. Und Claude bleibt mein verlässlicher Partner.
Für mich persönlich ist die aktuelle Situation ideal: Wir haben mehrere sehr fähige KI-Assistenten zur Verfügung. Je nach Aufgabe kann ich das passende Tool wählen. Das ist ein Luxus, den wir vor einem Jahr noch nicht hatten.
Die wichtigste Erkenntnis: Es geht nicht um das "beste" Modell, sondern um das richtige Tool für die jeweilige Aufgabe. Und für meine tägliche Arbeit ist das Claude - aber es ist gut zu wissen, dass es Alternativen gibt.
Patrik Germann
30 Jahre IT-Erfahrung
Pragmatischer Multi-Model Nutzer
Kommentare
Bereit fĂĽr die KI-Transformation?
Lassen Sie uns gemeinsam die Möglichkeiten von KI für Ihr Unternehmen erkunden.
Beratung vereinbaren