Claude Code vs Cursor vs Windsurf

Viele Teams brauchen nicht ein bestes Tool, sondern zwei Arbeitsmodi. Ein Vergleich für DACH-Unternehmen, die wissen wollen, was sie wirklich kaufen.

In einer Umfrage des Pragmatic Engineer Newsletter (906 Teilnehmer, befragt im Februar, veröffentlicht im März 2026) nennen 46% der Entwickler Claude Code ihr Lieblings-Tool. Cursor kommt auf 19%. Die Stichprobe ist nicht repräsentativ für alle Entwickler, aber sie liegt nah an der Zielgruppe, die diese Tools tatsächlich nutzt: Senior Engineers, Tech Leads, Early Adopters.

Die Zahlen sind eindeutig. Die Schlussfolgerung nicht.

Momentaufnahme mit Stand April 2026. Windsurf firmiert seit dem 2. Juni 2026 als Devin Desktop unter Cognition. Die Produktnamen im Text bezeichnen weiterhin das damals verglichene Werkzeug.

Die Frage ist falsch

„Claude Code oder Cursor?" klingt wie eine Entweder-oder-Entscheidung. Ist es aber nicht. Viele erfahrene Teams nutzen beides. Cursor für die tägliche Arbeit im Editor: Tab-Completion, schnelle Inline-Fixes. Claude Code für die schweren Sachen: Multi-File-Refactoring, Architekturentscheidungen, alles, was mehr als 50.000 Token Kontext braucht (Faustregel).

Für leichte Nutzung startet die Kombination bei 40 Dollar. Realistisch liegen aktive Nutzer eher bei 60 bis 220 Dollar, API-Nutzung nicht eingerechnet.

Das klingt nach Luxusproblem. Ist es auch. Aber die eigentliche Frage für DACH-Unternehmen ist eine andere: Was kaufen Sie sich mit diesen Tools eigentlich ein? Wer erst den strategischen Rahmen braucht, findet ihn im Leitfaden für Engineering-Leads.

Was die Tools wirklich können

Claude Code ist in erster Linie ein Terminal-Agent (ein Programm, das selbstständig Aufgaben ausführt), kein klassisches Autocomplete-Plugin. Dazu kommt eine native VS-Code-Erweiterung, die Anthropic als empfohlene grafische Oberfläche für VS Code führt. Sie tippen Befehle, Claude liest Ihre Codebase, schreibt Dateien, führt Tests aus, iteriert. Das Kontextfenster reicht bis zu einer Million Token auf den Max-Plänen. Das kann je nach Codebase große Teile eines Repositories erfassen, bei mittelgroßen Monorepos sogar alles.

Claude Code glänzt bei komplexen, zusammenhängenden Änderungen über viele Dateien hinweg. Framework-Migrationen. Legacy-Refactoring. Architektur-Reviews. Was es nicht bietet: Tab-Completion im Editor-Stil. Ein visuelles Diff zeigt inzwischen die VS-Code-Erweiterung als Seite-an-Seite-Ansicht vor dem Übernehmen. Das Kernprofil bleibt aber der agentische Terminal-Workflow. Wer schnell eine Funktion umbenennen will, greift besser zum Editor.

Cursor ist ein Fork von VS Code mit eingebautem KI-Backend. Die Tab-Completion fühlt sich an, als würde jemand mitdenken. Eine große Auswahl an Modellen: Claude, GPT-5, Gemini, Grok und mehr. Die Codebase wird indexiert, Vorschläge kennen den Kontext.

Im Alltag ist Cursor schneller. Vertrautes Interface, schnelle Edits. Aber das Kontextfenster ist kleiner. Ein Builder.io-Vergleich misst 70.000 bis 120.000 Token effektiv, je nach Modell. Das sind Community-Tests, keine Herstellerangaben. Bei großen Refactorings verliert Cursor den Faden.

Aktualisierung (Juli 2026): Cognition führt Windsurf seit dem 2. Juni 2026 als Devin Desktop und positioniert es als die nächste Generation des Produkts, voll rückwärtskompatibel zur bisherigen IDE. Die folgenden Angaben beschreiben Windsurf vor diesem Schritt. Name, Tarife und einzelne Funktionen laufen inzwischen unter Devin Desktop. Datenresidenz- und Compliance-Angaben weiter unten sind gegen die aktuelle Cognition-Trust-Seite zu prüfen.

Windsurf war bis März 2026 der günstige Außenseiter (15 Dollar statt 20). Dieser Vorteil ist weg. Die Cascade-Engine kann dafür bis zu fünf Agenten parallel laufen lassen. Das ist im aktuellen Wettbewerbsfeld ein klares Differenzierungsmerkmal. Solide sind auch die Compliance-Zertifizierungen (SOC 2 Type II, HIPAA; FedRAMP High nur für dedizierte GovCloud-Deployments). Historisch warb Windsurf mit EU-Datenresidenz über einen Frankfurt-Cluster (nur Enterprise). Seit das Produkt unter Cognition zu Devin Desktop wurde, ist eine EU-Datenresidenz jedoch nicht mehr dokumentiert: die aktuellen DPA- und Security-Unterlagen stützen sich auf Standardvertragsklauseln mit US-Subprozessoren. Wer EU-only braucht, muss den Verarbeitungsort vor der Nutzung schriftlich bestätigen lassen.

Der Haken: Stabilitätsprobleme (Abstürze bei langen Sessions) und eine Führungskrise.

Was Benchmarks sagen und was nicht

Benchmarks helfen, aber sie beantworten diese Kaufentscheidung nur teilweise. SWE-bench Verified misst, ob ein Agent reale GitHub-Issues lösen kann. Das ist näher an echter Softwarearbeit als klassische Code-Completion-Tests. Gleichzeitig ist der Benchmark zunehmend umstritten: OpenAI argumentiert seit Februar 2026, dass SWE-bench Verified durch Trainingsdaten-Kontamination und fehlerhafte Tests an Aussagekraft verloren hat und empfiehlt stattdessen SWE-bench Pro.

Die Richtung bleibt trotzdem nützlich: Claude-Modelle liegen bei agentischen Coding-Benchmarks regelmäßig vorne. Claude Opus 4.7 verbessert laut Anthropic vor allem produktionsnahe Coding-Aufgaben wie Rakuten-SWE-bench deutlich gegenüber Opus 4.6. Windsurf verwies für SWE-1.5 auf SWE-bench Pro und positionierte das Modell als schnellen Agenten für reale Coding-Aufgaben. Aktuelles Flaggschiff ist inzwischen SWE-1.7 (seit Juli 2026). Cursor argumentiert dagegen selbst, dass reine SWE-bench-Zahlen für Editor-Produkte nur begrenzt aussagekräftig sind, weil Produktqualität auch aus Indexing, Diff-UX, Tab-Completion, Modellrouting und Latenz entsteht.

Nimmt man die Ergebnisse für bare Münze, sieht das Bild so aus:

Für die Praxis heißt das: Benchmarks stützen die Empfehlung „Claude Code für tiefe agentische Änderungen". Sie beweisen aber nicht, dass Cursor im Alltag schlechter ist. Cursor gewinnt oft über UX, Geschwindigkeit und Einbettung in den Editor. Windsurf gewinnt dort, wo Quotas und parallele Agenten wichtiger sind als der beste Einzel-Score. Auf eine EU-Datenresidenz sollten sich Teams unter Devin Desktop nicht ohne vertragliche Prüfung verlassen.

Die Preisfalle

Cursor Pro kostet 20 Dollar im Monat für Einzelnutzer. Seit der Team-Preisumstellung im Juni 2026 kostet ein Standard-Sitz 32 Dollar pro Sitz im Jahresabo (40 Dollar bei monatlicher Zahlung). Dazu kommt ein neuer Premium-Sitz für 96 Dollar im Jahresabo (120 Dollar monatlich) mit rund fünffachem Nutzungskontingent. Team-Sitze haben jetzt getrennte Kontingente für Erstanbieter-Modelle (Auto, Composer 2.5) und Drittanbieter-API-Nutzung. Für Einzel-Power-User gibt es weiterhin Pro+ (60 Dollar) und Ultra (200 Dollar). Was auf der Preisseite nicht sofort auffällt: das Credit-System.

In Foren und auf Reddit berichten Entwickler von unerwartet hohen Monatsrechnungen. Das Kleingedruckte: Sobald die Credits aufgebraucht sind, rechnet das System nach Verbrauch ab. Composer ist hungrig: Agentische Workflows verbrauchen Credits deutlich schneller als Tab-Completion. Man kann das Credit-System in den Einstellungen deaktivieren, aber dann stoppen die Anfragen einfach, wenn das Budget erschöpft ist.

Claude Code ist anders strukturiert. Pro kostet 20 Dollar, Max 5x kostet 100 Dollar, Max 20x kostet 200 Dollar. Wichtig: Pro verwendet standardmäßig Sonnet. Opus ist weiterhin wählbar, verbraucht aber das Kontingent deutlich schneller. Für realistische Opus-Nutzung empfiehlt Anthropic Max. Auch Anthropic bietet optional Overage-Billing an, aber die Monatspauschale ist der Standard.

Die API-Variante (für Teams, die volle Kontrolle wollen) rechnet nach Token ab: Sonnet bei 3/15 Dollar pro Million Token (Input/Output). Opus 4.6 und 4.7 kosten 5/25 Dollar, ältere Opus-4-Varianten 15/75 Dollar. Budgetrichtwert bei intensiver Nutzung: 10 bis 30 Dollar pro Entwickler und aktivem Tag.

Devin Desktop läuft über die Devin-Tarife (vormals Windsurf): Free (0 Dollar), Pro (20 Dollar), Max (200 Dollar) sowie Teams (80 Dollar im Monat plus 40 Dollar pro Vollnutzer-Sitz, Devin Desktop inklusive). Die Kontingente sind quotenbasiert statt reines Monatsbudget: an Sprint-Tagen weniger flexibel, dafür vorhersehbarer.

Preisvergleich (Stand Juli 2026)

Tool	Einstieg	Teams	Power-User	Überschreitungsrisiko
Cursor	20 $/Monat	32–40 $/Seat (Standard), 96–120 $ (Premium)	60–200 $	Hoch (Credits)
Claude Code	20 $/Monat	25–30 $/Seat	100–200 $	Gering bis mittel (Overage optional)
Devin Desktop (vormals Windsurf)	20 $/Monat (Pro)	80 $ + 40 $/Sitz (Teams)	200 $ Max, Enterprise individuell	Gering bis mittel (Quota)

DACH-Compliance: Die drei Hürden

Wenn Ihr Datenschutzbeauftragter oder Ihr Betriebsrat involviert ist, wird es kompliziert. KI-Coding-Tools treffen auf drei konkrete Anforderungen aus DSGVO und Betriebsverfassungsrecht:

AVV (Auftragsverarbeitungsvertrag)

Wenn Ihre Codebase personenbezogene Daten enthält (Kundennamen in Testdaten, E-Mail-Adressen in Configs, IPs in Log-Samples), greift Art. 28 DSGVO: Ohne Auftragsverarbeitungsvertrag ist die geschäftliche Nutzung dann rechtlich problematisch. In der Praxis betrifft das die meisten Enterprise-Codebases. Nicht jeder Plan enthält einen AVV.

Tool	AVV ab	Mindest-Tier
GitHub Copilot	Business	19 Dollar/Seat
Claude	Team	ca. 25 Euro/Seat (min. 2)
Cursor	Business	40 Dollar/Seat
Devin Desktop (vormals Windsurf)	Teams	40 Dollar/Sitz
Gemini Code Assist	Enterprise	54–75 Dollar/Seat

Die Free- und Pro-Tarife der meisten Tools enthalten keinen AVV.

EU-Datenresidenz

Wo werden Ihre Prompts und Ihr Code verarbeitet?

GitHub Copilot unterstützt seit April 2026 Data Residency für US und EU, aber nur im Enterprise-Cloud-Kontext. Das ist kein Automatismus für jeden Copilot-Plan.

Windsurf betrieb historisch einen Frankfurt-Cluster und routete Anthropic-Anfragen über AWS Bedrock Zürich. Seit Windsurf unter Cognition zu Devin Desktop wurde, ist eine EU-Datenresidenz nicht mehr dokumentiert: die aktuellen Security- und DPA-Unterlagen nennen nur Standardvertragsklauseln mit US-Subprozessoren. Verifizieren Sie den Verarbeitungsort, bevor Sie darauf bauen.

Claude und Cursor? US-Transfer. Wer EU-only braucht, muss über AWS Bedrock oder Google Vertex AI gehen. Nicht über die direkten Apps.

Gemini Code Assist hat trotz Vertex AI Frankfurt keine frei wählbare EU-only-Region für Code Assist selbst.

Betriebsrat

§87 Abs.1 Nr.6 BetrVG greift bei technischen Einrichtungen, die zur Verhaltens- oder Leistungskontrolle geeignet sind. Die Absicht des Arbeitgebers ist irrelevant. Die technische Möglichkeit reicht. (Ja, das ist so gemeint, wie es klingt.)

Wenn ein KI-Tool protokolliert, wann wer welchen Code generiert, ist es technisch zur Leistungsüberwachung geeignet. Das löst in der Regel Mitbestimmungspflicht aus. Ohne Betriebsvereinbarung kann der Betriebsrat die Nutzung per Einigungsstelle oder einstweiliger Verfügung stoppen. Den vollständigen Ablauf beschreibt der Beitrag zum Betriebsrat und KI-Rollout.

Bei KI-Einführungen kann die Hinzuziehung externer Sachverständiger nach §80 Abs.3 BetrVG naheliegen, insbesondere wenn technische Kontrollmöglichkeiten und Datenschutz bewertet werden müssen. Planen Sie das Budget ein.

Das Vendor-Risiko

Regulierung ist nur ein Teil des Risikos. Der Markt selbst bewegt sich gerade genauso schnell: Alle drei Tools haben strukturelle Probleme. Panik ist nicht angesagt. Aber aufpassen schon.

Cursor: Die xAI-Frage

Am 21. April 2026 wurde bekannt: SpaceX (das xAI im Februar 2026 integriert hat) hat eine Option, Cursor für 60 Milliarden Dollar zu übernehmen. Alternativ zahlt das Unternehmen 10 Milliarden für die bisherige Zusammenarbeit.

Die Entscheidung hängt laut Berichten mit dem erwarteten SpaceX-Börsengang zusammen. Die Option läuft bis Jahresende.

Was bedeutet das? Ein plausibles Risiko wäre stärkeres Grok-Routing statt Anthropic, oder weniger Multi-Model-Flexibilität (aktuell eine große Modellauswahl inklusive Claude). Belegt ist das nicht, aber es gehört in die Vertragsprüfung.

Für DACH-Teams: Vertragsklauseln zu Change of Control, Subprocessors und Datenverwendung können bei Neuverträgen oder Verlängerungen geändert werden. Prüfen Sie diese Stellen.

Windsurf: Die Führungskrise

Im Juli 2025 wurde Windsurf aufgeteilt. Google holte CEO Varun Mohan und Mitgründer Douglas Chen für 2,4 Milliarden Dollar. Cognition (die Devin-Macher) kaufte den Rest für 250 Millionen.

Drei Wochen später wurden 30 Mitarbeiter entlassen. Die verbliebenen 200 bekamen ein Ultimatum: 80+ Stunden pro Woche (sechs Tage) oder neun Monatsgehälter Abfindung.

Die ursprünglichen Gründer sind jetzt bei Google DeepMind. Jeff Wang, vorher Leiter des Geschäftsbereichs, ist Interims-CEO. Das ist mehr als normale Post-Merger-Unruhe. Für Käufer ist es ein relevantes Kontinuitätsrisiko.

Claude Code: Die Fünf-Wochen-Krise

Von März bis April 2026 hatte Claude Code drei gleichzeitige Produktfehler: ein Reasoning-Downgrade, ein Caching-Fehler, ein System-Prompt, der Antworten auf 25 Wörter begrenzte.

Das eigentliche Problem: Zwischen den ersten Bugs Mitte März und der öffentlichen Erklärung am 23. April vergingen rund fünf Wochen. Viele Nutzer empfanden die frühen Reaktionen als abwiegelnd.

Am 21. April wurde Claude Code kurzzeitig aus dem 20-Dollar-Pro-Plan entfernt (für 2% der Neukunden als „Test"). Nach Kritik wurde das innerhalb von 24 Stunden zurückgenommen.

Alle technischen Probleme sind seit dem 23. April behoben. Das Vertrauen nicht unbedingt.

Warum Tabnine in der Matrix auftaucht

Tabnine ist kein direkter Konkurrent zu Claude Code oder Cursor. Es positioniert sich als Option für regulierte Umgebungen: Air-Gapped-Deployment, Zero-Data-Retention, ein Modell, das laut Tabnine nur auf permissiv lizenziertem Code trainiert wurde („Protected 2"). Die Zertifizierungen (SOC 2 Type II, ISO 27001, GDPR) sind dokumentiert. Ob das für BaFin-regulierte Unternehmen oder Verteidigung ausreicht, muss Ihre Compliance-Abteilung im Einzelfall prüfen. Wer die regulatorischen Details für Finanzdienstleister braucht, findet sie im Beitrag zu BaFin, MaRisk und Coding Agents.

Die Entscheidungsmatrix

Use Case	Empfehlung
Tägliches Coding, Tab-Completion	Cursor
Multi-File-Refactoring (30+ Dateien)	Claude Code
Greenfield-Architektur	Claude Code
Frontend-Bugfixes (visuell)	Cursor
Framework-Migration	Claude Code
Kostensensible Teams mit hartem Budgetdeckel	Devin Desktop
Rapid Prototyping	Devin Desktop
CI/CD-Pipeline-Arbeit	Claude Code
EU-Datenresidenz erforderlich	Copilot Enterprise oder Bedrock/Vertex
Air-Gapped / sehr strenge Regulierung	Tabnine Self-Hosted
Bestehende Google-Cloud-Umgebung	Gemini Code Assist

Was ich empfehle

Für viele Teams empfehle ich Cursor plus Claude Code. Ausnahme: wer EU-only-Datenresidenz braucht. Für leichte bis mittlere Nutzung: 40 bis 100 Dollar pro Entwickler und Monat. Power-User liegen deutlich darüber. Cursor für die tägliche Arbeit, Claude Code für die großen Aufgaben. So arbeite ich selbst. Die Benchmark-Ergebnisse stützen diese Aufteilung: Claude ist bei agentischen Coding-Aufgaben stark, Cursor bleibt bei täglicher Editor-Arbeit schwer über Benchmarks abzubilden.

Für Teams mit strengen Compliance-Anforderungen: GitHub Copilot Enterprise (39 Dollar pro Nutzer/Monat, zusätzlich zu GitHub Enterprise Cloud) oder Tabnine (Self-Hosted, Air-Gapped möglich).

Für Teams auf Google Cloud: Gemini Code Assist als natürliche Ergänzung, aber ohne EU-Datenresidenz.

Für alle: Klären Sie die drei Hürden (AVV, Datenresidenz, Betriebsrat) bevor Sie ausrollen. Das Compliance-Gespräch vor der Pilotphase spart Ihnen das Compliance-Problem nach der Pilotphase.

Checkliste vor dem Rollout

Enthält die Codebase personenbezogene Daten? Wenn ja: AVV-fähigen Plan buchen.
EU-Datenresidenz erforderlich? Dann GitHub Enterprise Cloud mit Datenresidenz oder Bedrock/Vertex-Routing.
Betriebsrat vorhanden? Betriebsvereinbarung vor dem Pilotstart.
Kostenobergrenze definiert? Bei Cursor besonders wichtig (Credits!).
Change-of-Control-Klausel im Vertrag geprüft? Bei Cursor/Devin Desktop relevant.

Der Ausblick

Die Konsolidierung kommt. xAI kauft vielleicht Cursor. Cognition hat Windsurf bereits übernommen: seit dem 2. Juni 2026 läuft die IDE als Devin Desktop. Anthropic kämpft mit Kapazitätsengpässen (neue Rechenleistung frühestens Ende 2026/2027).

In sechs Monaten sieht diese Landschaft anders aus.

Die Fähigkeit, Werkzeuge zu kombinieren, ist wertvoller als die Wette auf einen Gewinner. Wer heute lernt, Claude Code und Cursor zusammen einzusetzen, kann morgen auf das wechseln, was dann funktioniert.

Für DACH-Unternehmen lautet die praktische Antwort: Cursor plus Claude Code, mit AVV-fähigem Business-Plan, Betriebsvereinbarung vor dem Rollout, Kostenobergrenze im Vertrag. Und ein Auge auf die xAI/SpaceX-Option bis Jahresende.

Die Frage „Cursor oder Claude Code?" wird nicht beantwortet. Sie wird irrelevant.

Stand: 19. Juli 2026. Die Preise, Funktionen und Eigentumsverhältnisse in diesem Markt ändern sich wöchentlich. Das SWE-bench-Diagramm oben bildet den Stand April 2026 ab.

Claude Code vs Cursor vs Windsurf

Die Frage ist falsch

Was die Tools wirklich können

Was Benchmarks sagen und was nicht