Leitfaden

KI-Coding-Agents im Team einführen

Ihr Team hat Lizenzen für einen Coding Agent gebucht. Das Onboarding-Video ist durchgelaufen. Zwei Wochen später sieht die Velocity-Kurve besser aus, aber die Rufbereitschaft meldet sich häufiger. Und wenn der Vorstand fragt, was das Ganze bringt, fehlen die Zahlen.

Das passiert fast überall. Nicht weil die Werkzeuge schlecht sind, sondern weil die Einführung wichtige Fragen überspringt: Welcher Code darf überhaupt vom Agent kommen? Wer prüft das Ergebnis? Was muss der Betriebsrat wissen?

Dieser Leitfaden sammelt, was in den letzten zwölf Monaten in deutschen Entwicklerteams funktioniert hat. Ohne Hersteller-Versprechen, ohne Benchmark-Theater. Konkrete Entscheidungen, die Sie diese Woche treffen können.

Zuletzt aktualisiert: 3. Juli 2026

Was ist ein Coding Agent?

Ein Coding Agent ist ein Werkzeug, das Code schreibt, während Sie zuschauen. Sie beschreiben, was Sie wollen ("Füge einen Button hinzu, der die Daten exportiert"), und der Agent schreibt den Code dafür. Bekannte Beispiele sind GitHub Copilot, Cursor, Claude Code und OpenAI Codex.

Der Agent arbeitet mit einem Sprachmodell (LLM) im Hintergrund. Vereinfacht gesagt "rät" er, was als Nächstes kommen sollte, basierend auf dem, was er bisher gesehen hat. Manchmal trifft er ins Schwarze. Manchmal schreibt er Code, der kompiliert, aber das Falsche tut. Manchmal erfindet er Funktionen, die es gar nicht gibt.

Das macht ihn nützlich und gefährlich zugleich. Nützlich, weil er Routinearbeit beschleunigt. Gefährlich, weil sein Output aussieht wie Code von einem Kollegen, aber ohne die Garantie, dass jemand nachgedacht hat.

Die Frage ist nicht, ob der Agent gut oder schlecht ist. Die Frage ist, wie Ihr Team mit ihm arbeitet.

Trotz aller Aufregung um KI: Ein Coding Agent ist am Ende ein Werkzeug. Wie bei jedem Werkzeug muss man lernen, wo es hilft und wo es schadet, welche Aufgaben sich dafür eignen und welche nicht. Diesen Einsatzbereich zu definieren und die Tradeoffs zu verstehen, das ist die eigentliche Arbeit. Die Installation ist der einfache Teil.

Drei Fragen, bevor Sie anfangen

Bevor Sie die erste Lizenz bestellen, sollten Sie drei Fragen beantworten können. Ohne diese Antworten verläuft jede Einführung gleich: schneller Start, schleppendes zweites Quartal, leise Abschaltung nach sechs Monaten. Wenn Ihr Unternehmen einen Betriebsrat hat, kommt eine vierte hinzu: Wann greift die Mitbestimmung?

1. Für welchen Code setzen Sie den Agent ein?

Internes Tooling und der Scoring-Service einer Versicherung gehören nicht in dieselbe Pipeline. Nicht jeder Code ist gleich kritisch. Definieren Sie, wo der Agent helfen darf und wo nicht. In regulierten Branchen brauchen Sie diese Trennung auch für die Aufsicht, siehe BaFin, MaRisk und Coding Agents.

2. Trägt Ihr Review-Prozess das zusätzliche Volumen?

Ein Agent kann drei Dateien in zwei Minuten schreiben. Wenn Ihre Pull Requests heute schon ohne echte Prüfung durchlaufen, verdoppeln Sie das Problem. Einen kaputten Prozess repariert kein zusätzliches Volumen. Der Engpass wandert vom Schreiben ins Review und wird dort zum echten Flaschenhals.

3. Wer im Team kann den Output beurteilen?

Erfahrene Entwickler erkennen problematischen Output schneller, haben aber oft weniger Zeit für Reviews. Weniger erfahrene Entwickler haben die Zeit, aber nicht immer das Muster-Repertoire, um subtile Fehler zu erkennen. Ein Rollout, der beide Gruppen gleich behandelt, verschenkt das Urteilsvermögen der einen und überfordert die anderen. Mehr dazu: Was hinter der Skepsis erfahrener Entwickler steckt.

Wo sollten Sie anfangen?

Drei Faktoren bestimmen den Einstieg: Team-Größe, regulatorische Anforderungen und die Reife Ihres Review-Prozesses.

Team	Regulierung	Review-Reife	Empfehlung
Unter 10	Gering	Gut	Starten, nach 4 Wochen messen
Unter 10	Hoch	Mittel	Pilot auf unkritischem Code, 2 Reviewer
10 bis 40	Gering	Mittel	Zwei Pilotgruppen, klare Kriterien
10 bis 40	Hoch	Schwach	Erst Review verbessern, dann Agent
Über 40	Hoch	Gut	Gestaffelter Rollout, Dokumentation von Anfang an

Die Tabelle ist eine Faustregel, kein Geschäftsplan. Sie zeigt, wo Sie anfangen sollten, nicht wo Sie landen. Warum US-Playbooks in gewachsenen DACH-Codebasen oft scheitern.

01 · Rollout

Coding Agents einführen: So nehmen Sie Ihr Team mit

Ein Rollout, der als reines Technologie-Projekt läuft, scheitert an Fragen, die gar nicht technisch sind. Betriebsrat, Pilotgruppen, Schulung, Senior-Integration. Wer diese Themen in der richtigen Reihenfolge angeht, spart sich die Eskalation.

Drei Phasen, eine Entscheidung am Tag 90

90 Tage sind kein vollständiger Rollout, sondern ein Entscheidungsfenster für ein erstes Team-Experiment. Phase 1 testet die Hypothese, ob ein kleines Pilotteam den Agent auf der eigenen Codebasis zum Laufen bringt. Phase 2 prüft, ob der Produktivitätsgewinn die Messung übersteht, jenseits von Selbstauskunft. Phase 3 entscheidet, was bleibt, was Regel wird und was beerdigt wird. Wer alle drei Phasen parallel ansetzt, beantwortet keine sauber.

Drei Phasen, drei Fragen →

Wann der Betriebsrat ins Spiel kommt

Wenn Ihr Unternehmen einen Betriebsrat hat und Sie firmeneigene Agent-Accounts mit Admin-Zugriff einrichten, greift in den meisten Fällen das Mitbestimmungsrecht. Das klingt nach Bürokratie, ist aber lösbar. Der Schlüssel: Sprechen Sie früh mit dem Betriebsrat, nicht erst nach dem Pilotprojekt.

So bereiten Sie das Gespräch vor →

Warum US-Playbooks im deutschen Mittelstand nicht funktionieren

Die meisten Anleitungen für Coding Agents stammen aus dem Silicon Valley. Sie gehen von neuen Projekten aus, nicht von gewachsenen Systemen. Von kleinen Teams ohne Betriebsrat, nicht von deutschen Mittelständlern mit fünfzehn Jahre altem Java-Code. Wer diese Anleitungen eins zu eins übernimmt, kauft Lizenzen, die nach sechs Monaten verstauben.

Der Mittelstand-Pfad im Detail →

Wenn erfahrene Entwickler skeptisch sind

Senior-Entwickler reagieren oft zurückhaltender auf Coding Agents als Juniors. Das ist kein Widerstand gegen Veränderung. Es ist ein Urteil, das auf Erfahrung beruht. Wer diese Skepsis als Problem behandelt, verliert das beste Frühwarnsystem im Team.

Was hinter der Skepsis steckt →

Wer in den Pilot gehört (und wer nicht)

Pilot-Teams werden in den meisten Organisationen aus Freiwilligen zusammengestellt. GitHubs eigene Rollout-Doku empfiehlt diesen Pfad explizit. Das ist auch der Grund, warum die meisten Pilotbefunde im Rollout zerfallen: Sie messen in der Population, die ohnehin wollte, und rollen an die Population aus, die nicht gefragt hat. Sieben konkrete Kriterien drehen das um, von Repräsentativität über mittlere Kritikalität bis zur eingeplanten Skeptikerin im Team. Zwei davon sind nicht handelbar, fünf sind echte Kompromisse mit echten Konsequenzen.

Die sieben Kriterien zur Auswahl →

Warum ein erfolgreicher Pilot den Rollout nicht beweist

Ein Pilot misst, was Coding Agents unter Idealbedingungen leisten: selbstgewähltes Team, handverlesene Aufgaben, volle Betreuung. Keine dieser Bedingungen überlebt den Kontakt mit der Gesamtorganisation. Dazu kommt ein Widerspruch in der Datenlage: DORA 2025 sieht KI als Verstärker starker Engineering-Grundlagen, Faros 2026 misst per Telemetrie auch bei reifen Organisationen längere Review-Zeiten und mehr Incidents, sobald das Volumen ankommt. Die Frage vor dem Rollout ist deshalb nicht, wann skaliert wird, sondern ob die eigene Telemetrie erkennt, welches der beiden Muster die Organisation gerade durchlebt. Der Beitrag benennt die drei Fehler, die Rollouts kippen, und einen Plan in vier Stufen: Telemetrie vor Volumen, sequentielle Wellen, Risk Lanes und mitskalierte Review-Kapazität.

Vom Pilot in die Fläche →

02 · Tooling

Coding-Agent-Werkzeuge: Was für DACH-Teams wirklich zählt

Claude Code, Cursor, Copilot, Codex: Alle können funktionieren. Die Wahl des Werkzeugs ist weniger entscheidend als die Frage, ob Ihr Review-Prozess das zusätzliche Volumen trägt.

Welches Tool für welches Team?

Claude Code, Cursor und Windsurf bedienen unterschiedliche Arbeitsweisen, nicht unterschiedliche Qualitätsstufen. Die Frage "welches ist das beste" führt in die Irre. Entscheidend ist der Fit zu Ihrem Tech-Stack, Ihrer Review-Kultur und der Frage, wie viel Kontrolle Ihre Entwickler über den Agent-Lauf behalten wollen. Eine Benchmark-Tabelle des Anbieters hilft dabei wenig.

Die Entscheidungsmatrix →

Layering statt Migration

Wer Copilot bereits ausgerollt hat, muss für Claude Code oder Cursor keinen Big-Bang-Wechsel planen. Die Werkzeuge koexistieren gut: Copilot für Inline-Vervollständigung, ein Agent für umfangreichere Aufgaben. Das spart die politische Debatte um Lizenzkonsolidierung und liefert trotzdem die Vorteile beider Welten. Zwei Schichten, ein Workflow.

Der Migrationspfad ohne Big Bang →

Wann sich On-Premise wirklich lohnt

Einen Coding Agent selbst zu hosten klingt nach Kontrolle. Zwischen Public SaaS und vollständigem Air-Gap liegen zwei Zwischenstufen, die für die meisten DACH-Teams der bessere Startpunkt sind. Ein VPC-isoliertes Hyperscaler-Deployment löst die meisten regulatorischen Anforderungen, ohne sechsstellige Hardware-Investitionen.

Vier Deployment-Stufen im Detail →

Was kostet der Stack wirklich?

Seat-Preise sind nur die Eintrittskarte. Was ein Team am Ende zahlt, entscheiden Nutzung, Credits, Modellwahl und Governance-Overhead. Der interaktive Rechner stellt fixe und variable Kosten getrennt dar, vergleicht Claude Code, GitHub Copilot und Cursor und zeigt im Team-Modus, wie viele Minuten Zeitersparnis pro Entwickler den Break-even erreichen. Preise auf dem Stand von Juni 2026, mit Quelle an jeder Zahl.

Kosten und Break-even durchrechnen →

Agenten wechseln, ohne die IDE zu tauschen

Wer seit Jahren auf IntelliJ, PyCharm oder Rider standardisiert ist, musste für ernsthafte Coding Agents bisher über einen IDE-Wechsel nachdenken. Seit Cursor im März 2026 über das Agent Client Protocol in den JetBrains-IDEs läuft, ist dieses Argument deutlich schwächer. Die Entscheidung verschiebt sich von der IDE auf die Agenten und die Governance: JetBrains Console verwaltet Nutzung und Kosten heute, JetBrains Central ist als breitere Governance-Schicht angekündigt, aber erst im Early Access. Pro IDE bleibt das Bild unterschiedlich, am rauesten bei Rider. Die Reihenfolge: erst die Registry aktivieren, dann zwei bis drei Agenten in klar begrenzten Workflows testen.

Welche Agenten in die IDE dürfen →

Wenn der Agent in Ihre Systeme greift

Ein MCP-Server ist das Bauteil, das einem Coding-Agenten Hände gibt: Er liest Jira-Tickets, fragt die Postgres-Datenbank, bedient den Browser und öffnet Pull Requests. Der eigentliche Gewinn liegt aber nicht im einzelnen Tool, sondern im gemeinsamen Unternehmenskontext, also Architekturentscheidungen, Runbooks und Teamwissen, das ein Agent über MCP anschließen kann. Genau dieselbe Reichweite ist die Angriffsfläche: Was vorher Chat war, wird Datenbankabfrage, GitHub-Write und Slack-Nachricht. Der Beitrag erklärt Host, Client und Server, ordnet die Sicherheitslage nüchtern ein und nennt fünf Prüfpunkte, bevor der erste Server an den Agenten geht.

Was ein MCP-Server öffnet →

Der Login entscheidet über den Vertrag

Claude Code hat keinen eigenen Preis: Ab dem Pro-Abo ist es enthalten, im Team-Plan kosten Seats 20 bis 100 USD pro Monat (Stand Juli 2026). Die eigentliche Trennlinie verläuft zwischen Consumer- und Commercial-Konto. Sie entscheidet, ob Anthropic auf Ihrem Code trainiert, wie lange gespeichert wird und ob ein AVV nach Art. 28 DSGVO greift. Privater Pro-Login und Firmen-Seat starten dasselbe Binary, unterliegen aber getrennten Verträgen. Die Werkseinstellungen sind strenger als ihr Ruf (read-only ab Werk), und über erzwingbare Managed Settings legt ein Admin zentrale Regeln fest, die kein Entwickler lokal überschreibt. Der Beitrag liefert die produktspezifischen Zahlen und Policies mit Primärquelle und zieht die ehrlichen Grenzen: kein On-Premise, dazu die nüchterne Kontextfenster-Realität.

Das Freigabe-Dossier in vier Blättern →

03 · Messung

Produktivität messen: Jenseits der Velocity-Kurve

Die 10x-Versprechen aus den Launch-Videos halten keiner Prüfung stand. Realistisch: 30 Minuten Zeitersparnis pro Entwickler und Tag. Das reicht, um die Investition im ersten Halbjahr zu amortisieren.

Der Engpass verschwindet nicht, er wandert

Nach dem Rollout schreiben Ihre Entwickler schneller Code. Aber Review, QA und Betrieb laufen weiter im alten Tempo. Das Ergebnis: mehr Pull Requests in der Warteschlange, mehr Incidents in der Rufbereitschaft. Die Engstelle ist nicht weg, sie ist umgezogen.

Was die Daten auf Systemebene zeigen →

Token-Budget als Führungsaufgabe

Lizenzpreis ist nur die halbe Rechnung. Wer Claude Code, Cursor oder Copilot ernsthaft einsetzt, muss Token-Verbrauch, API-Aufschläge und Plan-Limits verstehen. Ein Senior, der Sonnet 4.7 unbegrenzt durchlaufen lässt, kostet schnell mehr als seine Lizenz. Ohne Budget-Disziplin auf Team-Ebene wird die Monatsabrechnung zur Überraschung.

Pricing und ROI im Detail →

Vier Metriken, drei Dimensionen, eine Attribution

DORA, SPACE und DX Core 4 wurden vor dem KI-Kontext stabilisiert. Keines beantwortet allein, ob der Agent etwas bringt. Ein bewusst kleines Vier-Metriken-Set über drei sich widersprechende Dimensionen, an Team-Ebene gebunden, mit Attribution am Commit, liefert die Antworten, die CFO und VP Engineering gleichzeitig brauchen. Acceptance Rate und Lines of Code gehören in keinen Bericht.

Welche Metriken den Rollout aushalten →

Fünf Variablen, ein Conversion Factor

Das Vendor-ROI-Modell scheitert beim CFO an einer einzigen Frage: Wo kommen die 30 Prozent her? Ein Modell, das Diligence übersteht, hat fünf Variablen statt einer Zahl. Brutto-Speedup, Tool-Kosten, indirekte Kosten, Downstream-Conversion-Faktor und Risiko-Aufschlag. Die durchgerechnete Bandbreite für ein 50-köpfiges Engineering-Team zeigt: Bei niedriger Conversion bleibt der Case auch über drei Jahre negativ, bei hoher Conversion trägt sich die Investition ab Jahr 2. Der Unterschied liegt nicht im Werkzeug, sondern im Conversion Factor.

Fünf Variablen statt einer Zahl →

04 · Workflows

Workflow-Muster: Vom Prompten zum Orchestrieren

Die Frage ist nicht, welcher Prompt funktioniert. Die Frage ist, welcher Ablauf. Ein Team mit gemeinsamem Vokabular und klaren Mustern produziert konsistente Ergebnisse. Individuelle Tricks skalieren nicht.

Orchestrieren statt Prompten

Vibe Coding ist kein Werkzeug und kein moralisches Versagen, sondern ein Betriebsmodus: Code entsteht schneller, als er verstanden und geprüft wird. Für Prototypen, persönliche Tools und Wegwerfskripte ist das vertretbar. Die Grenze ist aber nicht der Deploy-Button, sondern vier Fragen nach Reichweite, Reversibilität, Prüfbarkeit und Verantwortung. Fällt eine davon ungünstig aus, muss der Modus wechseln. Dasselbe Werkzeug, ob Cursor, Claude Code oder Copilot, lässt sich im Vibe-Modus oder orchestriert betreiben. Eine Risikoleiter von R0 bis R4 und eine Gegenüberstellung beider Modi zeigen, wann spontanes Prompten ausreicht und wann es klar umrissene Teilaufgaben, Tests, Rechte und einen benannten Verantwortlichen braucht.

Wann der Vibe-Modus kippt →

Archäologe, nicht Refaktorierer

Vor einem fünfzehn Jahre alten Java-Monolithen ist der Agent kein Refaktorierer. Er ist der Archäologe, der Stenograf und der mechanische Übersetzer. Architektur und Geschäftsinvarianten bleiben beim Menschen, der das Telefonat von 2014 noch kennt. Eine vierstufige Arbeitsweise (Baseline, Charakterisierungstests, Strangler Fig, kleine PRs mit benannten Reviewern) trennt die Aufgaben, in denen KI im Altsystem Wert liefert, von denen, in denen sie stille Produktionsfehler baut.

Archäologe statt Refaktorierer →

Grüne Tests, die nichts prüfen

Ein Coding Agent hebt die Testabdeckung zuverlässig, aber Coverage ist eine Eingangsgröße, kein Qualitätsnachweis. Sich selbst überlassen schreibt der Agent lineare, mock-lastige Tests, die sein Modell des Codes prüfen statt dessen Verhalten, samt Assertion Roulette und Magic Numbers, die die Suite nach einem halben Jahr teuer machen. Vier Muster drehen das um: Test vor Implementierung mit Commit dazwischen, Charakterisierungstests vor dem Refactor, ein fehlschlagender Test vor jedem Bugfix und Mutationstests für Auth- und Bezahlpfade. Die gemeinsame Idee ist, dem Agenten ein anderes Ziel zu geben als die grüne Zahl. Dazu ein Satz Regeln für CLAUDE.md, AGENTS.md oder Cursor Rules, der die typischen Eigenheiten heutiger Agenten korrigiert.

Vier Muster gegen Schein-Sicherheit in Tests →

Vier Stimmen, vier Regeln im Review

Auf der Pull-Request-Seite stehen 2026 vier Stimmen: ein menschlicher Kommentar, ein KI-Reviewer, von einem Agenten geschriebener Code und ein zweiter Agent, der dem ersten widerspricht. „KI Code Review“ ist damit keine einzelne Tätigkeit mehr, sondern ein Vier-Parteien-Problem: Mensch prüft Mensch, KI prüft Mensch, Mensch prüft KI, KI prüft KI. Jede Konstellation hat ein anderes Versagensmuster und braucht eine andere Regel. Der Martian-Benchmark und Anthropics interne Zahlen zeigen, was KI-Reviewer zuverlässig können; Kontext, Absicht und Architektur zeigen, wo sie strukturell versagen. Am Ende entscheidet kein Agent, ob der Code existieren sollte, sondern ein benannter Mensch.

Vier Konstellationen, vier Regeln →

Die gute AGENTS.md-Datei ist zu lang

Zwei Vorabveröffentlichungen von Anfang 2026 scheinen sich zu widersprechen: Die eine misst eine AGENTS.md-Datei im Wurzelverzeichnis als Beschleuniger, die andere Kontextdateien als Kostentreiber. Beide haben recht, weil sie Verschiedenes messen. Die Heuristik dahinter: Kontextdateien helfen, wenn sie knappe, projektspezifische Anforderungen festhalten, die der Agent nicht aus Code und Standardwissen ableitet, und schaden, wenn sie wiederholen, was er ohnehin weiß. In einer gewachsenen Codebasis ist dieser nicht erschließbare Anteil größer als in jeder Demo für ein Neuprojekt. Vier Patterns bewähren sich dort: ein eng begrenztes Änderungsbudget, Charakterisierungstests vor der Änderung, negative Vorgaben statt positiver Beispiele und Kontextdateien nah am Code. Weniger Root-Kontext, mehr lokale Präzision.

Kontext, den nur Ihr Team kennt →

05 · Compliance

Compliance & Security: BaFin, AI Act und DSGVO

Drei Stellen, an denen Coding Agents regulatorisch relevant werden: Finanzaufsicht (BaFin/MaRisk), KI-Verordnung (EU AI Act) und Datenschutz (DSGVO). In regulierten Branchen sollten Sie diese Themen früh klären.

Was BaFin und MaRisk für Coding Agents bedeuten

In regulierten Branchen (Banken, Versicherungen, Finanzdienstleister) gibt es zwei Schichten zu beachten. Der Agent selbst ist ein IT-System, das dokumentiert werden muss. Sein Output ist Software, die eigene Prüfungen braucht. Die BaFin-Orientierungshilfe vom Dezember 2025 macht diese Trennung zum ersten Mal aufsichtlich greifbar.

Zwei Schichten, zwei Prüfungen →

Wann die DSGVO bei Coding Agents wirklich greift

Drei Risikoebenen werden in der Praxis vermischt: Datenschutzrecht, Geschäftsgeheimnisschutz, Mitbestimmung. Die Datenschutzkonferenz hat das häufigste Coding-Szenario bereits 2024 eingeordnet. Wo personenbezogene Daten doch fließen, geben vier Architekturentscheidungen den Ausschlag im Termin mit dem Datenschutzbeauftragten. Tools sind nicht DSGVO-konform; Deployments sind es.

Den DPO-Termin vorbereiten →

Urheberrecht und KI-generierter Code: Was Teams absichern müssen

Die BMJ-FAQ vom März 2024 ordnet den rein maschinellen Anteil als regelmäßig nicht urheberrechtlich geschützt ein, keine bindende Rechtsquelle, aber für die Praxis tragfähig. Das eigentliche Risiko liegt zwei Ebenen tiefer: in der unbemerkten Open-Source-Lizenzkette, im Vertragsdach zum Kunden und in der ab Dezember 2026 anwendbaren EU-Produkthaftung. Drei Controls (Lizenz-Scanner in der CI, Prompt-Provenance über den Git-Trailer Assisted-by, Vendor-Indemnification im Beschaffungsvertrag) bringen diese Risiken in gut zweieinhalb Engineering-Tagen und einem Procurement-Zyklus unter Kontrolle.

Drei Controls statt viertem Gutachten →

NIS2 erfasst Coding Agents, ohne sie zu nennen

NIS2 nennt KI-Coding-Agents mit keinem Wort, doch § 30 BSIG erfasst sie über drei Mindestmaßnahmen: Lieferkettensicherheit, sichere Entwicklung und Wartung sowie die Bewertung der Wirksamkeit. Ob ein cloudbasierter Coding-Agent rechtlich ein „Diensteanbieter“ ist, hat bisher niemand entschieden, deshalb gilt die belastbare Linie: risikobasiert wie einen sicherheitsrelevanten Diensteanbieter behandeln. Die Evidenz stützt das, denn je realistischer KI-Code gemessen wird, desto unsicherer fällt er aus. Der Beitrag klärt, wer direkt oder nur mittelbar über die Lieferkette betroffen ist, welche Kontrollen die NIS2-Anforderungen an die sichere Softwareentwicklung mit Agenten knüpfen, und liefert einen 90-Tage-Plan für Entwicklungsteams.

§ 30 BSIG als Prüfmaßstab für Coding Agents →

Die KI-VO ist nicht die DSGVO

Die KI-Verordnung wird in Compliance-Sitzungen regelmäßig mit der DSGVO, der MaRisk und dem BetrVG verwechselt, dabei hat jedes der vier Regelwerke einen anderen Zweck. Für Coding Agents lautet die ruhige Antwort meist: Betreiber eines Systems mit minimalem Risiko. Verbindlich ist heute vor allem Art. 4 (KI-Kompetenz, seit Februar 2025), erfüllbar mit einer kurzen, dokumentierten Einführung. Hochrisiko wird selten der Agent selbst, sondern das nachgelagerte System aus Anhang III, und der Digital Omnibus hat genau diese Fristen auf Ende 2027 und Mitte 2028 verschoben. Der Beitrag trennt Rolle, Risikokategorie und Stichtag und macht aus der gefürchteten Verordnung ein Argument in der Lieferantenprüfung.

Rolle, Risikokategorie, Stichtag trennen →

Den Leitfaden für Ihr Team umsetzen

Dieser Leitfaden gibt die Richtung vor. Wer ihn auf das eigene Team übertragen will, hat zwei Wege: den dreitägigen Intensivkurs für Entwicklerteams oder gezielte Beratung zu Rollout und Compliance.

Zum Intensivkurs Beratung anfragen