5 Lehren aus 12 Monaten KI-Workflows

Warum eine Retrospektive

Vor etwas mehr als einem Jahr habe ich angefangen, AI-Tools nicht mehr nur zu testen, sondern wirklich produktiv in meinen Engineering-Alltag zu integrieren. Heute kann ich diese Vermutung bestätigen — mit einer wichtigen Einschränkung: Es hängt fast ausschließlich davon ab, wie man die Werkzeuge nutzt. Nicht davon, welches gerade als Top-Tool gilt.

Diese Retrospektive ist ein Versuch, die wichtigsten Erkenntnisse aus zwölf Monaten in fünf Lehren zu bündeln. Die Lehren sind nicht spektakulär. Sie sind das Ergebnis von echten Versuchen, echten Fehlern und echten Anpassungen.

Lehre 1: Der Workflow ist wichtiger als das Modell

Die häufigste Diskussion in der KI-Engineering-Welt dreht sich um Modelle. Welches ist gerade vorne, welches hat den größten Kontext, welches ist am günstigsten. Diese Diskussionen sind interessant, aber im Alltag sehr nachrangig.

Was wirklich zählt, ist der Workflow drum herum. Welche Skills sind definiert. Wie sind Subagents strukturiert. Wo greifen MCP-Server. Wie ist die Fallback-Kette aufgebaut. All das hat zusammen einen viel größeren Effekt auf die Produktivität als die Wahl zwischen Modell A und Modell B.

Konsequenz: Investiere in Skills, Prompt-Vorlagen, Tool-Anbindungen, Review-Strukturen — nicht in Modell-Vergleiche.

Lehre 2: Robustheit ist Pflicht, nicht Luxus

Eine der unangenehmsten Erkenntnisse: KI-Workflows können still versagen. Klassische Pipelines sind laut, wenn sie kaputt gehen. KI-Pipelines sind oft leise. Bei mir hat das zu einem mehrwöchigen stillen Ausfall geführt — der Workflow lief technisch, klassifizierte aber praktisch nichts mehr.

Vier Schichten die ich heute immer einbaue:

Fallback-Ketten: Mehr als ein Provider, mehr als ein Modell
Strukturierte Logs: Was gerade passiert, welche Stufe aktiv ist
Smart-Alerts: Workflow ohne Erfolg seit X Stunden → Alarm
Regelbasierter Fallback: Wenn alle KI-Stufen ausfallen, nicht Stillstand

Lehre 3: Persistentes Memory ist der echte Multiplikator

Workflows ohne persistentes Memory sind Wegwerf-Workflows. Nicht weil sie nicht funktionieren, sondern weil sie nicht klüger werden. Die ersten sechs Monate ohne Memory waren weitgehend Wegwerf-Sessions.

Heute lesen meine wichtigsten Workflows beim Session-Start eine Memory-Datei: bekannte Eigenheiten von Systemen, persönliche Präferenzen, Lessons Learned. Der Effekt ist groß — der Agent versteht den Kontext besser, macht weniger Anfängerfehler.

Lehre 4: Sicherheit von Anfang an

KI-Workflows haben ein eigenes Sicherheits-Profil. Vier alltägliche Risiken:

Daten-Lecks: Screenshots mit internen URLs, Logs mit Tokens ungefiltert weitergegeben
Tool-Berechtigungen: Minimale Berechtigung pro Aufgabe — was nicht gebraucht wird, ist nicht zugänglich
Provider-Datenschutz: Was man an externe Anbieter schickt, geht dorthin
Action-Grenzen: Was darf der Agent automatisch, was braucht menschliche Bestätigung

Lehre 5: Team-Fähigkeit ist der entscheidende Schritt

KI-Tools, die nur für Einzel-Engineers funktionieren, haben eine begrenzte Zukunft. Was mein Setup braucht, damit es team-fähig wird: geteilte Skills, geteilte MCPs, klare Tool-Vorgaben, dokumentierte Konventionen, erwartete Verifikation.

Team-Fähigkeit ist aus meiner Sicht der nächste große Schritt für KI-gestützte Engineering-Arbeit. Persönliche Workflows sind weitgehend ausgereift.

Mein Blick nach diesem Jahr

KI-gestützte Engineering-Arbeit ist 2026 an einem Punkt, an dem sie real produktiv ist — vorausgesetzt man baut sie ernsthaft auf. Was sich über das Jahr nicht verändert hat: KI ersetzt keine Verantwortung. Sie nimmt einem weder Architektur-Entscheidungen noch fachliche Einordnung ab.

Was sich sehr verändert hat: die Geschwindigkeit, mit der gute technische Arbeit möglich wird, wenn das Setup stimmt. Gute Engineers, die strukturiert arbeiten, können mehr erreichen als je zuvor.