Lektionen aus Systemen im Produktivbetrieb.
Immergrüne Notizen, kein Feed. Jeder Beitrag stammt aus einem System, das ich tatsächlich gebaut und ausgeliefert habe, und verweist zurück auf die Fallstudie als praktisches Beispiel. Der rote Faden: Produktive KI braucht die Verlässlichkeits-Strenge, die sicherheitskritische Entwicklung mitbringt.
Wie ich KI-Systeme bewerte
Der Schlagzeilen-Benchmark eines Modells ist nicht sein Wert. Entscheidend ist, ob seine Ausgabe den Kontakt mit dem Rest des Systems übersteht — Struktur, Kosten und die Nacharbeit, die sie stromabwärts erzwingt.
Wo man das Modell nicht aufruft
Mit einem echten Budget ist die wirkungsvollste Entscheidung in einem KI-System oft, das Modell gar nicht aufzurufen. Die Kosten folgen der Arbeit, die man ihm zuleitet — also leiten Sie nur das zu, was es wirklich braucht.
Sicherheitskritische Strenge in produktiver KI
Die Disziplin, die ein reguliertes System sicher hält — deterministische Entscheidungen, Validierung an jeder Grenze, fail-safe Voreinstellungen, ein Mensch in der Schleife für unumkehrbare Aktionen — ist genau das, was produktive LLM-Systeme brauchen.
Agentische Workflows debuggbar halten
Wenn ein LLM Aktionen ausführen kann, ist das Schwierige nicht mehr die Fähigkeit — es sind Beobachtbarkeit und begrenzte Autonomie. (In Vorbereitung.)