--- title: Was wirklich passiert, wenn Sie versuchen, KI über die Pilotphase hinaus zu skalieren description: Die meisten Unternehmen bleiben zwischen 'wir haben ChatGPT ausprobiert' und 'KI ist Teil davon, wie wir arbeiten' hängen. So sieht die chaotische Mitte aus – und warum so viele nie hindurchkommen. date: February 5, 2026 author: Robert Soares category: ai-strategy --- Jemand in Ihrem Team hat etwas mit KI gebaut. Vielleicht eine Demo, vielleicht einen Machbarkeitsnachweis, vielleicht einfach nur eine wirklich beeindruckende E-Mail, die die Führungsetage begeistert hat. Und jetzt wollen alle wissen: Können wir das im ganzen Unternehmen? Die kurze Antwort: vielleicht. Die längere Antwort spielt in einer Landschaft voller abgebrochener Pilotprojekte, verbrannter Budgets und „KI-Initiativen“, die still und leise wieder in den normalen Betrieb zurückgefaltet wurden, ohne großes Aufhebens. [MIT-Studie 2025](https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/) fand, dass 95 % der generativen KI-Pilotprojekte in Unternehmen keine messbaren finanziellen Erträge liefern. Nicht „bleibt hinter den Erwartungen zurück“. Sondern: liefert überhaupt nichts Messbares. Diese Zahl sollte kurz wirken, weil sie die nervöse Stimmung rund um KI-Einführung im Unternehmen gerade erklärt. Alle fahren Pilotprojekte. Fast niemand fährt Produktivbetrieb. ## Der Raum zwischen Demo und Standard Es gibt eine bestimmte Zone, in der KI-Initiativen sterben. Sie beginnt nach der aufregenden Pilotphase, in der ein kleines Team beweist, dass etwas funktioniert, aber bevor das Werkzeug so in die Arbeit eingebaut ist, dass Menschen ihre Jobs tatsächlich damit erledigen. In Beratungskreisen hat dieser Zwischenraum sogar einen Namen: *pilot purgatory*. Das Pilotprojekt funktioniert. Es funktioniert sogar wunderschön. Jemand im Marketing schreibt drei Monate Social-Media-Beiträge an einem Nachmittag. Der Vertrieb erzeugt personalisierte Kontaktaufnahme, die tatsächlich personalisiert klingt. Die Rechtsabteilung halbiert die Zeit für Vertragsprüfungen. Dann kommt die Realität. Die Person, die den Piloten vorangetrieben hat, wird auf ein anderes Projekt gezogen. Das Werkzeug braucht eine Sicherheitsprüfung, bevor es an Kundendaten darf. Der IT fehlt das Budget, um es in bestehende Systeme zu integrieren. Die Menschen, die nicht im Piloten waren, wissen nicht, wie man es nutzt, und haben keine Zeit, es zu lernen. Führungskräfte der mittleren Ebene sind skeptisch, weil Erfolg bedeuten könnte, dass ihr Team schrumpft. Sechs Monate später fragt jemand, was eigentlich aus diesem KI-Ding geworden ist, und niemand hat eine gute Antwort. ## Warum der Sprung zählt Was sich ändert, wenn Sie vom Pilotprojekt in den Produktivbetrieb gehen: alles. Ein Pilotprojekt besteht aus einer Handvoll motivierter Menschen, die freiwillig etwas Neues ausprobieren. Skalieren heißt, alle anderen mitzunehmen: auch die, die sich nicht gemeldet haben, die Skeptischen, die Überlasteten und die, die insgeheim Angst haben. Pilotprojekte laufen außerhalb der normalen Prozesse. Produktivbetrieb heißt Integration in das verknotete System aus Freigaben, Übergaben und Abläufen, das Ihr Unternehmen über Jahrzehnte angesammelt hat. Pilotprojekte tolerieren Unschärfe, weil sie Experimente sind. Produktivbetrieb verlangt Verlässlichkeit, weil echte Arbeit daran hängt. Der mentale Wechsel ist drastisch. Ein Hacker-News-Kommentator brachte es direkt auf den Punkt: "Almost all of the Enterprise/Corporate AI offerings are a significant step in cost that needs to bear actual fruit in order to be worthwhile, not to mention the compliance and security requirements most places have in order to get these things approved." Dieser Freigabeprozess ist der Moment, in dem Begeisterung auf Bürokratie trifft – und Bürokratie gewinnt oft durch Zermürbung. ## Das Budget-Paradox Unternehmen stecken ihr KI-Geld erstaunlich zuverlässig in die falschen Stellen. [Die MIT-Studie](https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/) fand, dass mehr als die Hälfte der Budgets für generative KI in Werkzeuge für Vertrieb und Marketing fließt – während der größte Return on Investment bei der Automatisierung interner Verwaltungsarbeit entsteht. Alle wollen die glänzenden Anwendungen für Kundinnen und Kunden. Das langweilige Betriebszeug ist der Ort, an dem der eigentliche Wert lebt. Diese Schieflage erzeugt einen vorhersehbaren Kreislauf. Sie finanzieren den aufregenden Anwendungsfall. Der entpuppt sich als härter als gedacht, weil KI im Kundenkontakt perfekt sein muss und Kundinnen und Kunden unberechenbar sind. Gleichzeitig gleicht die Buchhaltung weiter Rechnungen von Hand ab, weil niemand Budget für diesen Ablauf eingeplant hat. Johnson & Johnson hat über drei Jahre 900 generative KI-Projekte durchgeführt, nachdem Mitarbeitende frei experimentieren sollten. Sie stellten fest, dass [just 10-15 % of those use cases delivered 80 % of the value](https://www.deeplearning.ai/the-batch/johnson-johnson-reveals-its-revised-ai-strategy/). Das Unternehmen bündelt die Ressourcen jetzt auf Projekte mit hoher Wirkung und streicht den Rest. Drei Jahre und 900 Experimente, um zu lernen, welche Wetten tatsächlich auszahlen. Die meisten Unternehmen werden keine 900 Experimente fahren. Sie machen fünf oder zehn, wählen danach, was am spannendsten klingt statt nach dem, was am wertvollsten ist, und wundern sich über enttäuschende Ergebnisse. ## Schatten-KI passiert längst Während Ihre offizielle KI-Initiative sich durch Einkauf und Sicherheitsprüfung windet, nutzen Ihre Mitarbeitenden KI längst. Nur eben so, dass Sie es nicht sehen oder steuern können. Die Daten sind hier auffällig. [Cyberhavens Untersuchung](https://www.cyberhaven.com/blog/shadow-ai-how-employees-are-leading-the-charge-in-ai-adoption-and-putting-company-data-at-risk) fand, dass 73,8 % der ChatGPT-Konten, die am Arbeitsplatz genutzt werden, private Konten ohne Sicherheitskontrollen auf Unternehmensebene sind. Bei Googles Gemini sind es 94,4 %. Bei Bard 95,9 %. Ihre Mitarbeitenden warten nicht auf Sie. Sie kopieren Kundendaten in KI-Werkzeuge für Verbraucherinnen und Verbraucher, um schneller fertig zu werden. Sie nutzen private Konten, weil das Unternehmen keine freigegebenen Alternativen bereitgestellt hat. 27,4 % der Unternehmensdaten, die Mitarbeitende an KI-Werkzeuge senden, sind inzwischen als sensibel klassifiziert – gegenüber 10,7 % ein Jahr zuvor. Das erzeugt eine seltsame Situation: Der formale Skalierungsversuch bewegt sich langsam durch Regelkonformität und Freigaben, während unkontrollierte KI-Nutzung im Schatten schnell wächst. Wenn der offizielle Rollout endlich kommt, haben sich Gewohnheiten um nicht freigegebene Werkzeuge längst gebildet. Sie führen KI nicht ein – Sie bitten Menschen, auf eine andere Version umzusteigen. Kluge Unternehmen suchen diese Schattennutzerinnen und -nutzer und lernen von ihnen, statt sie zu bestrafen. Welche Probleme lösen sie? Und was sagt Ihnen das darüber, wo KI tatsächlich hilft? ## Die Rechnung mit den Menschen KI zu skalieren heißt, von begeisterten Frühstarterinnen und Frühstartern zur skeptischen Mehrheit zu kommen. Das ist eine andere Aufgabe. [BCG-Studie](https://www.bcg.com/publications/2025/ai-at-work-momentum-builds-but-gaps-remain) fand, dass mehr als drei Viertel der Führungskräfte und Managerinnen und Manager sagen, sie nutzten generative KI mehrmals pro Woche – aber die regelmäßige Nutzung bei Mitarbeitenden an der Front ist bei 51 % stecken geblieben. Die Lücke ist nicht Zugriff. Die meisten Unternehmen haben Werkzeuge bereitgestellt. Die Lücke ist Nutzung. Die Menschen, die mit KI-Einführung am meisten kämpfen, sind nicht die, die Sie erwarten. Erfahrene Beschäftigte mit tiefem Fachwissen wehren sich manchmal, weil KI den Wert von Wissen bedroht, das sie über Jahrzehnte aufgebaut haben. Die Analystin, die immer wusste, wo die Daten liegen, sieht plötzlich, wie ein Junior per Eingabeaufforderung zu ähnlichen Antworten kommt. Das ist verstörend – und zwar auf eine Art, die über Produktivität hinausgeht. Andere Widerstände sind simpler. Menschen sind beschäftigt. Ein neues Werkzeug zu lernen kostet Zeit. Die Auszahlung ist nicht offensichtlich. Die Folgen von Fehlern fühlen sich hoch an. Abzuwarten, ob dieses Ding bleibt, wirkt vernünftig, wenn die letzten drei Technologie-Initiativen kamen und gingen. Ein Muster, das funktioniert, ist ein internes Champion-Netzwerk. Novartis, Adobe und HSBC haben Programme aufgebaut, in denen freiwillige Mitarbeitende neue Werkzeuge testen, Anwendungsfälle teilen und Kolleginnen und Kollegen begleiten. Der Champion ist nicht IT oder Führung, die Ansagen macht. Es ist eine Kollegin, die zeigt, wie sie es selbst nutzt. Dieser Einfluss unter Gleichgestellten ist am Ende wichtiger als Pflichtvorgaben. ## Wenn KI wirklich liefert Erfolgsgeschichten gibt es. Lumen Technologies berichtet, dass Copilot [dem Vertrieb im Schnitt vier Stunden pro Woche spart](https://news.microsoft.com/source/features/digital-transformation/the-only-way-how-copilot-is-helping-propel-an-evolution-at-lumen-technologies/), was $50 Millionen pro Jahr entspricht. Aufgaben, die vier Stunden dauerten, dauern jetzt fünfzehn Minuten. Was Lumen daran bemerkenswert macht, ist nicht die Technik. Es ist, dass sie Copilot über Abteilungen und Funktionen ausgerollt haben, statt es für immer im Piloten eines Teams einzusperren. Das Werkzeug wurde Teil davon, wie Arbeit passiert – nicht ein optionales Experiment. Das Gesundheitswesen liefert ein weiteres Beispiel. Wie eine Person [auf Hacker News beschrieb](https://news.ycombinator.com/item?id=46109534): "I'm in the process of deploying several AI solutions in Healthcare. We have a process a nurse usually spends about an hour on, and costs $40-$70 depending on if they are offshore and a few other factors. Our AI can match it at a few dollars often less." Sie merkten an, dass KI in Tests häufig Probleme fand, die Pflegekräfte übersahen, während Pflegekräfte selten Probleme fanden, die die KI übersehen hatte. Der gemeinsame Nenner in Erfolgsgeschichten ist nicht geniale KI-Strategie. Es ist hartnäckige Umsetzung der langweiligen Grundlagen: klare Anwendungsfälle, die an messbare Ergebnisse gebunden sind, Integration in bestehende Abläufe, Schulungen, die Menschen wirklich in die Lage versetzen, die Werkzeuge zu nutzen, und Führung, die nach der Ankündigung nicht aussteigt. ## Das Integrationsproblem, über das niemand spricht Die meisten KI-Werkzeuge funktionieren nicht isoliert. Sie funktionieren, indem sie sich mit Ihren Daten verbinden. Das klingt simpel, bis Ihnen klar wird, dass Ihre Daten in siebzehn unterschiedlichen Systemen liegen, die nicht miteinander sprechen – und dass bei der Hälfte davon die Zuständigkeit unklar ist und die Eigenheiten nirgends dokumentiert sind, außer im Kopf der Person, die vor zwei Jahren gegangen ist. Allgemeine KI-Werkzeuge wie ChatGPT sind für Einzelpersonen großartig, weil sie mit allem arbeiten, was Sie hineinkopieren. In Unternehmen tun sie sich schwer, weil ihnen Kontext fehlt. Die KI kennt Ihre Kundenhistorie nicht, Ihren Produktkatalog nicht, Ihre interne Terminologie nicht und Ihre spezifischen Prozesse nicht. Ohne diesen Kontext müssen die Ergebnisse stark nachbearbeitet werden. [MIT-Studie](https://fortune.com/2025/08/18/mit-report-95-percent-generative-ai-pilots-at-companies-failing-cfo/) verweist auf diese „Lernlücke“ („learning gap“) als Kerngrund, warum Pilotprojekte nicht skalieren. Das Problem ist nicht Modellqualität. Das Problem ist, dass allgemeine Werkzeuge sich nicht an Unternehmensabläufe anpassen. Eingekaufte KI-Lösungen von spezialisierten Anbietern sind in etwa 67 % der Fälle erfolgreich, während intern gebaute Systeme nur etwa ein Drittel so oft erfolgreich sind. Der Vorteil der Anbieter kommt auch daher, dass sie Integrationsprobleme schon einmal gelöst haben. ## Bauen oder kaufen Die Entscheidung „bauen oder kaufen“ hat bei KI höhere Einsätze als bei normaler Software. Selbst bauen gibt Ihnen Kontrolle und Anpassbarkeit, verlangt aber Fähigkeiten, die die meisten Unternehmen nicht haben. Sie brauchen Menschen, die KI-Grenzen verstehen, zuverlässige Systeme bauen können und sie pflegen können, während sich Modelle weiterentwickeln. Die Technik ändert sich schneller als klassische Software – was Sie heute bauen, kann in achtzehn Monaten eine größere Überarbeitung brauchen. Kaufen heißt: schneller ausrollen, weniger Anpassung und eine dauerhafte Abhängigkeit vom Anbieter. Sie sind eingeschränkt durch das, was das Produkt gut kann – und das passt möglicherweise nicht zu Ihren konkreten Abläufen. Die MIT-Daten zeigen, dass Kaufen für Organisationen ohne tiefes KI-Know-how häufiger funktioniert als Selbstbau. Aber Kaufen schafft neue Probleme, wenn Anbieter die Produktstrategie ändern, Preise erhöhen oder vom Markt verschwinden. Abhängigkeit von einem einzigen Anbieter für kritische Abläufe bringt ein Risiko ins Haus, das vorher nicht da war. Manche Organisationen versuchen hybride Ansätze: die Kernfähigkeit bei Anbietern einkaufen, aber eigene Integrationsschichten bauen. Das kann Vorteile beider Seiten einfangen – kombiniert aber auch die Hürden beider Seiten. Sie brauchen gutes Lieferantenmanagement und interne technische Kompetenz. ## Womit die mittlere Führungsebene wirklich zu tun hat Die Vorstandspräsentation beschreibt KI-Transformation in glatten Phasen. Bewerten, pilotieren, skalieren, optimieren. Saubere Pfeile nach rechts. Messbare Ziele in jeder Stufe. Die Realität in der mittleren Führungsebene ist unordentlicher. Von ihnen wird erwartet, dieselben Ziele zu erreichen, während ihr Team neue Werkzeuge lernt. Schulungszeit geht von Produktivzeit ab. Frühe Fehler erzeugen Nacharbeit. Manche passen sich schnell an, andere kämpfen, und das erzeugt Spannung. Die Werkzeuge helfen bei manchen Aufgaben, aber nicht bei anderen – also werden Abläufe zu Flickwerk. Von oben hören sie, KI-Nutzung sei Priorität. Von unten hören sie, die Werkzeuge seien unzuverlässig oder niemand habe Zeit. Sie versuchen, eine realistische Mitte zu finden, während Kennzahlen sofortige Verbesserung erwarten. Oft entscheidet die mittlere Führungsebene darüber, ob KI wirklich Wurzeln schlägt. Sie entscheidet, ob Nutzung eingefordert wird, wie mit Widerstand umgegangen wird und ob Menschen, die sich schwer tun, Unterstützung bekommen oder Druck. Rückhalt von oben ist wichtig für Ressourcen – aber die mittlere Führungsebene bestimmt den Alltag. ## Die 95 % und die 5 % Wenn 95 % der Pilotprojekte keine messbaren Erträge liefern, was machen die 5 % anders? Sie sind nicht besser in KI. Sie sind besser in Veränderung im Unternehmen. Die 5 % starten mit klar definierten Problemen und koppeln KI direkt an messbare Ergebnisse: nicht „Effizienz verbessern“, sondern „Vertragsprüfung von 4 Stunden auf 1 Stunde senken“. Diese Genauigkeit sagt ihnen, ob es funktioniert. Sie legen die operative Verantwortung bei den Menschen, die den Abläufen am nächsten sind – nicht bei Innovationsteams, die parallel zur echten Arbeit laufen. Die Menschen, die den Job machen, werden zu den Menschen, die formen, wie KI den Job unterstützt. Sie investieren überproportional in Menschen und Prozesse. Die Aufteilung, die in Forschung immer wieder auftaucht, ist grob 10 % Algorithmen, 20 % Infrastruktur, 70 % Menschen und Prozesse. Die meisten Organisationen drehen dieses Verhältnis um, geben viel für Technik aus und nehmen an, Nutzung folgt schon. Sie bauen Steuerung von Anfang an in den Plan ein, nicht als Nachtrag, wenn Probleme auftauchen. Prüfpfade, klare Kennzahlen, definierte Überprüfungsprozesse. Das klingt bürokratisch, ist aber genau das, was Skalierung ermöglicht – weil so skeptische Anspruchsgruppen überzeugt werden, Zugang auszuweiten. ## Wie dauerhafte Nutzung aussieht Es gibt einen Unterschied zwischen KI zu starten und KI zu verankern. Start ist die Ankündigung, die Schulungen, der erste Nutzungspeak. Verankert ist, wenn Menschen ganz selbstverständlich zu KI-Werkzeugen greifen, wenn neue Mitarbeitende vom ersten Tag an in KI-gestützten Abläufen geschult werden, wenn die Frage von „sollte ich dafür KI nutzen?“ zu „wie nutze ich KI dafür am besten?“ wird. Dorthin zu kommen dauert länger, als der Projektplan suggeriert. Zuerst brauchen Sie genug Menschen, die Werkzeuge regelmäßig nutzen, damit Nutzung sichtbar wird und normal wirkt. Dann brauchen Sie Abläufe, die KI dokumentiert und wiederholbar einbauen, statt nur individuelles Ausprobieren. Und schließlich muss KI Teil der Leistungserwartungen werden – nicht als Überwachung, sondern als vorausgesetzte Fähigkeit. Die meisten Organisationen sind noch in der Experimentierphase. [BCG fand](https://www.bcg.com/publications/2025/ai-at-work-momentum-builds-but-gaps-remain) heraus, dass mehr als 85 % der Beschäftigten in frühen Stadien der KI-Nutzung bleiben, während weniger als 10 % den Punkt erreicht haben, an dem KI in ihre Kernarbeit integriert ist. Der Weg vom ersten Piloten zur organisatorischen Fähigkeit dauert Jahre, nicht Quartale. ## Ehrliche Fragen, die Sie stellen sollten Bevor Sie planen, KI zu skalieren, stellen Sie diese Fragen ohne optimistische Antworten: Welches Problem lösen wir, das wir vor KI nicht lösen konnten, und woran merken wir, dass wir es gelöst haben? Wenn Sie darauf keine konkrete Antwort haben, fehlt Ihrer Skalierung ein klarer Kurs. Wer besitzt das, nachdem das Projektteam auseinandergeht? Initiativen ohne dauerhafte Zuständigkeit fallen in den alten Zustand zurück. Was passiert, wenn die KI einen Fehler macht, der eine Kundin oder einen Kunden betrifft? Wenn Sie das nicht wissen, sind Sie nicht produktionsreif. Welche Teile unseres Unternehmens sind dafür bereit – und welche nicht? Dort zu starten, wo die Bedingungen Erfolg begünstigen, schlägt den Versuch, überall gleichzeitig zu transformieren. Haben wir den Rückhalt der mittleren Führungsebene, um durch die unangenehmen Monate zu kommen, in denen Nutzung hinterherhinkt und Ergebnisse unklar sind? Rückhalt von oben allein reicht nicht. Was würde uns dazu bringen, diese Initiative zu stoppen – und woran würden wir merken, dass wir diesen Punkt erreicht haben? Klare Abbruchkriterien helfen, das Zombie-Projekt zu vermeiden, das nie offiziell stirbt, aber auch nie wirklich lebt. ## Die längere Perspektive KI-Einführung im Unternehmen ist kein Projekt mit Enddatum. Es ist eine Fähigkeit, die sich weiterentwickelt. Die Modelle werden besser. Was letztes Jahr noch nicht möglich war, ist dieses Jahr Routine. Organisationen, die Lernmechanismen in ihren Ansatz einbauen, können Verbesserungen mitnehmen, sobald sie auftauchen. Organisationen, die KI als einmaligen Rollout behandelt haben, sehen ihre Fähigkeiten altern. Das regulatorische Umfeld verschiebt sich ständig. Was heute akzeptabel ist, wenn KI Kundendaten verarbeitet, kann morgen nicht mehr akzeptabel sein. Regelkonformität ins Fundament zu bauen schlägt nachträgliches Nachrüsten, wenn Regeln sich ändern. Die Wettbewerbslage bewegt sich. In manchen Branchen wird KI-Fähigkeit zur Grundvoraussetzung: Wer sie nicht hat, fällt bei Kosten oder Geschwindigkeit zurück. Andere Branchen bewegen sich langsamer. Zu wissen, wo Ihre Branche steht, hilft, Dringlichkeit richtig zu kalibrieren. Die Menschen in Ihrem Unternehmen lernen. Erste Skeptikerinnen und Skeptiker werden manchmal zu den wertvollsten KI-Nutzenden, weil sie Grenzen stresstesten. Frühstarterinnen und Frühstarter brennen manchmal aus, weil sie zu viel tragen. Die Geschichte der Menschen entwickelt sich zusammen mit der Geschichte der Technik. KI im Unternehmen zu skalieren ist weniger wie Software zu installieren und mehr wie Kultur zu bauen. Kulturen brauchen Zeit. Sie haben Rückschläge. Sie wehren sich gegen formale Initiativen und reagieren auf informelle Normen. Sie brauchen anhaltende Aufmerksamkeit statt konzentrierter Kraftanstrengung. Die Unternehmen, die damit Erfolg haben, werden meist die sein, die es als fortlaufende Arbeit behandelt haben – nicht als Transformationsprojekt mit Abnahmedatum. Sie lernen weiter, passen weiter an und finden weiter neue Stellen, an denen KI hilft. Das ist weniger aufregend als die Vision einer großen Transformation. Aber es ist näher an dem, was die 5 % tatsächlich tun. Was die Pilotprojekte trennt, die skalieren, von denen, die es nicht tun, ist am Ende vielleicht Geduld. Geduld, Integrationsprobleme durchzuarbeiten, statt sie zu Blockern zu erklären. Geduld, Menschen zu unterstützen, die sich schwer tun, statt sie zu ersetzen. Geduld, Ergebnisse über Quartale zu messen statt über Wochen. Geduld, weiter zu investieren, wenn frühe Erträge enttäuschen. Nicht die Geduld des passiven Wartens. Die Geduld der anhaltenden Anstrengung. Das ist eine schwerere Ressource zuzuweisen als Budget.