Die Maschine, die zu verstehen schien

duotone: Ein verlassener Großrechner mit zwei stillstehenden Magnetband-Spulen in einem dunklen Labor, von Raureif und Eiszapfen überzogen — ein einzelner Monitor zeigt noch eine schwach leuchtende Eingabeaufforderung, während Frost über die Tastatur kriecht: das Bild eines Feldes, das mitten im Triumph einfror

Dies ist Teil 2 einer Serie über die Geschichte der Künstlichen Intelligenz. Teil 1 endete 1956 mit einer Wette: „zwei Monate, zehn Mann” für die Mechanisierung des Denkens. Dieser Teil erzählt, was aus der Wette wurde — der erste vollständige Durchlauf des Musters, das die KI bis heute prägt: Euphorie, Wand, Winter.

1966 schrieb der MIT-Informatiker Joseph Weizenbaum ein Programm von wenigen hundert Zeilen und nannte es ELIZA. Es konnte nichts, was man im strengen Sinn „verstehen” nennen würde. Es zerlegte den eingetippten Satz, suchte nach Reizwörtern und spiegelte sie in Form einer Gegenfrage zurück — eine maschinelle Karikatur des Gesprächsstils, mit dem Rogerianische Psychotherapeuten ihre Klienten reden lassen. „Ich habe Probleme mit meinem Mann” wurde zu „Erzählen Sie mir mehr über Ihren Mann”. Mehr Trick als Therapie, mehr Echo als Einsicht.

Dann passierte etwas, das Weizenbaum für den Rest seines Lebens nicht mehr losließ. Seine eigene Sekretärin, die ihn beim Bau des Programms wochenlang über die Schulter geschaut hatte und also genau wusste, dass dort kein Geist saß, bat ihn nach wenigen Sätzen mit ELIZA, den Raum zu verlassen — sie wollte sich ungestört mit der Maschine unterhalten. Menschen, die ELIZA kannten, schütteten ihr ihr Innerstes aus. Ärzte phantasierten ernsthaft über automatisierte Psychotherapie. Weizenbaum, entsetzt über die Leichtigkeit, mit der ein paar Codezeilen echte Gefühle auslösten, wurde vom KI-Bauer zu einem ihrer schärfsten Kritiker. Was er beobachtet hatte, trägt seitdem einen Namen: den Eliza-Effekt — die menschliche Neigung, einer Maschine Verstehen, Absicht und Empathie zuzuschreiben, sobald ihr Verhalten überzeugend genug aussieht.

Wer Teil 1 dieser Serie gelesen hat, erkennt die Szene wieder. Es ist Vaucansons verdauende Ente, noch einmal — nur dass die Täuschung diesmal nicht davon lebte, dass der Mechanismus verborgen war. Robert-Houdin musste die Ente erst aufschneiden, um den Trick zu entlarven; ELIZAs Trick dagegen lag offen zutage, und die Getäuschte kannte ihn genau — sie erlag ihm trotzdem. Die Maschine schien zu verstehen, so wie die Ente aussah, als verdaue sie. Und genau in dem Jahrzehnt, in dem ELIZA diese Lektion erteilte, verkündeten die Gründerväter der KI, das echte Denken sei nur noch ein paar Jahre entfernt. Beides gehört untrennbar zusammen. Dieser Teil erzählt, wie aus dem Gründungsoptimismus von Dartmouth der erste große Boom wurde — und wie er in den ersten „KI-Winter” kippte.

Die goldenen Jahre

Die Jahre nach 1956 waren von einer Zuversicht getragen, die aus heutiger Sicht atemberaubend wirkt. Newell und Simons Logic Theorist, das in Teil 1 noch auf Karteikarten lief, wuchs sich zu einem ehrgeizigeren Programm aus: dem General Problem Solver, kurz GPS. Der Name war das Programm. Man hatte nicht etwa einen Spezialisten für ein enges Problem gebaut, sondern — so der Anspruch — einen universellen Problemlöser, eine Maschine, die nach demselben Schema Schachzüge, Logikbeweise und Alltagsrätsel knacken sollte. Die Methode war die Suche: das Durchprobieren von Möglichkeiten, gesteuert von Heuristiken, die aussichtslose Pfade früh abschnitten. Intelligenz, so die These der symbolischen Linie, war im Kern Suche im Raum der Möglichkeiten.

Eine Zeitlang schien die These zu halten. In sorgfältig zugeschnittenen Labor-Welten gelangen verblüffende Dinge. Terry Winograds Programm SHRDLU (1970) bewegte in einer simulierten „Klötzchenwelt” virtuelle Bauklötze und führte dabei einen Dialog, der nach echtem Sprachverständnis aussah: „Nimm den roten Würfel und stell ihn auf die grüne Pyramide” — und es tat es, fragte bei Mehrdeutigkeiten nach, erinnerte sich an frühere Anweisungen. Am Stanford Research Institute rollte ab 1966 Shakey durch die Flure, der erste Roboter, der über seine eigenen Handlungen schlussfolgerte, statt sie nur abzuspulen. Jeder dieser Erfolge nährte denselben Gedanken: Wenn das in der Klötzchenwelt geht, ist die echte Welt nur eine Frage der Größe.

Aus dieser Stimmung heraus fielen Sätze, die das Boom-Bust-Muster aus Teil 1 in Reinform zeigen. Herbert Simon sagte 1965 voraus, „machines will be capable, within twenty years, of doing any work that a man can do” — binnen zwanzig Jahren werde es Maschinen geben, die jede Arbeit verrichten, die ein Mensch verrichten kann. Marvin Minsky, die zentrale Figur des MIT-Labors, legte 1967 nach: „Within a generation … the problems of creating ‘artificial intelligence’ will be substantially solved” — eine Generation, dann sei das Problem im Wesentlichen gelöst. 1970 verschärfte er die Frist gegenüber dem Life Magazine auf das Groteske: „In from three to eight years we will have a machine with the general intelligence of an average human being.” Drei bis acht Jahre bis zur menschengleichen Intelligenz. Es ist exakt die Tonlage, die man heute hört, wenn von „AGI in zwei Jahren” die Rede ist — und sie kam, das ist die historische Pointe, schon einmal vom selben Personenkreis, der das Feld begründet hatte.

Die andere Linie blüht: das Perzeptron

Während die symbolische Schule das Rampenlicht hielt, hatte die zweite Linie aus dem Jahr 1943 — die „brain-style”-Tradition der lernenden Netze, die McCarthy 1956 bewusst aus dem Namen „künstliche Intelligenz” hinausdefiniert hatte — ihren eigenen Star. 1958 stellte der Psychologe Frank Rosenblatt am Cornell Aeronautical Laboratory das Perzeptron vor: ein künstliches Netz, das nicht programmiert, sondern trainiert wurde. Man zeigte ihm Beispiele, es passte die Gewichte zwischen seinen Einheiten an, und mit jeder Korrektur klassifizierte es ein wenig besser. Es war die direkte Erfüllung von Turings Idee der „child machine” aus Teil 1: kein fertig eingebautes Wissen, sondern eine Struktur, die durch Erfahrung lernt.

Der Hype war enorm — und er kam diesmal nicht von den Forschern, sondern von der Presse. Als die US-Marine 1958 eine Demonstration finanzierte, berichtete die New York Times, das Perzeptron sei „the embryo of an electronic computer that [the Navy] expects will be able to walk, talk, see, write, reproduce itself and be conscious of its existence” — der Embryo einer Maschine, die gehen, sprechen, sehen, schreiben, sich selbst reproduzieren und sich ihrer Existenz bewusst sein werde. Über ein Gerät, das gerade so Dreiecke von Vierecken unterscheiden konnte. Der Eliza-Effekt hat hier eine journalistische Schwester: Auch eine bescheidene technische Leistung wird, in die richtige Erzählung gegossen, zum Bewusstsein hochgeschrieben. Halten wir den Namen Rosenblatt fest. Seine Linie wird in diesem Teil scheinbar untergehen — und in Teil 4 triumphal zurückkehren.

Der Effekt wird zum Programm: ELIZA

Womit wir zu Weizenbaum zurückkehren, denn ELIZA ist mehr als eine Anekdote — sie ist das Scharnier dieses Teils. Weizenbaum selbst hatte das Programm nicht als Therapie-Werkzeug gemeint, sondern fast als Satire: Er wählte den Psychotherapeuten-Stil gerade deshalb, weil ein Therapeut, der nur zurückspiegelt, am wenigsten Weltwissen braucht. „Erzählen Sie mir mehr davon” funktioniert zu jedem Thema, ohne dass die Maschine irgendetwas vom Thema versteht. ELIZA war als Vorführung der Leere gebaut — und genau deshalb wurde sie zur überzeugendsten Illusion von Fülle.

Daraus zog Weizenbaum in seinem Buch Computer Power and Human Reason (1976) eine Konsequenz, die quer zum Optimismus seiner Kollegen stand: Nicht die Frage, ob Maschinen denken können, sei das Problem, sondern die Bereitwilligkeit, mit der Menschen ihnen Denken unterstellen. Diese Bereitwilligkeit ist kein Fehler einzelner Naiver. Die Informatikerin Katharina Zweig formuliert es sechzig Jahre später so: Der Mensch sei schlicht nicht dafür gebaut, „sprachfähige Automaten von denkenden Menschen zu unterscheiden; darauf hat ihn die Evolution nicht vorbereitet.” Wer flüssig Sprache produziert, gilt uns reflexhaft als verstehend — eine über Jahrhunderttausende verlässliche Heuristik, die erst seit 1966 in die Irre führt.

Die Brücke in die Gegenwart ist hier kürzer als bei jedem anderen Kapitel dieser Serie. Wenn heute Millionen Menschen einem Sprachmodell Trost, Rat und Beziehung abkaufen, dann läuft in ihnen derselbe Mechanismus wie bei Weizenbaums Sekretärin — nur dass die Maschine ungleich besser spiegelt. Zweig schlägt deshalb vor, bei Sprachmodellen nicht von „verstehen” oder „halluzinieren”, sondern von „konfabulieren” zu sprechen und menschelnde Verben mit einer Tilde zu markieren: Das Modell ~versteht, ~lernt, ~antwortet. Der Strich ist die sprachliche Form von Robert-Houdins Skalpell — er hält die Hand ruhig, bevor man staunt. ELIZA hat 1966 bewiesen, dass diese Vorsicht nötig ist, lange bevor es einen Grund zum Staunen gab.

Die Wand

Der Boom hatte einen Konstruktionsfehler, und er war derselbe, der schon im Dartmouth-Antrag steckte: Die spektakulären Erfolge spielten allesamt in Mikrowelten. SHRDLUs Klötzchenwelt enthielt ein paar Dutzend Objekte und eine Handvoll Regeln. In solch geschlossenen Universen ist die Suche, die Newell und Simon zum Wesen der Intelligenz erklärt hatten, beherrschbar. In der offenen Welt ist sie es nicht. Mit jeder zusätzlichen Möglichkeit wächst der Suchraum nicht linear, sondern explosionsartig — das Phänomen, das später kombinatorische Explosion heißen sollte. Was in der Klötzchenwelt elegant aussah, erstickte in der Wirklichkeit an der schieren Zahl der Pfade.

Dahinter lag ein zweites, tieferes Problem: Den Programmen fehlte das Weltwissen, das jeder Mensch beiläufig mitbringt. Dass Wasser nass ist, dass man einen Tisch nicht durch eine Tür schiebt, die schmaler ist als der Tisch, dass „er hob das Glas und trank” bedeutet, dass im Glas etwas Trinkbares war — dieses unermessliche Geflecht aus Selbstverständlichkeiten ließ sich nicht von Hand in Regeln gießen. Genau hier setzte die schärfste Kritik an, und sie kam von einem Philosophen. Hubert Dreyfus hatte 1965 für die RAND Corporation ein Papier mit dem provokanten Titel Alchemy and Artificial Intelligence geschrieben und 1972 zu dem Buch What Computers Can’t Do ausgebaut. Sein Argument, gespeist aus Heidegger und Merleau-Ponty: Menschliche Intelligenz beruht nicht auf der expliziten Manipulation von Symbolen, sondern auf einem leiblichen, unausgesprochenen In-der-Welt-Sein. Das meiste, was wir wissen, wissen wir, ohne es sagen zu können — und was sich nicht in Regeln fassen lässt, lässt sich der symbolischen KI nicht beibringen.

Dreyfus wurde von den KI-Forschern verlacht; man hielt ihm vor, ein Computer habe ihn doch im Schach geschlagen. Aus heutiger Sicht hatte er den Finger auf exakt die Stelle gelegt, an der die symbolische KI scheitern würde — und an der, das ist die Ironie, gerade die andere Linie ihren späteren Sieg holen sollte: Das Deep Learning, das ELIZAs Enkel antreibt, formuliert kein Weltwissen in Regeln, sondern destilliert es statistisch aus Bergen von Beispielen. Dreyfus’ Einwand traf die Symbol-KI ins Mark und ließ die Netze-Linie unberührt. Nur war die Netze-Linie zu diesem Zeitpunkt bereits exekutiert worden — durch ein Buch.

Zwei Dokumente frieren das Feld ein

1969 veröffentlichten Marvin Minsky und Seymour Papert, beide vom MIT, eine mathematisch strenge Analyse mit dem schlichten Titel Perceptrons. Ihr zentrales Resultat: Ein einlagiges Perzeptron, Rosenblatts Modell, kann eine bestimmte simple logische Funktion grundsätzlich nicht lernen — das XOR, das „entweder-oder”. Mathematisch war das korrekt. Die Wirkung des Buches ging jedoch weit über sein Theorem hinaus: Es las sich wie ein Todesurteil über den ganzen Netze-Ansatz. Die Förderung für connectionistische Forschung versiegte fast vollständig; die Linie verschwand für mehr als ein Jahrzehnt aus dem Mainstream. Dass Rosenblatt 1971 bei einem Bootsunfall starb, gab der Episode einen tragischen Schlussakkord.

Hier ist historische Sorgfalt geboten, denn das gängige Narrativ vereinfacht. Minsky und Papert hatten das einlagige Perzeptron widerlegt; mehrlagige Netze können XOR sehr wohl berechnen — es fehlte 1969 nur das Verfahren, sie zu trainieren. Dieses Verfahren, die Backpropagation, existierte in Bruchstücken bereits, wurde aber erst 1986 zum Durchbruch gebracht (Teil 4). Ob Perceptrons die Netz-Forschung wirklich „tötete” oder ob es einer ohnehin auslaufenden Förderung nur den intellektuellen Vorwand lieferte, ist unter Historikern bis heute umstritten. Festhalten lässt sich das Strukturelle: Ein einzelnes, autoritativ vorgetragenes Dokument konnte einen ganzen Forschungsstrang für eine Generation kaltstellen. Wer „erfunden” hat und wer sich durchsetzt, sind — wie schon in Teil 1 — zwei verschiedene Dinge.

Das zweite Dokument traf die symbolische Hauptlinie selbst, und es kam aus Großbritannien. 1973 legte der Physiker James Lighthill dem britischen Science Research Council ein Gutachten über den Stand der KI vor, den Lighthill-Report. Sein Urteil war vernichtend. Lighthill teilte das Feld in drei Kategorien und attestierte der mittleren — der eigentlichen „künstlichen Intelligenz”, die Brücke zwischen Automation und Hirnforschung schlagen wollte — ein durchschlagendes Scheitern. Der Grund: jene kombinatorische Explosion, an der die Mikrowelt-Erfolge sich nicht in die Realität übersetzen ließen. In keinem Bereich, schrieb er, habe die KI die großspurigen Versprechen eingelöst. Der Bericht las sich wie Dreyfus’ Einwand in der nüchternen Sprache eines Gutachters — und er hatte Folgen, weil hinter ihm das Geld stand.

Denn ein Winter entsteht nicht aus enttäuschten Erwartungen allein, sondern dort, wo Enttäuschung auf Förderpolitik trifft. In Großbritannien zog der Lighthill-Report den Stecker für die KI-Forschung an fast allen Universitäten. In den USA verlor die DARPA die Geduld mit den unerfüllten Prognosen; sie strich Anfang der 1970er unter anderem einen mehrjährigen Etat für maschinelles Sprachverstehen — Daniel Crevier, dessen Tumultuous History das erzählerische Rückgrat dieses Teils bildet, beziffert allein diese Kürzung auf rund drei Millionen Dollar im Jahr. Die kühnen Fristen von Simon und Minsky waren verstrichen, ohne eingelöst zu sein; die Geldgeber lasen die Differenz zwischen Versprechen und Ergebnis und froren das Feld ein. Um 1974 war der erste KI-Winter da.

Warum das 2026 zählt

Man kann diesen ersten Zyklus als abgeschlossene Episode lesen, als Kinderkrankheit eines Feldes, das längst erwachsen ist. Das wäre derselbe Fehler wie bei Teil 1. Drei Dinge aus den Jahren 1956–1974 strukturieren die Gegenwart unmittelbar.

Erstens ist das Muster, nicht der Inhalt, die eigentliche Lehre. Der Ablauf — kühne Frist, Förder-Euphorie, verpasste Frist, eingefrorenes Geld — ist kein einmaliger Unfall, sondern eine Mechanik, die sich in den 1980ern ein zweites Mal abspulen wird (Teil 3) und deren dritter Durchlauf möglicherweise gerade jetzt läuft. Simons „zwanzig Jahre” und Minskys „drei bis acht Jahre” reimen sich Wort für Wort auf die „AGI bis 2027”-Ansagen der Gegenwart. Das beweist nicht, dass die heutigen Prognosen falsch sind — aber es verschiebt die Beweislast. Wer „diesmal ist es anders” sagt, sagt etwas, das in diesem Feld noch jedes Mal gesagt wurde, bevor der Frost kam.

Zweitens ist der Eliza-Effekt von 1966 heute keine Laborkuriosität mehr, sondern ein industrieller Faktor. Sprachmodelle sind, anders als ELIZA, tatsächlich nützlich — aber die Lücke zwischen ihrer tatsächlichen Leistung und der zugeschriebenen Innerlichkeit wird mit derselben evolutionären Zwangsläufigkeit gefüllt wie damals. Weizenbaums Sekretärin, die den Mechanismus kannte und trotzdem den Raum verlassen wollte, ist die Urszene jeder heutigen Debatte über KI-Begleiter, KI-Therapie und „einsame Nutzer, die sich verstanden fühlen”. Zweigs Tilde ist die direkte methodische Erbin von Weizenbaums Schreck.

Drittens, und das ist die unbequemste Pointe: Der Winter war kein Ende, sondern eine Pause — und die Linie, die 1969 für tot erklärt wurde, war am Ende die siegreiche. Perceptrons hat die Netze nicht widerlegt, sondern nur eingefroren; sie kehrten zurück und tragen heute die gesamte Branche. Das schärft den Blick auf die Gegenwart in beide Richtungen: Eine Technik, die heute als gescheitert gilt, kann der Kern des nächsten Booms sein — und eine, die heute alles beherrscht, kann an einer Wand stehen, die noch niemand benennen kann. Die symbolische KI sah 1968 unbesiegbar aus. Sechs Jahre später lag sie unter dem Schnee.

Es gehört zur Hygiene jeder nüchternen KI-Lektüre, beide Fehler zu vermeiden: weder die laufende Welle für das Ende der Geschichte zu halten, noch den nächsten Winter für ihr Ende. Die verdauende Ente aus Teil 1 hatte recht behalten — die Frage ist das echt, oder sieht es nur so aus? blieb durch den ganzen ersten Zyklus die richtige. ELIZA war eine Ente, die zuhörte. Das Perzeptron war eine Ente, die laufen lernen sollte. Und die Prognosen von Simon und Minsky waren das Schnattern. Wer den heutigen Boom verstehen will, sollte das Schnattern erkennen — und trotzdem nachsehen, was wirklich im Inneren arbeitet. Denn manchmal, wie bei den Netzen, ist im Inneren doch ein Mechanismus, der eines Tages fliegt.

Im nächsten Teil: Die KI wird Geschäft — und erfriert ein zweites Mal (1980er). Wie Expertensysteme wie MYCIN und XCON aus dem Winter eine Goldgräberstimmung machten, warum „Wissen” plötzlich als der Schlüssel galt, und wie der Markt für LISP-Maschinen so schnell kollabierte, wie er entstanden war — der zweite KI-Winter.

Quellen

Stammquellen der Serie

Nils J. Nilsson: The Quest for Artificial Intelligence. Cambridge University Press, 2010. Wissenschaftliche Gesamtgeschichte; Volltext unter ai.stanford.edu/~nilsson/QAI/qai.pdf.
Daniel Crevier: AI: The Tumultuous History of the Search for Artificial Intelligence. Basic Books, 1993. Die erzählerische Hauptquelle für diesen Teil — Förderpolitik (DARPA, Lighthill), die Gründer-Prognosen und der Mechanismus des ersten Winters. archive.org.

Primärquellen

Joseph Weizenbaum: ELIZA — A Computer Program for the Study of Natural Language Communication Between Man and Machine. In: Communications of the ACM 9 (1966), doi.org/10.1145/365153.365168. Die Sekretärs-Anekdote stammt aus seinem späteren Buch Computer Power and Human Reason (W. H. Freeman, 1976).
Frank Rosenblatt: The Perceptron: A Probabilistic Model for Information Storage and Organization in the Brain. In: Psychological Review 65 (1958), doi.org/10.1037/h0042519.
Marvin Minsky & Seymour Papert: Perceptrons. MIT Press, 1969. Verlagsseite.
James Lighthill: Artificial Intelligence: A General Survey. Science Research Council, 1973. Volltext-Mirror: chilton-computing.org.uk.
Hubert L. Dreyfus: What Computers Can’t Do. Harper & Row, 1972 (rev. What Computers Still Can’t Do, MIT Press, 1992).

Prognose-Zitate (Wortlaut verifiziert): Herbert Simon, The Shape of Automation for Men and Management (Harper & Row, 1965, S. 95 f.; die Passage zuerst 1960 in The New Science of Management Decision). Marvin Minsky, Computation: Finite and Infinite Machines (Prentice-Hall, 1967, Kap. 1) sowie das „drei bis acht Jahre”-Zitat aus Brad Darrachs Life-Reportage über Shakey (1970). Das New-York-Times-Zitat zum Perzeptron stammt aus der Berichterstattung über Rosenblatts Marine-Demonstration vom 7. Juli 1958. Die DARPA-Kürzung („three million dollar a year contract”, 1974) nach Crevier 1993, S. 115 f.

Begriffsklärungen

ELIZA · Eliza-Effekt · Joseph Weizenbaum
Perzeptron · Frank Rosenblatt
SHRDLU · Shakey · General Problem Solver
Lighthill-Report · Hubert Dreyfus · Kombinatorische Explosion
KI-Winter

Die Serie zur Geschichte der KI

Kann eine Maschine denken? Eine Ente, eine Frage, ein Name
Die Maschine, die zu verstehen schien — und der erste Winter — dieser Teil
Als die KI Geld verdiente — und ein zweites Mal erfror
Die Totgesagten kehren zurück — als die KI sehen lernte
Ein Zug, den kein Mensch gespielt hätte — als die KI aufhörte, uns nachzuahmen
Die Zahl, die alle abschrieben — als die KI sprechen lernte und sich verschloss
Die Gegengeschichte hat einen Körper — Strom, Wasser, Land und der Mensch im Schrank
Die Abrechnung — rechnet sich der Geist? Ein Eisenbahnkönig, eine Abschreibung und die Kundschaft, die die Maschine ersetzt

→ Weiter: Als die KI Geld verdiente — und ein zweites Mal erfror

Jochens Blog

Graphansicht

Über

Die Maschine, die zu verstehen schien — und der erste Winter