Kann eine Maschine denken? Eine Ente, eine Frage, ein Name

duotone: Vaucansons vergoldete mechanische Ente von 1738, seitlich geöffnet, gibt im Inneren ein filigranes Uhrwerk aus Messingzahnrädern und eine verborgene Kammer frei — der Mechanismus hinter der Illusion des Lebendigen

Dies ist Teil 1 einer Serie über die Geschichte der Künstlichen Intelligenz. Leitfrage: Wie wurde aus einer Sommerkonferenz von 1956 die Technologie, die 2026 alles für sich beansprucht? Die Antwort fängt nicht mit ChatGPT an, sondern mit einer Ente.

1738 stellte der französische Mechaniker Jacques de Vaucanson in Paris eine vergoldete Ente aus Kupfer aus. Sie schlug mit den Flügeln, streckte den Hals, schnatterte, pickte Getreidekörner aus der offenen Hand — und verdaute sie. Wenige Sekunden nach dem Fressen entließ das Tier am hinteren Ende eine Masse, die das Publikum als Beweis nahm: Diese Maschine besaß einen funktionierenden Verdauungsapparat. Vaucansons Canard Digérateur, die „verdauende Ente”, war die Sensation der europäischen Aufklärung, ein mechanisches Wunder, das die Grenze zwischen Automat und Lebewesen einzureißen schien.

Sie riss gar nichts ein. Gut hundert Jahre später, 1844, zerlegte der Uhrmacher und Bühnenmagier Jean-Eugène Robert-Houdin ein noch erhaltenes Exemplar und fand heraus, was alle übersehen hatten: Die Ente verdaute nicht. Das gefressene Korn verschwand in einer Kammer; die „Ausscheidung” war ein vorab eingefülltes Präparat, in den Worten der späteren Beschreibung „a sort of gruel composed of green-coloured bread crumb”. Zwei getrennte Behälter, ein guter Mechanismus, kein Stoffwechsel. Die Ente sah aus, als verdaue sie. Mehr nicht.

Wer heute mit einem Sprachmodell chattet und das Gefühl bekommt, verstanden zu werden, sitzt im selben Pariser Salon. Die Frage, die Vaucansons Publikum nicht stellte und Robert-Houdin beantwortete — ist das echt, oder ist das eine überzeugend gebaute Illusion? — ist nicht neu. Sie ist die älteste Frage des Feldes, das wir heute Künstliche Intelligenz nennen. Und dieses Feld hat ein erstaunlich präzises Geburtsdatum dafür, wann die Frage endlich einen Namen bekam.

Diese Serie versucht, eine Sache zu tun, die im deutschsprachigen Raum selten passiert: die Entwicklung der KI historisch zu erschließen, statt sie zu bejubeln oder zu verdammen. Der hiesige Diskurs kennt im Wesentlichen zwei Register — das atemlose „KI verändert alles” und den reinen Doom. Beide haben kein Gedächtnis. Wer dagegen den Bogen von 1943 bis 2026 spannt, sieht etwas anderes: ein Feld, das in Zyklen läuft, das mindestens zweimal fast für tot erklärt wurde, das seit dem ersten Tag zwischen zwei rivalisierenden Ideen von „Denken” gespalten ist — und das jedes Mal, wenn es boomt, behauptet, diesmal sei alles anders. Teil 1 setzt vor dem Boom an: bei der Frage, dem Namen und den paar Jahren, in denen aus einer philosophischen Provokation ein wissenschaftliches Programm wurde.

Denken als Rechnen — die lange Vorgeschichte

Die Idee, dass Denken im Grunde Rechnen ist, dass sich Schlussfolgern in mechanische Schritte zerlegen lässt, ist keine Erfindung des 20. Jahrhunderts. Aristoteles formalisierte mit dem Syllogismus das gültige Schließen zu einem regelhaften Verfahren. Leibniz träumte im 17. Jahrhundert von einem calculus ratiocinator, einer Sprache, in der sich Streitfragen nicht durch Rhetorik, sondern durch Rechnung entscheiden lassen — „lasst uns rechnen”, calculemus, war seine Parole. 1854 zeigte George Boole in The Laws of Thought, dass logische Aussagen sich algebraisch behandeln lassen: Wahr und Falsch als 1 und 0, Denken als Schaltung. Der KI-Pionier Nils Nilsson, dessen Gesamtgeschichte des Feldes das Rückgrat dieser Serie bildet, fasst es lakonisch: „The quest for artificial intelligence begins with dreams — as all quests do.”

Im 20. Jahrhundert laufen drei Stränge zusammen, die diesen Traum erstmals baubar machen. Der erste ist theoretisch: 1936 definiert Alan Turing die nach ihm benannte abstrakte Maschine und beweist, dass ein einziger, hinreichend allgemeiner Mechanismus jede berechenbare Aufgabe lösen kann — die mathematische Keimzelle des Universalrechners. Der zweite ist technisch: Claude Shannon zeigt 1937, dass sich Booles Logik mit elektrischen Relais realisieren lässt; Konrad Zuse baut 1941 mit der Z3 den ersten funktionsfähigen programmgesteuerten Rechner. Der dritte Strang ist der entscheidende für unsere Geschichte — und er kommt nicht aus der Mathematik, sondern aus der Biologie.

1943: Das Neuron wird zur Logik

1943 veröffentlichen der Neurophysiologe Warren McCulloch und der Logiker Walter Pitts einen Aufsatz mit dem sperrigen Titel A Logical Calculus of the Ideas Immanent in Nervous Activity. Ihre These ist radikal und folgenreich: Ein Nervenzelle lässt sich als simple logische Einheit modellieren. Sie summiert Eingänge, und wenn ein Schwellenwert überschritten wird, feuert sie — oder eben nicht. An oder aus, 1 oder 0. Aus solchen künstlichen Neuronen, so McCulloch und Pitts, lassen sich Netze bauen, die im Prinzip jede logische Funktion berechnen können. Das Gehirn, so die kühne Implikation, ist eine Rechenmaschine aus Fleisch.

Damit ist 1943 etwas geschehen, das die nächsten achtzig Jahre prägen wird: Es entstehen zwei Ideen davon, wie eine Maschine denken könnte, und sie sind von Anfang an Rivalen. Die eine Linie sagt: Intelligenz ist Symbolverarbeitung — man füttert die Maschine mit Regeln und Fakten, und sie schließt daraus. Die andere sagt: Intelligenz entsteht von unten, aus vielen einfachen, vernetzten Einheiten, die nicht programmiert, sondern trainiert werden — eben nach dem Vorbild des Gehirns. Nilsson nennt diese Spaltung — symbolisch gegen „brain-style” — die Ur-Trennung des Feldes und stellt trocken fest, sie „still survives today”. Sie ist, mit anderen Worten, exakt der Graben, der heute zwischen klassischer regelbasierter KI und dem Deep Learning verläuft, das ChatGPT antreibt. Wir kommen in späteren Teilen ausführlich darauf zurück; entscheidend ist, dass der Riss schon am ersten Tag da war.

Den begrifflichen Rahmen für diese frühe Aufbruchstimmung liefert ein Außenseiter: der Mathematiker Norbert Wiener. 1948 prägt er mit seinem Buch Cybernetics den Begriff der Kybernetik — die Wissenschaft von Steuerung und Rückkopplung in Maschine und Lebewesen. Sein Urbild ist denkbar bodenständig: der Fliehkraftregler, den James Watt 1788 an seine Dampfmaschine schraubte, damit sie ihre eigene Drehzahl konstant hält. Eine Maschine, die ihren Zustand misst und korrigiert — ein Mechanismus mit so etwas wie einem Zweck. Wiener verallgemeinert dieses Prinzip zu einer Theorie, die Nervensystem, Thermostat und Rechenmaschine unter einen Begriff zwingt. Für einen kurzen historischen Moment sieht es so aus, als sei Kybernetik der Name, unter dem die Wissenschaft vom künstlichen Geist firmieren wird. Es kam anders — und warum es anders kam, ist eine der lehrreichsten Episoden der ganzen Geschichte.

1950: Turing verschiebt die Frage

Zwei Jahre nach Wiener veröffentlicht Alan Turing im Oktober 1950 in der Philosophiezeitschrift Mind den Aufsatz, der bis heute das Gründungsdokument der KI-Philosophie ist: Computing Machinery and Intelligence. Sein erster Zug ist ein methodischer Geniestreich. Die Frage „Können Maschinen denken?”, schreibt er, sei zu unscharf, um sie sinnvoll zu beantworten — sie hänge an Definitionen von „Maschine” und „denken”, über die man sich endlos streiten könne. Also ersetzt er sie durch etwas Operationalisierbares: ein Spiel.

Im Imitationsspiel, das später als Turing-Test berühmt wird, kommuniziert ein menschlicher Fragesteller per Fernschreiber mit zwei verborgenen Gegenübern — einem Menschen und einer Maschine. Beide behaupten, der Mensch zu sein. Kann der Fragesteller nach einer Weile nicht zuverlässig sagen, wer wer ist, dann hat die Maschine bestanden. Turing definiert Intelligenz damit verhaltensbasiert: Nicht, was die Maschine innerlich „ist”, zählt, sondern allein, was sie tut. Es ist die Vaucanson-Frage, ins Methodische gewendet — nur dass Turing sie nicht für eine Schwäche hält, sondern zum Maßstab erhebt.

Turing wagt sogar eine Prognose. In etwa fünfzig Jahren, schätzt er, werde ein Rechner das Spiel so gut spielen, dass ein durchschnittlicher Fragesteller nach fünf Minuten höchstens noch in 70 Prozent der Fälle richtig liege. Das Bemerkenswerte an dem Aufsatz ist aber nicht die Vorhersage, sondern wie gründlich Turing seine Gegner schon vorwegnimmt. Er listet neun Einwände auf und beantwortet sie der Reihe nach. Einer davon, der sechste, trägt den Namen einer Frau, die ein Jahrhundert zuvor an der allerersten Rechenmaschine mitgedacht hatte: Ada Lovelace hatte 1843 über Babbages Analytische Maschine geschrieben, sie könne „nichts wirklich Neues hervorbringen”, sondern nur ausführen, was man ihr befehle. Turings Antwort darauf — dass auch wir oft nur neu kombinieren, was wir gelernt haben, und dass „Neuheit” schwer von Überraschung zu trennen ist — liest sich, als sei sie gestern geschrieben worden. Es ist exakt die Debatte, die heute unter Stichworten wie „stochastischer Papagei” über Sprachmodelle geführt wird: Produziert das Ding etwas Eigenes, oder spuckt es nur geschickt sortiert aus, was es verschluckt hat? Die verdauende Ente, noch einmal.

Turings letzter, prophetischster Gedanke betrifft das Lernen. Statt zu versuchen, einen erwachsenen Geist zu programmieren, schlägt er vor, eine „child machine” zu bauen — einen kindlichen Apparat, den man anschließend erzieht. Struktur statt fertigem Wissen, Training statt Programmierung. Damit nimmt Turing 1950 das Grundprinzip des maschinellen Lernens vorweg, das siebzig Jahre später die ganze Branche tragen wird. Was er nicht liefert, ist ein Name. Turing stellt die Frage. Den Namen stellt jemand anderes — und er tut es mit Absicht.

1956: Dartmouth gibt den Namen

Im Sommer 1956 versammelt sich am Dartmouth College im US-Bundesstaat New Hampshire eine kleine Gruppe von Forschern zu einem Workshop, der in der Rückschau als die Gründungsurkunde des Feldes gilt. Der Förderantrag dazu war im August 1955 verfasst worden, von vier Männern: dem Mathematiker John McCarthy, dem späteren MIT-Forscher Marvin Minsky, dem IBM-Ingenieur Nathaniel Rochester und Claude Shannon, dem Begründer der Informationstheorie. In genau diesem Antrag taucht der Begriff zum ersten Mal auf, der heute eine Billionenindustrie benennt: artificial intelligence.

Der Name war eine bewusste Wahl — und, das ist der entscheidende Punkt, ein Abgrenzungsmanöver. McCarthy wollte einen neutralen, frischen Begriff, der das junge Vorhaben von der etablierten Konkurrenz löste. Diese Konkurrenz hieß Kybernetik, und sie hatte einen dominanten, schwer umgänglichen Übervater: Norbert Wiener. McCarthy hat es später unverblümt gesagt — er habe den Begriff gewählt, „to escape association with ‘cybernetics’”, er habe vermeiden wollen, „Norbert Wiener as a guru” akzeptieren zu müssen. Die Geburt der KI als eigenes Feld ist also auch ein Akt der akademischen Revierabgrenzung. Der Wiener’sche Strang, die Netze und die Rückkopplung, wurde aus der Gründungserzählung herausgeschrieben — und kehrte erst Jahrzehnte später, als „Connectionism” und schließlich als Deep Learning, triumphal zurück. Wer „erfunden” hat und wer im kanonischen Narrativ als Erfinder gilt, sind, das lehrt schon dieser erste Moment, zwei verschiedene Dinge.

Im Zentrum des Antrags steht eine einzige, kühne Behauptung — die Forscher nennen sie selbst vorsichtig eine Konjektur, eine begründete Vermutung:

„every aspect of learning or any other feature of intelligence can in principle be so precisely described that a machine can be made to simulate it.”

Jeder Aspekt von Lernen und Intelligenz, so die Wette, lasse sich im Prinzip so präzise beschreiben, dass eine Maschine ihn nachbilden kann. Auf dieser Hypothese ruht das ganze Feld bis heute. Bemerkenswert ist der Rahmen, in dem die Gründer sie zu prüfen gedachten: Sie beantragten eine „2-month, 10-man study” — zwei Monate, zehn Mann. Für ein Problem, an dem die Menschheit seit Aristoteles kaut, hielten sie einen Sommer und eine Handvoll kluger Köpfe für angemessen. Finanziert wurde das von der Rockefeller-Stiftung; auf der Agenda standen, fein säuberlich aufgelistet, schon damals fast alle Themen, die das Feld bis heute beschäftigen: Sprachverarbeitung, neuronale Netze, Selbstverbesserung, Abstraktion, Kreativität.

Dieser Optimismus war nicht bloß rhetorisch. Zwei der Teilnehmer, Allen Newell und Herbert Simon, brachten bereits ein laufendes Programm mit: den Logic Theorist, der mathematische Sätze selbständig bewies — für viele die „Geburtsstunde des heuristischen Problemlösens”. Wie handgemacht diese Anfänge waren, zeigt eine Anekdote, die Nilsson überliefert: Weihnachten 1955 simulierte Simon die Arbeitsweise des Programms von Hand, mit seiner Frau und seinen Kindern als menschlichen „Recheneinheiten”, jeder mit einer Karteikarte und einer festen Regel. Aus solcher Bastelei erwuchs die Überzeugung, die Newell und Simon später zur Hypothese vom physikalischen Symbolsystem verdichten sollten: dass das Hantieren mit Symbolen nach Regeln „the necessary and sufficient means for intelligent action” sei — die notwendige und hinreichende Grundlage intelligenten Handelns. Die symbolische Linie von 1943 hatte damit ihr Programm, ihren Namen und ihr institutionelles Selbstbild gefunden. Sie sollte das Feld für die nächsten dreißig Jahre beherrschen.

Der Webfehler im Fundament

Halten wir fest, was in den dreizehn Jahren zwischen 1943 und 1956 entstanden ist — und was schon hier schiefliegt. Die KI startet mit einer Frage (Turing), einem Namen (McCarthy) und einer Wette (der Dartmouth-Konjektur). Sie startet zugleich mit einem eingebauten Konstruktionsfehler, der ihre ganze Geschichte erklärt: einem strukturellen Hang zur Selbstüberschätzung.

Man sieht ihn an dem Missverhältnis zwischen Anspruch und Frist. „Zwei Monate, zehn Mann” für die Mechanisierung des Denkens — das ist nicht einfach naiver Enthusiasmus, sondern das Urmuster eines Mechanismus, der sich in den folgenden Jahrzehnten mehrfach wiederholen wird: Eine kühne Prognose erzeugt Euphorie, die Euphorie zieht Geld an, das Geld finanziert sich aus der erwarteten Zukunft — und wenn die Frist verstreicht, ohne dass das Versprechen eingelöst ist, friert die Förderung ein. Den Vollausschlag dieses Boom-Bust-Zyklus, den „KI-Winter”, entfaltet Teil 2. Aber seine Saat liegt schon im Dartmouth-Antrag. Wie weit der Gründungsoptimismus trug, zeigt ein Satz von Herbert Simon aus dem Jahr 1957, ein Jahr nach Dartmouth: „there are now in the world machines that think, that learn and that create” — es gebe nun Maschinen auf der Welt, die denken, lernen und schöpfen, und ihre Fähigkeit werde rasch wachsen, bis sie an die des menschlichen Geistes heranreiche. Geschrieben über Programme, die auf gut gepolsterten Karteikarten liefen.

Warum das 2026 zählt

Man kann diese Geschichte als Antiquität lesen, als charmantes Vorspiel zum eigentlichen Geschehen, das angeblich erst 2012 oder 2022 beginnt. Das wäre ein Fehler. Drei Dinge aus den Jahren 1943–1956 strukturieren die Gegenwart direkter, als der heutige Diskurs wahrhaben will.

Erstens ist die Vaucanson-Frage unbeantwortet, und sie ist heute drängender denn je. Sprachmodelle „bestehen” naive Varianten des Turing-Tests mühelos — sie schreiben flüssiger als die meisten Menschen, halten Konversationen, wirken einfühlsam. Und exakt deshalb greift wieder, was 1966 am Chatbot ELIZA erstmals klinisch beobachtet wurde und seitdem Eliza-Effekt heißt: Menschen schreiben einer Maschine vorschnell Verstehen, Absicht, ja Empathie zu, sobald ihr Verhalten überzeugend genug aussieht. Die Informatikerin Katharina Zweig schlägt deshalb vor, bei Sprachmodellen nicht von „halluzinieren”, sondern von „konfabulieren” zu sprechen — und überhaupt die menschelnde Sprache zu meiden, weil sie genau jenen Kurzschluss befördert, vor dem Robert-Houdin die verdauende Ente bewahrte. Den Turing-Test zu „bestehen”, beweist nichts über Verstehen. Es beweist, dass die Imitation gut genug ist, um die Ente nicht aufzuschneiden.

Zweitens ist die Spaltung von 1943 nicht überwunden, sondern entscheidend. Der Graben zwischen symbolischer KI (Regeln, Logik, explizites Wissen) und dem „brain-style”-Ansatz (lernende Netze) strukturiert die Debatte bis heute. Das Deep Learning, das die aktuelle Welle trägt, ist der späte Sieg der zweiten Linie — jener Wiener-McCulloch-Pitts-Tradition, die McCarthy 1956 mit dem Wort „artificial intelligence” gerade aus der Gründungserzählung hinausdefiniert hatte. Und der prominenteste Einwand gegen die heutige Euphorie, der Ruf nach „neuro-symbolischer” KI, ist nichts anderes als der Versuch, die beiden 1943 getrennten Hälften wieder zusammenzubringen. Wer den heutigen Streit verstehen will, schaut auf eine Bruchlinie, die acht Jahrzehnte alt ist.

Drittens, und das ist die methodische Pointe für jede nüchterne Lektüre: Der Gründungsoptimismus von Dartmouth ist die Urform jedes „diesmal ist es anders”. Jeder KI-Boom — der der 1950er, der der Expertensysteme in den 1980ern, der heutige — hat behauptet, die Schwelle zur echten Intelligenz sei nun überschritten oder zum Greifen nah. Zweimal folgte ein Winter. Ob der LLM-Boom seit 2022 der dritte Zyklus eines stabilen Musters ist oder ein wirklicher struktureller Bruch, ist die offene Frage, auf die diese Serie hinausläuft. Die historische Grundhaltung dazu ist keine Prophezeiung, sondern eine Disziplin: Wer „diesmal ist es anders” hört, sollte die Ente aufschneiden, bevor er staunt.

Es gehört zu den Eigenarten dieses Feldes, dass es seinen eigenen Anfang ständig neu erzählt — mal als Heldengeschichte einzelner Genies, mal als unaufhaltsamen Lauf der Technik. Beides schneidet weg, was 1943–1956 in aller Deutlichkeit zeigt: dass es auch anders hätte kommen können. Dass der Name ein Branding war, die Frist eine Wette, die Spaltung ein Zufall der Personen. Der ehrlichste Zugang zur Geschichte der KI ist der von Robert-Houdin: nicht das Wunder bestaunen, sondern den Mechanismus öffnen und nachsehen, was wirklich drin ist.

Im nächsten Teil: Die erste Euphorie — und der erste Winter (1956–1974). Rosenblatts Perzeptron als erstes lernendes Netz, Weizenbaums ELIZA und der nach ihr benannte Effekt, und wie zwei Dokumente — Minskys und Paperts Perceptrons (1969) und der Lighthill-Report (1973) — das Feld zum ersten Mal einfrieren ließen.

Quellen

Stammquelle (Backbone der Serie)

Nils J. Nilsson: The Quest for Artificial Intelligence. Cambridge University Press, 2010. Die maßgebliche wissenschaftliche Gesamtgeschichte von einem Pionier des Feldes; kostenlose Volltext-Version unter ai.stanford.edu/~nilsson/QAI/qai.pdf. Die Vaucanson-Episode (Robert-Houdins Entlarvung), die Simon-Anekdote von 1955 und das McCarthy-Zitat zum Namen sind ihr entnommen.

Primärquellen

Alan M. Turing: Computing Machinery and Intelligence. In: Mind, Vol. LIX, Nr. 236 (1950), S. 433–460. Das Imitationsspiel, die Prognose, die neun Einwände, die „child machine”.
John McCarthy, Marvin Minsky, Nathaniel Rochester, Claude Shannon: A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence (Antrag 1955, Workshop 1956; AAAI-Reprint 2006). Der Name, die Konjektur, die „2-month, 10-man study”.
Warren S. McCulloch & Walter Pitts: A Logical Calculus of the Ideas Immanent in Nervous Activity. In: Bulletin of Mathematical Biophysics 5 (1943), doi.org/10.1007/BF02478259. Das künstliche Neuron.
Norbert Wiener: Cybernetics, or Control and Communication in the Animal and the Machine. MIT Press, 1948.

Begriffsklärungen

Die Serie zur Geschichte der KI

→ Weiter: Die Maschine, die zu verstehen schien — und der erste Winter

Jochens Blog

Graphansicht

Über