Blog

Faszination Intelligenz: Planen und Entscheiden

Planung ist die Intelligenzleistung von Menschen schlechthin. Aber was bedeutet Planen eigentlich? Wieso sind Menschen so gut im Planen, Tiere und Computer aber nicht?
 

Teil 1: Planung als Optimierung

13.02.2025
Die künstliche Intelligenz beschäftigt sich seit jeher mit dem Thema Planung. Dieser Artikel zeigt anschaulich, wie Planen im Computer als Optimierungsaufgabe umgesetzt wird und dass die wichtigsten Schritte trotzdem von Menschen erledigt werden müssen.

Die Fähigkeit zu Planen ist die kognitive Fähigkeit schlechthin. Keine andere Spezies baut Wolkenkratzer, trifft sich zu Großevents oder kann einen verdrehten Rubik's Cube in Ordnung bringen. Ohne Planung kann man keine komplexen Werkzeuge bauen, kein Mammut erlegen, keine Getreidevorräte einteilen.

Weil Planung offensichtlich ein zentraler Faktor der menschlichen Intelligenz ist, war es auch eines der ersten Themen, dem sich die Forschung der Künstlichen Intelligenz gewidmet hat. Also könnte das doch ein kurzer Blogartikel werden, in dem ich einfach die Lösung präsentiere. So einfach ist es aber nicht. In meiner gesamten Forschungskarriere habe ich mich gefragt, warum die vorhandenen Formalismen und Algorithmen bei weitem nicht die menschliche Planungsfähigkeit widerspiegeln. Auch bei diesem Thema ist der Grad zwischen Faszination und Frust schmal und wir kommen auf dieselben Themen zurück wie in anderen Bereichen der Intelligenz: Was bedeutet überhaupt Planen? Und wie spielt es mit anderen kognitiven Fähigkeiten zusammen?

Also was bedeutet Planen? Wikipedia definiert es so:

Die Planung beschreibt die menschliche Fähigkeit oder Tätigkeit zur gedanklichen Vorwegnahme von Handlungsschritten, die zur Erreichung eines Zieles notwendig scheinen. Dabei entsteht ein Plan, gemeinhin als eine zeitlich geordnete Menge von Daten.

Planung in der künstlichen Intelligenz basiert auf den Komponenten aus der Wikipedia-Definition:

  • Ein Plan ist eine zeitlich (ggf. partiell) geordnete Menge von Handlungen (in der KI als Aktionen bezeichnet).
  • Ein valider Plan überführt einen Ausgangszustand (zum Beispiel die Welt wie sie jetzt gerade ist) in einen Zielzustand (zum Beispiel ein Zustand, in dem eine Tasse Tee neben mir steht).
  • Ein optimaler Plan ist je nach Aufgabe ein kürzester Plan (d.h. es gibt keinen anderen Plan, der den Ausgangszustand mit weniger Aktionen in den Zielzustand überführt) oder, falls die Aktionen verschieden aufwendig sind (man sagt unterschiedliche Kosten haben), ein Plan mit minimalem Aufwand (d.h. die Summe der Kosten ist bei keinem anderen Plan niedriger).

Was wir also wollen ist mindestens ein valider, besser noch ein optimaler Plan. Und optimieren können Computer sehr gut. Wir müssen der Maschine jetzt also nur noch mitteilen, welche Aufgabe optimiert werden soll. Also welchen Zielzustand wir erreichen wollen und welche Aktionen dafür zur Verfügung stehen.

Tee-Optimierung

Zustände und Ziele

Wenn ich jetzt einen Computer oder Roboter damit beauftragen möchte, meine Welt aus dem aktuellen Zustand in meinen gewünschten Zustand zu überführen, brauchen wir zunächst einmal eine geeignete Repräsentation der Aufgabe. Für mein aktuelles Problem ist erstmal relevant, dass es eine leere Tasse gibt und das Ziel ist, dass ebendiese Tasse am Ende mit Tee gefüllt sein soll. In einem logischen Formalismus könnte man das so ausdrücken:

  • Startzustand: leer(Tasse)
  • Zielzustand: gefüllt(Tasse,Tee)
Meine kleine Teewelt kennt also zunächst nur zwei Objekte: Tasse und Tee und zwei sogenannte Relationen: leer und gefüllt.

Schon bei diesem kleinen Beispiel gäbe es etwa 5 Millionen Möglichkeiten wie man den Start- und Zielzustand repräsentiert. Zum Beispiel könnte ich mir die einstellige Relation leer sparen und stattdessen einen Wert für nix einführen: gefüllt(Tasse,nix). Ich könnte auch andere Gefäße als nur eine bestimmte Tasse zulassen und das Tasse-Sein als Eigenschaft über eine weitere einstellige Relation repräsentieren: istGefäß(?X) ∧ gefüllt(?X, Tee). Hier steht ?X für eine Variable, die beliebig gesetzt sein kann. Solange mein Haushaltsroboter irgendein Objekt findet, das die Eigenschaft hat, ein Gefäß zu sein, ist mir egal, welches Objekt das ist (ich rate davon ab, diese Definition im realen Einsatz zu verwenden: Tee aus einem Blumentopf zu trinken stelle ich mir weder hygienisch, noch praktikabel, noch lecker vor).

Neben der Formulierung in logischen Ausdrücken, ist auch immer die Frage, welche Variablen und Eigenschaften der Welt relevant sind. Um meinen Tee zuzubereiten, muss weder ich noch mein Haushaltsroboter wissen, ob meine Nachbarin gerade mit ihrem Hund Gassi geht oder ob für morgen ein Sturm angekündigt ist. Oder doch? Angenommen ich habe keinen Tee zu Haus und alle Leute möchten sich für den kommenden Sturm mit Tee eindecken, dann könnte es schon schwierig sein, überhaupt Tee zu erwerben (wir erinnern uns an die Klopapierkrise im COVID-Lockdown). Je mehr Details der Welt wir spezifizieren, desto besser kann ein automatischer Planer mit ungewöhnlichen Situationen umgehen (und das ist ja letztlich das einzige wofür wir ihn brauchen, für Standardsituationen könnten wir einen Plan selbst erstellen und jedes Mal wiederverwenden). Aber je mehr Detail wir haben, desto unübersichtlicher wird unsere Spezifikation, desto mehr Fehler können wir machen und desto schwieriger wird es einen optimalen Plan zu finden, weil die Menge an Kombinationsmöglichkeiten so groß wird, dass selbst der schnellste Supercomputer nicht mehr alles durchrechnen kann.

Wir sehen also: allein die Definition der Aufgabe bzw. des Ziels ist gar nicht so einfach. Und das gilt nicht nur, wenn wir Algorithmen zum Planen einsetzen wollen, sondern auch wenn wir selbst planen. In vielen Fällen ist das Herausfinden des Ziels das eigentliche Problem! Denken wir an die Planung von Geschäftsmodellen. Dafür gibt es zwar tausende Frameworks, die einem weismachen wollen, dass man sich ein festes Ziel definieren und dann darauf hinackern kann. In der Realität treten die Details erst der Reihe nach zutage und das Ziel ändert sich auch noch. Unternehmen, die vor ein paar Jahren fieberhaft versucht haben, Anwendungsfälle für Google Glass umzusetzen, haben entweder ihre Ziele geändert oder existieren nicht mehr. Rittel und Webber [1] sprechen von Wicked Problems, also bösen Problemen. Sie zeigen, dass das Erreichen von Zielen mit der Definition des Ziels Hand in Hand geht.

Aber jetzt seien wir mal nicht so streng. Es gibt ja auch einfachere Dinge, wo man das Ziel ganz gut kennt, z.B. dass ich auf meinen leckeren heißen Tee warte. Mit ein wenig Gefummel bekommt man dafür auch eine verwendbare logische Repräsentation hin. Damit kann ich meinem Haushaltsroboter zumindest eindeutig klarmachen, was ich von ihm möchte. Jetzt nehmen wir utopischerweise weiterhin an, dass dieser Roboter über die Sensorik und entsprechende Auswertungsmöglichkeiten verfügt, dass er herrausbekommt, wo der Wasserkocher, saubere Tassen und Teebeutel sind. (Wer sich jetzt fragt, ob jemand, der ausgerechnet ein Teebeispiel wählt, Teebeutel verwendet: nein, tue ich nicht, aber das Beispiel wird zu unübersichtlich, wenn ich zusätzlich Teesieb, Messlöffel und Teekanne in mein Modell einbauen würde.)

Aktionen

Mit diesen Voraussetzungen und Fähigkeiten könnte unser Roboter jetzt zumindest feststellen, dass der aktuelle Zustand der Welt die Bedingungen im Zielzustand nicht erfüllt. Was er jetzt noch braucht, sind Handlungsmöglichkeiten, auch Aktionen genannt. Typische Aktionen, die man für eine derartige Planungsaufgabe definieren würde, sind: gehe-nach, greife, stelle-ab, fülle. Mit entsprechenden Parametern versehen, könnte ein Plan so aussehen:

  1. gehe-nach(Küche)
  2. greife(Wasserkocher)
  3. fülle(Wasserkocher, Wasser, Wasserhahn)
  4. fülle(Tasse, Tee, Teepackung)
  5. stelle-ab(Wasserkocher)
  6. schalte-ein-und-warte(Wasserkocher)
  7. greife(Wasserkocher)
  8. fülle(Tasse, Wasser, Wasserkocher)
  9. greife(Tasse)
  10. gehe-nach(Schreibtisch)
  11. stelle-ab(Tasse)

Wer genau hinsieht, wird merken, dass dieser Plan nicht alle Details enthält. Aber das ist ja auch die Idee an einem Plan: er soll grob die Schritte vorgeben, die Details sollten bei der Ausführung ergänzt werden. Zum Beispiel die Aktion schalte-ein-und-warte ist eine Bastelei, die man in der Implementierung der Aktionen ausbaden muss. Klassisches KI-Planen kennt zwar zeitlich hintereinander abfolgende Handlungen, hat aber ansonsten keinen Zeitbegriff. Somit könnte ich das Warten nicht ohne weiteres in den Plan einbauen. Meine Lösung ist ein pragmatischer Hack, der solange gut funktioniert, wie der Roboter nicht allzu effizient sein muss. Wenn einschalten-und-warten als eine Aktion definiert ist, könnte der Roboter nicht einplanen, nebenbei die Küche aufzuräumen, während er auf das kochende Wasser wartet. Genauso kann man aber auch über jede andere Aktion streiten: muss man im Plan explizit sagen, dass der Wasserkocher gegriffen werden muss um ihn mit Wasser zu füllen oder sollte man das als Teil der fülle-Aktion betrachten? Darauf gibt es keine allgemeinen Antworten, das ist die übliche Fummelei bei jeder Modellierung.

Auch die Aktion fülle ist eine Bastelei. Neben den offensichtlichen Parametern, was womit gefüllt werden soll, habe ich einen dritten Parameter dazugepackt für die Quelle des hinzuzufügenden Dings. Denn sonst wäre es eine valide Ausführung des Plans, wenn in Schritt 8 der Teebeutel mit kaltem Wasser aus dem Wasserhahn übergossen würde.

Und dann gibt es noch eine kleine Unschönheit: der Roboter hat am Ende immer noch den Wasserkocher im Greifer. Das ist für die Erfüllung des Ziels unerheblich, denn der Zielzustand gibt nicht vor, dass die Greifer des Roboters leer sein sollen. Aber wenn man einen existierenden Roboter in einem KI-Labor sieht oder auch nur in Simulation: es wirkt gleichzeitig niedlich und faszinierend dämlich. Als Menschen müssen wir gar nicht darüber nachdenken, den Wasserkocher abzustellen. Aber wieso tun wir das automatisch? Niemand weiß es. Ohne Witz, es ist eine ungeklärte wissenschaftliche Frage, warum wir wissen, dass wir den Wasserkocher wieder abstellen sollten.

Planung

Den gerade diskutierten Plan habe ich selbst geschrieben. Damit ein Computer so einen Plan automatisch generieren kann, müssen wir noch klären, was die Aktionen eigentlich tun. Allein mit dem Namen kann der Computer natürlich nichts anfangen. Ob ich die Aktion als gehe-nach bezeichne oder als badeente oder als a186 ist der Maschine herzlich egal. Worauf es ankommt, ist die Bedeutung der Aktion und die können wir spezifizieren, indem wir in einer logischen Notation aufschreiben, wie sich der Zustand der Welt durch das Ausführen der Aktion ändert.

Aktionen werden beim Planen üblicherweise mit Vor- und Nachbedingungen spezifiziert. Eine Vorbedingung ist eine Eigenschaft der Welt, die erfüllt sein muss, damit die Aktion ausgeführt werden kann. In unserer Teewelt wäre eine Vorbedingung der Aktion greife, dass der Roboter nah genug an dem zu greifenden Objekt ist, in Logik z.B. ausdrückbar durch nahe-bei(Wasserkocher). Eine Nachbedingung ist eine Eigenschaft der Welt, die gilt, wenn der Roboter seine Aktion erfolgreich ausgeführt hat. Für die greife-Aktion wäre das zum Beispiel, dass das gegriffene Objekt im Greifer des Roboters ist und dass es dann nicht mehr auf dem Tisch steht.

Wie nicht mehr auf dem Tisch steht? Das ist doch klar! Uns schon, einer Maschine nicht. Wie auch bei Zuständen kann man viel Zeit mit der Spezifikationen von Aktionen und ihren Vor- und Nachbedingungen verbringen. Und dabei müssen Zustandsdefinition und Aktionsdefinition zusammenpassen. Das passiert über die schon erwähnten Eigenschaften und Relationen (also Beziehungen zwischen Objekten) in logischer Notation, also wie im Beispiel nahe-bei(Wasserkocher), gefüllt(Tasse,Tee) usw. Und dabei muss man natürlich auch auf Konsistenz achten. Wenn ich in der Zustandsbeschreibung gefüllt(Tasse,Tee) definiere, muss eine Nachbedingung einer Aktion ebenfalls die Relation gefüllt enthalten. Wenn ich bei der Spezifikation nicht aufpasse und das Prädikat stattdessen enthält nenne, wird mein Algorithmus keinen Plan finden. Oder falls ich bei Aktionen Vorbedingungen vergesse, dann kann der Planungsalgorithmus zwar einen mathematisch validen Plan zurückliefern, aber dieser wird in der Praxis nicht ausführbar sein.

Hier sieht man, wie schwierig der Übergang von der Mathematik in die echte Welt ist. Mit einer gut modellierten Planungsaufgabe kann man durch jahrzehntelang entwickelte Algorithmen mathematisch optimale oder zumindest sehr gute Ergebnisse erhalten. Aber es gibt keine Formel oder einen Beweis dafür, dass die Aufgabe gut modelliert ist. Das merkt man erst, wenn man den Plan auf die echte Welt loslässt.

Mit all diesen Spezifikationen, ist recht einfach nachzuvollziehen, was ein Planungsalgorithmus tut: er hängt Aktionen aneinander, deren Nachbedingung die Vorbedingung der nächsten Aktion herstellen. Ein valider Plan startet mit einer Aktion, die im Ausgangszustand ausführbar ist. Aus den Nachbedingungen der Aktion kann man den Zustand berechnen, der vorherrschen würde, wenn die Aktion tatsächlich ausgeführt werden würde. Diesen neuen Zustand kann man wieder als neuen Anfangszustand behandeln und die nächste Aktion hinzufügen. Das macht man so lange bis ein Zustand die Bedingungen des Zielzustandes erfüllt.

Die Herausforderung ist dabei, die richtigen Aktionen zu finden, die am Ende wirklich zusammenpassen und den Zielzustand herstellen. Im einfachsten Fall kann man sich vorstellen, einfach alle Aktionskombinationen der Reihe nach durchzuprobieren. Dieser naive Algorithmus würde schon bei kleinsten Aufgaben sehr lange rechnen. In den letzten Jahrzehnten wurden viele Methoden entwickelt, die die Berechnung beschleunigen deutlich beschleunigen, sodass man sagen kann, dass für fast jede Aufgabe in vernünftiger Zeit zumindest ein valider Plan gefunden werden kann und man zumindest abschätzen kann, wie weit er vom optimalen Plan abweicht. An der Verbesserung der Optimierungsalgorithmen wird auch weiterhin geforscht. Bedauerlicherweise ist es so ziemlich das einzige woran im Bereich KI-Planung aktuell geforscht wird.

Warum ich meinen Tee selbst zubereite

Es gibt viele Gründe, warum ich meinen Tee weiterhin selbst zubereite. Zunächst einmal ist das Beispiel extrem vereinfacht und macht unrealistische Annahmen über die Fähigkeiten von aktuellen Robotern. Ein Roboter erkennt Gegenstände nicht zuverlässig, er weiß nicht immer ganz genau wo er ist, und Aktionen wie Greifen sind extrem schwierig. All diese Fähigkeiten werden zwar stolz von Robotiklaboren aus der ganzen Welt auf YouTube vorgeführt. Aber trotz allen Fortschritts darf man dabei die Tricks nicht übersehen. Wenn z.B. ein Roboter etwas greift, stehen meist keine weiteren Objekte neben dem zu greifenden Objekt, denn diese könnte der Roboter umwerfen ohne überhaupt zu bemerken, dass das nicht gewollt ist.

Auch meine Modellierung der Planungsaufgabe ist extrem vereinfacht. An einigen Stellen habe ich Alternativen und Probleme angemerkt und es gibt noch viele weitere. Und natürlich ist diese Spezifikation noch nicht einmal vollständig.

Der springende Punkt, ob automatische Planung sinnvoll ist, ist das Verhältnis zwischen Aufwand für die Spezifikation und dem Nutzen von optimierten Plänen. Gut funktioniert es in Bereichen, die relativ gut kontrollierbar sind wie Fabriken, wo Arbeitsprozesse sowieso sehr strukturiert ablaufen. Auch wenn eine Aufgabe häufig gelöst werden muss, vielleicht nur mit unterschiedlichen Ausgangszuständen, lohnt sich der Aufwand.

Aber auch dann ist die hier vorgestellte Form von Planung nicht immer angemessen. Oft ist der Ausgang von Aktionen nicht komplett vorhersehbar. Wenn ich zum Beispiel einen Stein werfe, kann man nicht ohne weiteres sagen, wo dieser landen wird. Auch die Dauer von Aktionen ist oft nicht vorhersehbar, zum Beispiel bei der Anlieferung von Bauteilen. Wobei Zeit, wie oben beschrieben, sowieso nicht ohne weiteres in das Schema der automatischen Planung passt. Außerdem sind wir davon ausgegangen, dass nur der Roboter selbst die Welt manipuliert. So könnte jemand die Tasse entführen während der Roboter darauf wartet, dass das Wasser kocht.

Für all diese Unzulänglichkeiten gibt es partielle Lösungen. Aber immer bleibt das Problem, dass es sehr viel menschliche Arbeit braucht die Aufgabe zu spezifizieren und sicher zu stellen, dass die Spezifikation so geschaffen ist, dass die gefundenen Lösungen in der Realität funktioneren.

Optimierung ist also, wenn überhaupt, nur ein Teil von Planung. Das Verstehen der Aufgabe, der zur Verfügung stehenden Möglichkeiten und die Anwendbarkeit auf eine reale Situation, sind mindestens genauso wichtig. Im nächsten Teil lassen wir uns faszinieren, wie Menschen planen; wie verschiedene kognitive Prozesse zusammenwirken und damit die Illusion von Optimierung entstehen lassen und dabei so viel flexibler sind als ein Optimierungsalgorithmus.

 

Teil 2: Warum Planung nicht gleich Optimierung ist

20.02.2025
Wie funktioniert Planen in unserem Alltag? Was passiert in unserem Gehirn, um einen Plan zu erstellen (und was passiert nicht)? Welche anderen kognitiven Fähigkeiten brauchen wir dazu?

Wir haben gesehen, wie Planungsaufgaben formalisiert werden können und dass dazu eine ganze Menge Verständnis der Aufgabe nötig ist. Es ist leider unmöglich zu beweisen, dass ein bestimmtes Phänomen nicht existiert, aber ich habe Jahre damit verbracht, Hinweise zu finden, dass Menschen so planen wie es die Formalisierung vorsieht: das Problem genau definieren und dann einen Planungsalgorithmus anwerfen. Die einzige Situation, wo wir so etwas tun, ist wenn uns dieses Vorgehen durch Institutionen vorgegeben wurde und wir uns für Entscheidungen rechtfertigen müssen. Aber selbst dann ist der Problemlöseprozess immer ein Wechselspiel von Aufgabeverstehen und Aufgabelösen. Nur das Resultat wird so präsentiert als hätte man die Schritte der Reihe nach gemacht und manchmal glaubt man das vielleicht sogar selbst.

Nochmal: Was ist Planung?

Wenn es dieser formale Prozess nicht ist, was tun wir Menschen dann? Und vor allem: was ist denn eigentlich Planung? Die Definition in Teil 1 hatte diese Komponenten:

  • Gedanklichen Vorwegnahme von Handlungsschritten
  • Erreichung eines Zieles
  • Das Ergebnis ist ein Plan

Was tun Leute zum Beispiel, wenn sie eine Hochzeit planen? Da wird man sich überlegen wen man einladen möchte, man wird einen geeigneten Ort für die Feier suchen, sich über Musik, Verköstigung und die Hochzeitstorte Gedanken machen. Aber was ist genau das Ziel und was genau der Plan? Man könnte sagen, das Ziel ist es, sämtliche Parameter der Hochzeit im Voraus zu definieren: Datum, Gästeliste, Kleidung, Ringe, Torte, usw. Der Plan wäre eine exakte Liste von Aktivitäten, damit die Hochzeit am Ende stattfindet: Gäste einladen, Torte bestellen, Räumlichkeiten reservieren. Laut Definition wird der Plan erstellt durch eine gedankliche Vorwegnahme der Handlungsschritte, ein wenig so wie bei den Vor- und Nachbedingungen bei der formalen Planung. Die Anzahl der Gäste ist ausschlaggebend für die Größe der Räumlichkeiten und der Torte, aber unerheblich für die Kleidung des Brautpaars. Aber Menschen können sich auch andere Dinge vorstellen. Zum Beispiel, ob sie ihre spezifischen Gäste zum Tanzen motivieren können oder lieber keine Tanzfläche einplanen.

Was auf den ersten Blick halbwegs auf das Schema passt, ist bei genauerem Hinsehen viel komplexer. Zunächst einmal gibt es nicht den Plan. Wann genau ist der Plan vollständig? Wenn die Hochzeitstorte final ausgesucht und bestellt ist oder wenn man einen Schritt im Plan vorgesehen hat Hochzeitstorte beim Bäcker aussuchen und bestellen? Die Verpflegung sollte man jedenfalls erst final auswählen, wenn man zumindest von den meisten Gästen erfahren hat, ob sie kommen werden. Das heißt, diesen Schritt im Plan kann man gar nicht genau ausdefinieren bevor man mit der Ausführung des Plans (die Gäste einladen) begonnen hat. Selbst die Wahl des Caterers kann von der Größenordnung der Gästeliste abhängen. Das Aufstellen des Plans und dessen Ausführung gehen also ineinander über.

Was passiert, wenn wir einen Urlaub planen? Da müssen wir den Plan doch zumindest haben bevor wir losfahren. Wir werden sicherlich Anreise, Übernachtung und eventuell Ausflüge vorgeplant haben. Wir haben also Parameter festgesetzt, die den Urlaub bestimmen werden: wann und wo er stattfindet und zum Teil was wir tun werden. Aber ist das ein vollständiger Plan? Und was ist überhaupt das Ziel einer Urlaubsreise? Das Verbringen von Zeit irgendwo anders? Erholung? In diesem Fall hat man vielleicht einen Plan, aber eigentlich kein Ziel.

Dann nochmal das Beispiel mit dem Tee. Hier hätten wir ein relativ klares Ziel: das Vorhandensein von heißem Tee in einer Tasse. Und man kann auch recht klar Schritte definieren: Wasserkocher befüllen und einschalten, Teebeutel in die Tasse hängen, Wasser darüber gießen, warten (lustig, wie sich das in natürlicher Sprache so leicht beschreiben lässt, während es in Logik zu einer wissenschaftlichen Abhandlung ausartet). Aber ist das wirlich Planen? Muss ich die Handlungschritte mental vorwegnehmen? Sind diese Schritte nicht irgendwie klar?

Kognitive Prozesse

Gary Klein und das von ihm begründete wissenschaftliche Gebiet Naturalistic Decision Making vertritt die These, dass ExpertInnen nicht planen im Sinne von Optimierung. Was man vielmehr findet, wenn man Leute direkt bei ihrer Arbeit beobachtet und befragt, ist dass das Gedächtnis eine große Rolle spielt, und zwar nicht nur um Planschritte mental zu projizieren (auch dazu brauchen wir natürlich Erfahrung, z.B. um zu wissen was passiert, wenn ich eine Tasse auf den Boden werfe), sondern man holt einen Plan direkt aus dem Gedächtnis und passt ihn auf die aktuelle Gegebenheit an. Gerade in stressigen Situationen – Feuerwehrleute beim Bekämpfen eines Brandes, Arztinnen bei einer Notoperation, Militärpiloten im Kampf – scheint dieser direkte Abruf einer Lösung, die sich früher schon einmal bewährt hat, der Hauptmechanismus zu sein.

Ist das jetzt ein Widerspruch zu den klassischen Annahmen des Planens? Zunächst einmal nicht. In der Definition steht nicht, wo der Plan herkommt. Und mentale Projektion braucht man bei der Plans-aus-dem-Gedächtnis-Methode auch, nämlich um zu prüfen, ob der vorhandene Plan in der aktuellen Situation funktionieren wird. Und tatsächlich wurde diese Art des Planens vor langer Zeit auch schon im Computer nachgebildet von Gerald Sussman in einem System, das er Hacker nannte [1]. Auch dieses System basierte auf einer logischen Repräsentation und unterliegt damit dem selben Problem wie die Optimierung: das Modellieren ist ein extremer Aufwand. Und obwohl diese Art der Planung in einem ganzen Forschungsgebiet mit der Bezeichnung Case-Based Reasoning weitergeführt wurde, hat man keinen Weg gefunden (und ehrlich gesagt auch nicht gesucht) um mit unvollständigen Beschreibungen der Aufgabe und Handlungsschritte flexible Lösungen zu finden.

Gedächtnis

Hier sind wir wieder bei dem Problem, das wir auch im Blogbeitrag zum Gedächtnis gesehen haben, wissen wir nicht so genau, was in einem menschlichen Gedächtnis gespeichert ist und schon gar nicht, wie wir es in einer Rechenmaschine replizieren. Habe ich irgendwo im Gehirn etwas abgespeichert, das mir sagt um einen Wasserkocher mit Wasser zu befüllen, muss ich ihn vorher hochheben und öffnen? Oder speichert mein Gehirn kleine Filmsequenzen ab, in denen ich gesehen habe, wie jemand (evtl. auch ich selbst) einen Wasserkocher nimmt, öffnet und befüllt? Oder ist das Wasserkocherbefüllen eine vollständige Routine in meinem Gehirn? Was ist aber, wenn ich den Wasserkocher entkalke? Ist das dieselbe Routine mit unterschiedlichen Parametern oder eine völlig andere, obwohl die Schritte fast dieselben sind?

Und selbst wenn wir einen Plan haben (optimiert oder aus dem Gedächtnis abgerufen): wie speichern wir diesen eigentlich ab? Unser Kurzzeitgedächtnis kann in etwa 5 Einheiten speichern, also sagen wir mal Planschritte. Das ist nicht besonders viel. Kulturelle Errungenschaften erlauben es uns, unseren Speicher gewissermaßen zu erweitern: wir können mehr als 5 Schritte aufschreiben, sei es auf Papier oder im Computer (mir ist nicht bekannt, dass Planschritte bereits an Höhlenwände geritzt wurden, aber vielleicht hat man die Zeichnungen bisher nur falsch interpretiert?). Wir benötigen aber weiteren Speicher, um den Plan überhaupt mal auszuarbeiten. Theoretisch gibt es bei 5 Aufgabenschritte 5!=120 Kombinationsmöglichkeiten (wenn bekannt ist, dass jeder Schritt exakt einmal vorkommt). Und selbst, wenn wir einen sehr cleveren Planungsalgorithmus hätten, im Allgemeinen kommt man um ein gewisses Trial-and-Error nicht herum. Das lässt sich sowohl theoretisch beweisen (wenn man Planschritte als logische Operanden annimmt) und man kann das auch ganz gut an sich selbst beobachten, wie man Varianten im Gehirn herumschiebt.

Aber nochmal zur Speicherung des Plans selbst. In der Natur, ohne Schreibwerkzeug, können unsere Pläne nicht viel mehr als 5 Schritte umfassen. Und vielleicht ist das auch gar nicht nötig. Wie wir bei dem Hochzeitsbeispiel gesehen haben, arbeitet man fast nie einen Plan vollständig aus und fängt dann erst mit der Ausführung an. Ein Plan gibt vielmehr einen groben Rahmen vor, der die Möglichkeiten der nächsten Handlungsschritte bestimmt und wenn diese ausgeführt sind, kann man den Plan ein wenig weiter in die Zukunft ausdehnen. Diese natürliche Form des Planens wird in der wissenschaftlichen Literatur so gut wie gar nicht beschrieben, wohingegen man ganze Bibliotheken mit Büchern über Optimierung füllen kann. Könnte es sein, dass diese absolut nützlichen Werkzeuge, die es uns erlauben längere Pläne aufzuschreiben, uns auch dazu verleiten uns einen Planungsprozess (Optimierung) aufzuzwängen, der weder unseren natürlichen Fähigkeiten entspricht, noch besonders gut funktioniert? Gerd Gigerenzer hat kürzlich einen interessanten geschichtlichen Rückblick zu diesem Thema veröffentlicht [2].

Sprache

Wenn wir Pläne aufschreiben, tun wir das in natürlicher Sprache. Sprache ist unser bestes Fenster um die Kodierung von Gedanken im Gedächtnis besser zu verstehen. So haben logische Ausdrücke, wie sie zur Modellierung von formalen Plänen verwendet werden, eine gewisse Entsprechung in natürlicher Sprache. Substantive werden als Konstanten formalisiert, z.B. Tee. Adjektive sind einstellige Relationen oder Prädikate, z.B. leer. Mehrstellige Relationen werden in der Sprache durch Verben und Präpositionen ausgedrückt: gefüllt(Tasse,Tee) entspricht Die Tasse ist mit Tee gefüllt.

Das klingt doch erstmal ziemlich ähnlich. Aber einerseits kann Sprache so viel mehr ausdrücken als Logik und andererseits müssen wir mit der Sprache immer nur Teile notieren, den Rest weiß unser Gehirn sowieso. Mein Teezubereitungsplan in natürlicher Sprache ist deutlich einfacher als der in Logik. Schritte wie gehe-nach oder greife muss ich mir nicht notieren, das werde ich sowieso machen. Ich könnte auch meinen logischen Plan kürzen und diese Schritte in die Aktionsausführung kodieren. Aber in jedem Fall müsste ich in meinem Haushaltsroboter explizite Schritte dafür vorsehen, von allein macht das keine Maschine.

Pläne werden oft mit anderen Menschen gemeinsam erstellt und ausgeführt. Dabei kann und muss man annehmen, dass die anderen ebenfalls Wissen und Erfahrung haben. Wenn wir für einen Hausbau jeden Handgriff zum Setzen jedes einzelnen Ziegels als Plan aufschreiben müssten, würden wir in Höhlen wohnen. Umso überraschter sind wir, wenn unser Gegenüber unsere Erwartungen nicht erfüllt. Ich habe von einem Fall gehört, wo eine Unternehmerin ihrem Praktikanten aufgetragen hat, abends das Geld in der Kasse zu zählen, 100 Euro Wechselgeld darin zu lassen und den Rest im Safe zu verwahren. Der Praktikant hat das Geld brav gezählt, aus der Kasse genommen und in den Safe gepackt. Als sie am nächsten Tag ins Geschäft kam, war ein 100-Euro-Schein in der Kasse. Man muss zugeben, dass sie die Parameter unvollständig spezifiziert hat.

Wahrnehmung

Wenn Pläne dafür da sind Ziele zu erreichen, wo kommen eigentlich die Ziele her? Wahrnehmung spielt sicher eine wichtige Rolle: ich sehe den Porsche des Nachbarn und will auch einen; jemand sagt mir, ich soll den Müll rausbringen (sprachliche Kommunikation ist ja auch eine Form von Wahrnehmung); ich spüre, dass ich Hunger habe und möchte etwas zu Essen.

Nicht jede Wahrnehmung muss einen Zielwunsch auslösen. Oder doch? In der Psychologie gibt es den Begriff Affordanz oder Angebotscharakter. Im Grunde ist unser Gehirn ständig auf der Suche nach Aktionsmöglichkeiten. Es gibt sogar unterschiedliche Verarbeitungswege im Gehirn: wenn wir z.B. eine Teekanne sehen, wird einerseits versucht das Objekt zu klassifizieren und ihm einen Namen zu geben, andererseits sucht das Gehirn nach Interaktionsmöglichkeiten. Man sieht das zum Beispiel mit Eye Tracking: Der Blick geht zuerst zum Griff der Kanne.

Einer der großen Unterschiede zwischen Mensch und Affe ist, dass wir diese Interaktionsimpulse unterdrücken können. Unser präfrontaler Cortex sortiert aus, auf welche Angebote der Umgebung wir reagieren und das hat auch viel mit gelerntem sozialen Verhalten zu tun. Zum Beispiel sieht man Kinder oft im Zug Knöpfe drücken, die eigentlich als Notruf für behinderte Fahrgäste gedacht sind. Knöpfe jeder Art ziehen uns magisch an, weil sie ganz klar sagen drück mich (lustigerweise tun sie das, obwohl sie menschengemacht sind, also nicht natürlich in der Welt vorkommen). Deshalb ist auch die Gestaltung von Feuermeldern eine Herausforderung: Einerseits ist der rote Knopf ein ganz klares Signal wie man mit dem Ding interagiert, das man auch in einer Paniksituation ohne Nachdenken versteht. Andererseits will man Fehlalarme vermeiden und bringt sie deshalb einerseits so an, dass Kinder rein durch ihre Größe nicht herankommen und setzt sie hinter Glas um das Gehirn daran zu erinnern, dass dieser Knopf nur in ganz bestimmten Fällen zu betätigen ist.

Die Unterdrückung der Aktionsreize aus unserer Umgebung kostet mentale Ressourcen. Ich denke, dass dies der Grund ist, warum viele Menschen sich heutzutage überfordert fühlen oder abgelenkt sind. Ständig ziehen Push-Nachrichten, Anrufe, Emails, usw. ihre Aufmerksamkeit auf sich und wir sind eigentlich nur noch damit beschäftigt uns zuzuflüstern das ist jetzt nicht wichtig. Der nett gemeinte Hinweis vermeide Ablenkung ist in unserer heutigen Welt kaum realistisch. Für mich persönlich funktioniert es ganz gut, wenn ich mir bewusst Zeit nehme, wo ich konzentriert arbeite, und Zeiträume zulasse, in denen ich meine Unterdrückungsmechanismen ausschalte und einfach jedem Reiz nachrenne.

Ziele kommen nicht nur von außen, sie können sich auch aus anderen Tätigkeiten ergeben. Frühe Forschung in der KI hat sich damit beschäftigt, wie man komplexe Aufgaben in Unterziele auseinandernimmt. Im Grunde könnte man auch sagen, der Plan besteht aus einer Sammlung von Unterzielen. Hier verschwimmen die Grenzen zwischen Handlungen und Zielen. Und das ist sogar beim Teekochen so. Der Planschritt Teekocher greifen könnte eine Aktion sein, die bei mir als solche ein einem Stück abgespeichert ist und ich weiß was ich zu tun habe, sie könnte aber auch ein Ziel sein, also ein Wunschzustand, in dem der Teekocher in meiner Hand ist.

...und bin so klug als wie zuvor

Wir kommen also zurück auf unser altes Problem: Was ist eigentlich Planen? Was ist ein Ziel?

Was wir sicher sagen können: Planung ist nicht Optimierung. Zumindest folgende Punkte zeigen, dass Menschen nicht optimieren, wenn sie planen:

  • Repräsentation. Um überhaupt optimieren zu können, müssen die Parameter klar sein in Form einer vollständigen Spezifikation von Zuständen und Aktionen mit ihren Vor- und Nachbedingungen. Schon für einfachste Aufgaben wie Tee zuzubereiten ist dies eine Mammutaufgabe. Wenn Menschen planen, kommen sie mit unvollständigen Parametern aus.
  • Interaktion von Planung und Planausführung. In verschiedenen Zusammenhängen und Disziplinen wurde beobachtet, dass Menschen bei jeder Planung zwischen dem Erstellen des Plans und der Ausführung des unvollständigen Plans hin und her springen. Newell und Simon [3] haben sogar bei mathematischen Rätselaufgaben festgestellt, dass ihre Versuchspersonen zwischen einem abstrakten Plan und dem mentalen Ausführen einzelner Planschritte abgewechselt haben. Interessanterweise haben die beiden diese Beobachtung nicht umgesetzt. Ihr (für die damalige Zeit absolut beeindruckendes) System, genannt General Problem Solver, hat einen klassischen Optimierungsansatz umgesetzt. Es ist natürlich deutlich einfacher, ein mathematisches Verfahren wie Optimierung auf einer Rechenmaschine zu implementieren anstatt die unvollständig verstandenen Interaktionen zwischen unvollständig verstandenen Prozessen in Mathematik zu formulieren.
  • Gedächtniskapazität. Ein menschliches Kurzzeitgedächtnis hat nicht einmal die Kapazität, längere Pläne zu speichern, und schon gar nicht für den Optimierungsprozess, der immer ein gewisses Ausprobieren beinhaltet. Durch externe Werkzeuge kann diese Beschränkung ein Stück weit aufgehoben werden, ändert aber nichts daran, dass voll optimierte Pläne im normalen Leben nicht möglich sind.

Gerade der letzte Punkt wird Menschen gern vorgeworfen: wir sind halt zu beschränkt um zu optimieren und deshalb müssen wir uns mit minderwertigen Heuristiken zufrieden geben. Aber genau das Gegenteil ist der Fall. Gerd Gigerenzer und seine KollegInnen haben jahrelang in empirischen Studien gezeigt, dass Menschen in sehr vielen Fällen besser entscheiden als das was man durch Optimierung erhalten würde [4]. Sie haben auch Kriterien gefunden, wann mathematische Optimierung funktioniert (dann wenn alle Parameter der Welt ohne Unsicherheit bekannt sind und sich nicht ändern (small worlds)) und wann die menschliche Herangehensweise besser funktioniert (quasi immer sobald man nicht in einer Fabrik oder Matheaufgabe ist (large worlds)).

Ich denke sogar, dass es kein Zufall ist, dass unser Kurzzeitgedächtnis nicht größer ist. Es gab bestimmt immer mal wieder Mutationen im Laufe der Evolution, wo jemand mehr Gedächtniskapazität hatte als andere Menschen. Aber diese Leute hatten zumindest keinen Überlebensvorteil. Und gerade bei der Kapazität des Kurzzeitgedächtnisses findet man relativ wenig Varianz. Eine höhere Kapazität wird zwar im Allgemeinen mit höherer Intelligenz assoziiert, aber wir wissen nicht, ob ein Mensch mit noch höherer Kapazität überhaupt noch funktionieren würde. Meine Wette wäre: nein. So jemand würde den ganzen Tag damit zubringen die nächsten Schritte genau auszuplanen, während sich die Welt so schnell verändert, dass der wunderbare Plan schon vor seiner Vollendung wieder hinfällig ist. In einer Welt, die sich ständig ändert, wo wir ständig neue Informationen wahrnehmen und einige Informationen unbekannt sind oder erst durch (physisches) Ausprobieren verfügbar werden, ist es sich schlichtweg kein Vorteil, lange Pläne vollständig ausarbeiten zu können.

 

Teil 3: Seltsame Schleifen

21.02.2025
Meine persönliche Antwort, was Planen ist: die Interaktion von seltsamen Schleifen mit verschiedenen Repräsentationen der Welt.

Planen und Abstraktion

Wir haben eine Menge Puzzleteile gefunden: Ziele, Vorstellungskraft, Handlungen, Pläne. Und schon bei den wenigen Beispielen hat man gesehen, dass der Begriff Planen für unterschiedliche Dinge verwendet wird. Eine Veranstaltung zu planen ist etwas völlig anderes als einen Business-Plan aufzustellen, meine Urlaubspläne können einfach nur ein Ort und ein Datum sein oder eine Liste von Aktivitäten, und wenn ich plane diesen Artikel heute noch fertig zu schreiben und zu veröffentlichen, dann meine ich eigentlich, dass ich mir das wünsche.

In jedem Fall ist Planen mehr als reines Tun. Aktionen führen Tiere auch aus, aber nur sehr wenige haben die Fähigkeit mehrere Aktionen zur Erreichung eines Ziels aneinander zu hängen. Beispielsweise haben Krähen in einem Experiment ein Stück Draht so verbogen, dass sie es als Haken nutzen konnten um Futter aus einer Flasche zu angeln. Diese komplexe Aneinanderreihung von Aktivitäten würde ich durchaus als Planen bezeichnen. Aber was bei Krähen eher selten zu beobachten ist, ist bei Menschen quasi die Grundlage ihrer Existenz. Als Spezies sind wir weder besonders groß, noch kräftig, noch schnell. Aber wir sind schlau und wir sind gemeinsam schlau (wenn auch nicht in jeder Situation).

Der Übergang von handeln zu schlau handeln liegt in der Repräsentation. Wir haben im Gehirn nicht nur den Verarbeitungsprozess, der entscheidet, was wir mit einem Ding vor uns tun können, sondern wir versuchen das Ding auch zu benennen, das heißt, zu kategorisieren (nicht zu verwechseln mit klassifizieren wie es Modelle im Computer tun). Und wir begnügen uns nicht damit, den Dingen Namen zu geben, wir erkennen Gemeinsamkeiten und Kombinationsmöglichkeiten zwischen Objekten und bilden so abstraktere Kategorien. Eine Teekanne kann ich auch als Gefäß, Schmuckobjekt, Wertanlage oder Erinnerungsstück betrachten. In Verbindung mit einer Tasse kann sie ein Teil eines Teesets sein und damit ein Teil meiner täglichen Teezeremonie. Und hier verlassen wir dann auch die Welt der Objekte, denn auch die Dinge, die wir tun, werden in Kategorien eingeteilt. Was genau ist eine Teezeremonie? Ein vorgespeicherter Plan? Eine Gewohnheit? Eine Zielvorstellung? Ein Regelwerk? Konzepte fließen ineinander über, es gibt keine klaren Grenzen. Trotzdem sind sie unglaublich nützlich, einerseits für die Kommunikation in Form von Sprache und andererseits um die Welt aus verschiedenen Blickwinkeln betrachten zu können.

Planen ist für mich so ein Blickwinkel. Wir schauen quasi von oben auf eine Kette von Handlungen und beschreiben sie in abstrakteren Begriffen. So wie Teeset eine kürzere Beschreibung ist für Teekanne und passende Tasse, ist ein Plan eine abstrakte Beschreibung von Handlungsschritten. Dabei können verschiedene Abstraktionsstufen aufeinander aufbauen und verschiedene Dimensionen zum Tragen kommen. Das Konstrukt muss weder logisch, noch vollständig, noch überlappungsfrei sein.

Wenn ich zurückdenke, wie ich todoListo entwickelt habe, fallen mir sofort ordentlich geschnitte Arbeitsblöcke ein: das User Interface gestalten, dieses als Frontend implementieren, eine Datenbankstruktur aufsetzen, das Backend programmieren, Testen. Aber das sind keine Planschritte, sondern Kategorien von Aufgaben, die ich in zwei Jahren parallel und abwechselnd getan habe. Nach einem initialen Prototyp habe ich ganz klassisch angefangen das User Interface graphisch zu entwerfen. Irgendwann habe ich angefangen dieses zu programmieren und selbst zu benutzen. Dabei sind mir immer wieder Schwachstellen aufgefallen und diese habe ich behoben. Damit habe ich natürlich auch das Design des User Interface geändert und genaugenommen ist das Programm niemals fertig, weil ich es ständig verbessere.

Studierenden wird gern erzählt, dass man zuerst mal genau überlegt, was das Ziel einer Software ist, dann ordentliche Module und Schnittstellen definiert und dieses Schema am Ende noch mit Code ausmalt. Davon träumen auch Führungskräfte, die zwar stolz auf ihrer Webseite verkünden, dass sie agil arbeiteen, sich aber doch insgeheim wünschen, dass das Wasserfallmodell funktionieren würde. Und es funktioniert sogar. Leider nur in äußerst einfachen Fällen. Wenn man genau wüsste, was zu tun ist und die einzelnen Module genau planen könnte, ist das Wasserfallmodell super. In Produktionsprozessen geht das auch, denn da wird immer dasselbe Produkt hergestellt. Aber bei jeder Form von Software, die über Übungsaufgaben im Studium hinausgeht, funktioniert das nicht mehr (mehr dazu in meinem Blogartikel Agile, Design and Buddhism). Da sind wir wieder bei Wicked Problems [1] und dem was man beim Planen im Alltag beobachtet: Ziel, Plan und konkrete Schritte entwickeln sich parallel.

Zurück zu Kategorisierung. Gern wird Abstraktion mit Hierarchien gleichgesetzt (die lassen sich nun mal so angenehm implementieren, ich liebe sie auch). Leider findet man auch diese weder als Struktur im Gehirn noch als Realität in unserer Welt. Zum Beispiel das Testen von todoListo. Das schreibt man gern als letzten Schritt auf die Liste, aber natürlich testet man immer wieder zwischendurch. Und das betrifft Frontend, Backend und die Infrastruktur (auch diese Kategorien sind nicht komplett eindeutig, aber hilfreich genug als Struktur). Testen ist also eher eine Art Querschnittsdimension, keine Zusammenfassung anderer Schritte (oder das noch zusätzlich). Auch die Gestaltung des User Interface kann man entweder als eigenen Schritt neben die Frontendprogrammierung stellen oder man sieht Entwurf ebenfalls als übergreifende Aufgabe, die auch alle anderen Bestandteile des Systems betrifft.

All diese Kategorien sind niemals ganz richtig und niemals ganz falsch und sie entwickeln sich mit der Zeit. Zum Beispiel habe ich Testen mal als Unterkategorie von Programmieren gesehen und mal als eigene Dimension neben Frontend, Backend und Infrastruktur. Fest steht, dass mir die Kategorien geholfen haben meine Arbeit zu organisieren und dass sie niemals einen linearen Plan dargestellt haben. Wie sich diese Kategorien entwickelt haben, zeige ich in diesem YouTube-Video: Prioritäten im Fluss – und wie todoListo entstand!

Ein Plan ist also eine Beschreibung einer Handlungsabfolge auf einer höheren Abstraktionsebene. Man kann darüber streiten, wo genau die niedrigste Abstraktionsebene ist und man von einer Handlung oder Aktion spricht statt von einem Plan. Ich denke, das ist gar nicht so wichtig und kommt auch auf den Kontext an. Wichtig ist, dass verschiedene Ebenen und Dimensionen von abstrakten Repräsentationen nebeneinander existieren und sich gegenseitig beeinflussen.

Das ist auch genau das Phänomen, das Newell und Simon [2] sowie Hayes-Roth und Hayes-Roth [3] empirisch beobachtet haben. Menschen springen zwischen Beschreibungsebenen und lösen quasi immer mehrere Aufgaben parallel. Zum Beispiel auf einer abstrakteren Ebene arbeitet man eine Marketing-Strategie aus, während man auf einer konkreteren einzelne Aktivitäten umsetzt. Während man dies tut (zum Beispiel eine Anzeige schalten), bekommt man neue Informationen (zum Beispiel Kundenanfragen) oder man erkennt Gelegenheiten (wenn man die Anzeige verlängert, kostet der zweite Monat nur halb so viel). Die Entscheidungen auf der konkreteren Ebene (die Anzeige zu schalten) beeinflusst die abstraktere Ebene (Maketingstrategie) ebenso wie anders herum.

Oder bei klassichen Disney Filmen: Für eine Szene konnten die Animatoren die Bildsequenzen genau in der Reihenfolge zeichnen wie sie später auch im Film erscheinen, als straight ahead action. Oder sie gingen pose to pose vor, das heißt, sie zeichneten erst bestimmte Schlüsselmomente und füllten die Bilder dazwischen später auf, sie haben quasi zuerst einen groben Plan gemacht. Und natürlich wurden beide Techniken gemischt:

Straight ahead action creates a more fluid, dynamic illusion of movement, and is better for producing realistic action sequences. On the other hand, it is hard to maintain proportions and to create exact, convincing poses along the way. Pose to pose works better for dramatic or emotional scenes, where composition and relation to the surroundings are of greater importance. [4]

Es gibt also nie einen Plan, sondern eine Ansammlung von konkreter oder abstrakter repräsentierten Arbeitsschritten, die man für sinnvoll oder notwendig erachtet, um ein Ziel zu erreichen. Planen passiert also gleichzeitig in verschiedenen Abstraktionen und ist ein dynamischer Prozess, bei dem Pläne (abstaktere Handlungsfolgen) erstellt, verfeinert und geändert werden, während die Handlungsschritte (konkretere Handlungsfolgen) ausgeführt, Gelegenheiten erkannt und neue Informationen gewonnen werden.

Ich rede mittlerweile lieber über Entscheidungsfindung als allgemeineren Begriff für die Auswahl unserer nächsten Handlung (im Endeffekt welchen Muskel wir als nächstes bewegen). Die Forschung zu Entscheidungen betrachtet jedoch meist nur flache Entscheidungen: buche ich einen Urlaub in die Karibik oder in die Südsee, kaufe ich den teuren oder den billigen Fernseher? Und der Begriff Planung hat durchaus seine Berechtigung, und sei es nur, weil wir ihn im Alltag so gern benutzen. Man kann Planen als Teil eines komplexen Entscheidungsprozesses sehen (nämlich als Abstaktion und Interaktion verschiedener Repräsentationen) und anders herum Entscheidungsfindung als Teilschritt bei der Planung (indem man sich für einen nächsten Schritt entscheidet, egal auf welcher Abstraktionsebene).

Wer beim Lesen jetzt einen Knoten im Kopf hat: mir geht es auch so. Douglas Hofstaedter spricht von seltsamen Schleifen [5]. Mit seinen seltsamen Schleifen begann vor einem Vierteljahrhundert meine Faszination für Intelligenz. Und ich bin davon überzeugt, dass wir Intelligenz nur verstehen können, wenn wir uns diesen Schleifen stellen und neue Wege finden sie zu modellieren und zu nutzen.

Ziele, Wünsche, Vorstellungen

Die Abstraktion durch Pläne ermöglicht es uns auch, abstraktere und längerfristige Ziele zu erreichen als jede andere Spezies. Ebenso einzigartig wie unsere Abstraktionsfähigkeit ist unsere Vorstellungskraft. Wir können uns Zustände der Welt vorstellen, die aktuell nicht so sind, vielleicht nie so sein werden und vielleicht nicht einmal sein können. So können wir uns problemlos vorstellen, dass Tiere sprechen oder dass wir die olympischen Spiele gewinnen (selbst wenn wir lieber auf der Couch sitzen als uns zu bewegen). Diese Vorstellungskraft ist der Kern von Zielen.

Aber nicht nur Ziele entstehen durch die Vorstellung einer anderen Situation, sondern auch Wünsche und Träumereien. Und diese enge Verwandtschaft führt zu viel Frust, zum Beispiel wenn PolitikerInnen oder Führungskräfte Ziele und Wünsche nicht unterscheiden. Beides sind Vorstellungen einer anderen Realität. Ein Ziel sollte aber zumindest mit der Absicht verbunden sein einen Plan auszuarbeiten und die entsprechenden Handlungsschritte umzusetzen (und das natürlich parallel und verzahnt). Ohne die Absicht zielgerichteter Handlung, haben wir es mit Wünschen zu tun. Und diese werden allzu oft als Ziel bezeichnet.

Nehmen wir das 1,5 Grad Klimaziel. Abgesehen davon, dass es den Ökosystemen herzlich egal sein dürfte, welche Zahl bei irgendwelchen politischen Verhandlungen herausgekommen ist, ist das ganze eher als Wunsch einzustufen. Selbst wenn irgendwo politische Maßnahmen beschlossen werden, die dazu beitragen könnten (lasst uns alle E-Autos fahren), haben wir weder das Verständnis noch die Möglickeiten genug Einfluss auf das Gesamtökosystem der Welt zu nehmen. Ich will damit nicht sagen, dass wir nichts tun sollten, nur weil wir das Gesamtproblem nicht in einem Aufwasch lösen können. Ich warne nur davor, sich durch das Vorhandensein eines formulierten Ziels einzureden, dass damit schon fast alles getan sei. Damit ist überhaupt nichts getan. Und wenn wir es schaffen könnten, die Klimaerwärmung auf unter 1,5  zu halten, wäre das doch noch viel besser. Aber es ist so viel einfacher sich zu freuen, dass die ganze Welt sich auf eine Zahl geeinigt hat, als der Tatsache ins Auge zu sehen, dass man mit ein wenig die Technik wird's schon lösen nicht weiterkommt.

In einem früheren Blogartikel über Ziele habe ich bereits ausführlich diskutiert warum Ziele als Zielzustände nicht besonders hilfreich sind. Eines der Probleme, wenn man Ziele als Wunschzustände versteht, ist dass man die Ressourcen ignoriert. Ich kann mir ganz viele Dinge vorstellen, die ich alle erreichen möchte: fließend Finnisch sprechen, Posaune spielen, einen Marathon gewinnen, Bonsais züchten, einen Kometen entdecken. Blöd nur, dass jedes einzelne dieser Ziele zumindest sehr viel Zeit in Anspruch nehmen würde und einige auch noch eine ganze Portion Glück brauchen (egal wie lange ich in den Himmel schaue, vielleicht kommt einfach kein Komet vorbei).

Ein nützlicheres Zielkonzept sind Prioritäten, zum Beispiel könnte ich mir vornehmen mehr Zeit mit Sport als mit Lesen zu verbringen. Dieses Ziel unterstützt mich bei meinen Entscheidungen. Wenn ich nach der Arbeit überlege, ob ich mich mit einem Buch in meinen Lesesessel kuschel oder doch lieber die Laufschuhe raushole, dann ist die Antwort klar. Genauso kann in einem Unternehmen das Ziel ein bestimmtes Produkt zu entwickeln als Entscheidungshilfe dienen das entsprechende Team mit qualifizierten Leuten und ausreichendem Budget auszustatten (und damit automatisch diese Ressourcen anderen Projekten zu entziehen oder vorzuenthalten).

Aber wieso sprechen wir so gern von Zielen als Zuständen? Auch ich habe mir für heute das Ziel gesetzt diesen Artikel fertig zu schreiben, obwohl ich genau weiß, dass ich mir eigentlich vornehmen sollte meine Zeit heute vornehmlich für das Schreiben dieses Artikels einzuplanen ohne mich daran festzubeißen, dass er fertig werden muss. Ich denke, dass Ziele als Zustände ein wichtiger Mechanismus für Motivation sind. Wieso sollten wir überhaupt irgend etwas in der Welt tun außer nach dem nächstbesten Stück Nahrung zu greifen und dieses zu verspeisen? Wenn wir uns vorstellen wie gut wir uns fühlen werden, wenn wir einen bestimmten Zustand hergestellt haben, gibt uns das den Antrieb, durch Planen, Entscheiden und Handeln diesen Zustand herbeizuführen. Wünsche sind also ein nützlicher Ausgangspunkt für Ziel, quasi Proto-Ziele. Der Wunsch kann stark genug sein uns zu motivieren, etwas zu tun. Ich sehe leider nur allzu oft, dass das Tun unterschätzt wird. Wünsche zu formulieren ist kostenlos, sie zu einem Ziel zu machen und dieses sogar zu erreichen, ist schmerzhaft.

Unsere Vorstellungskraft ist sowieso ein spannendes Thema. In vielen Fällen malen wir uns Wunschzustände viel schöner aus als sie am Ende sind. Ich habe vier Jahre davon geträumt, wie toll es sein wird endlich meinen Doktortitel zu haben. Und wie habe ich mich tatsächlich gefühlt? Na ja, es gab gar nicht den einen Moment wo die Promotion vorbei war. Nach der Abgabe war klar, dass noch die Verteidigung kommt. Nach der Verteidung war ich stolz bestanden zu haben, aber ich durfte mich noch nicht Doktor nennen. Bis es soweit war, dass ich meine Urkunde in der Hand hatte, war die ganze Aufregung schon wieder vorbei und das Geld, das ich mir für ein Tattoo der beiden Buchstaben "Dr" beiseite gelegt hatte, schon längst wieder ausgegeben. Aber die Vorstellung war motivierend genug um das ganze zum Ende durchzustehen, also hat der Wunsch seinen Zweck erfüllt.

Es gibt aber auch das entgegengesetzte Phänomen, dass wir uns ständig Sorgen machen über die Zukunft. Diese Ängste sind wahrscheinlich ein Mechanismus, um Fehler in unseren Plänen zu finden. Wir nehmen uns Dinge (grob) vor, die wir machen werden um unsere Zielvorstellung zu erreichen. Da wir nie die komplette Kontrolle über die Welt haben, ist es absolut sinnvoll, den Plan vorher auf mögliche Probleme zu testen. Was passiert, wenn das Mammut mich zu früh wittert und auf mich losgeht? Ohne solche Ängste und Zweifel hätten unsere Vorfahren die Mammutjagd vielleicht nicht überlebt und uns gäbe es gar nicht.

Nur haben wir aktuell das Problem, dass unsere Welt irgendwie zu voll geworden ist. Wir nehmen uns so viele Dinge vor, schmieden so viele Pläne und es gibt unendlich viele Möglichkeiten, wie diese Pläne schief gehen können. Und der Kern dieses Problems ist mal wieder die Optimierung. Zum Beispiel das Schienennetz der Bahn: das ist ausoptimiert und sobald eine Schneeflocke fällt oder sich irgendwo eine Schraube lockert, kommt der ganze Verkehr zum erliegen. Insofern sind meine Ängste bei jeder Bahnfahrt, an welchem Bahnhof ich wohl stranden werde, vollkommen berechtigt und es ist nicht verwunderlich, dass wir sowohl gesellschaftlich als auch privat in einem ständigen Was-könnte-schief-gehen-Modus sind. Selbst wenn es gerade keine akuten Probleme gibt, ist unser Gehirn damit beschäftigt sich welche auszudenken. Und dann rennen wir alle zum Meditationswochenende oder probieren den neuesten Hype an Beruhigungsmittelchen. Die Akzeptanz unserer limierten Kontrolle über die Welt, nicht nur in der Yogastunde, sondern als gelebte Unoptimierung, wäre zumindest ein Schritt in die richtige Richtung.

Unsere Vorstellungskraft ist zwar ungemein nützlich, leider nicht immer korrekt. Aber wir können ihr auf die Sprünge helfen, zum Beispiel indem wir Planen. Sagen wir, ich möchte ein Buch schreiben. Dann ist das erstmal ein sehr abstrakter Wunsch. Ich kann mir vielleicht vorstellen, wie es sich anfühlt, wenn mir jemand einen Buchpreis überreicht. Aber wenn es darum geht, ob ich den Wunsch zu einem Ziel mache, sollte ich auch die notwendige Zeit einkalkulieren. Das kann ich tun, indem ich mir vorstelle, was alles nötig ist, um ein Buch zu schreiben: ein Thema ausdenken, vielleicht tiefer recherchieren, eine Gliederung erstellen, den Text schreiben, Probelesen, Umschreiben usw. Ich könnte mir zu diesen Schritten einen Zeitplan aufstellen. Dieser wäre definitiv falsch: ich würde die Schritte linear einplanen (ok, ich nicht mehr, aber viele andere), ich würde die Zeit für jeden Schritt viel zu optimistisch abschätzen und es gäbe Schritte und mögliche Probleme, die ich ganz in meinem Plan vergessen hätte. Trotzdem wäre der Plan hilfreich, weil er mir zumindest eine untere Grenze des Zeitaufwandes gibt. Und wenn ich dabei schon feststelle, dass ich diese Zeit gar nicht gewillt bin zu investieren, dann kann ich den Wunsch zu den Akten legen.

Wir haben also wieder seltsame Schleifen: Unsere Vorstellungskraft denkt sich Wunschzustände aus, durch Planen können wir diese konkretisieren (der Plan ist eine abstrakte Repräsentation, die hilft ein Thema konkreter zu fassen!) und eventuell zu einem Ziel erheben, welches wir wiederum durch Planen und damit verwobene Handlungen erreichen können. Bei ausreichend komplexen Zielen wird ein Plan aus sehr abstrakten Schritten bestehen, die eigentlich selbst wieder Ziele (oder Wünsche?) sind und durch weitere Pläne konkretisiert werden. Dabei interagieren alle Abstraktionsebenen und Repräsentationen mit allen anderen. Durch Gelegenheiten ergeben sich wiederum Ziele, die in Konkurrenz zu bestehenden Zielen priorisiert werden. So kann es leicht sein, dass mein Wunsch, einen Buchpreis zu gewinnen, dazu führt, dass ich einen Blogartikel über das Thema Planen und Entscheiden schreibe.

Mein Eindruck ist, dass je komplexer Aufgaben werden, desto mehr versuchen Organisationen ihre Mitglieder von diesem natürlichen Denkprozess abzuhalten und stattdessen zu Optimierung zu zwingen (z.B. durch KPIs oder Entscheidungsmatrizen, alles Werkzeuge zur Optimierung). Wieso verstärkt man nicht einfach die natürlichen Denkprozesse, die für komplexe Aufgaben mit unbekannten Parametern offensichtlich gut funktionieren? Ein Beispiel, wie man Denkprozesse nicht unbedingt formalisiert, aber bewusster ausführt, ist die Walt-Disney-Methode. Die Legende sagt, dass wenn Walt Disney neue Ideen ausarbeitete, nahm er bewusst abwechelnd drei Rollen ein, wobei er soweit ging, sich in jeder Rolle auf einen anderen Stuhl zu setzen um auch physisch eine andere Position einzunehmen:

  • Der Träumer erlaubt sich Ideen auszuspinnen ohne Rücksicht auf ihre Realisierbarkeit. Im Grunde das, was unser Gehirn tut, wenn es Wünsche aufstellt.
  • Der Realist versucht die Träume mental in konkrete Arbeitsschritte umzusetzen, also einen groben Plan zu entwickeln. Wenn kein derartiger Plan zu finden ist, wird der Traum verworfen.
  • Der Kritiker versucht einen gefundenen Plan zu torpedieren und Gründe zu finden, warum er scheitern könnte, also genau das, was unser Gehirn auch tut durch Sorgen und Zukunftsängste.
Diese drei Rollen können in beliebiger Reihenfolge eingenommen werden und natürlich nicht nur einmal. Es ist auch möglich, die Methode in einem Team anzuwenden, in dem die Mitglieder je eine der Rollen einnehmen (und durchwechseln). Ich will damit nicht sagen, dass dies die einzige und perfekte Denkmethode ist. Sie ist aber ein gutes Beispiel dafür, dass der Wunsch in Organsiationen nach einer gewissen Formalisierung oder Explizitmachung der Entscheidungsfindung nicht automatisch bedeutet, dass man auf Optimierungstechniken zurückgreifen muss.

Fazit

Selbst bei einem Thema wie Planen, das von Anfang an Untersuchungsgegenstand der KI war, weil es so offensichtlich etwas mit Intelligenz zu tun hat, wissen wir nach 70 Jahren Forschung noch nicht einmal was wir da genau erforschen.

Das ist mein persönlicher Versuch einer Definition:

  • Plan: eine Beschreibung eines Handlungsablaufs in einer bestimmten Repräsentation
  • Ziel: ein Wunschzustand, den man versucht durch aktives Handeln zur Realität zu machen
Pläne und Ziele sind Bestandteile eines komplexen Prozesses aus Transformation von Wünschen zu Zielen, Erstellung und Ausführung von Plänen und dem Formieren neuer Ziele und Pläne. Dabei interagieren verschiedene kognitive Prozesse wie Gedächtnis, Wahrnehmung und Sprache. Insbesondere die einzigartige menschliche Eigenschaft sich nichtreale Zustände vorstellen zu können, ist ein wichtiger Baustein in diesem dynamischen System.

Ob meine Definition nützlich ist oder nicht, klar ist, was Planen nicht ist, nämlich Optimierung. Und das sollte Anlass geben, die Bedeutung, die wir ihr in unserer modernen Gesellschaft einräumen, zu überdenken. Optimierung hat durchaus nützliche Anwendungen in der Industrie, aber sie ist weder eine Erklärung für die vielseitige, flexible und interaktive Planungsfähigkeit von Menschen, noch definiert sie einen erstrebenswerten Goldstandard. Optimierung funktioniert unter bekannten Rahmenbedingungen. Wenn man jedoch optimiert, obwohl die Bedingungen nicht klar sind, baut man sich vulnerable Systeme, die bei jeder Störung den Geist aufgeben. Wenn wir Wünsche für Ziele halten, ist Enttäuschung vorprogrammiert, sowohl im Privatleben als auch in Organisationen. Unsere Welt passt sich nicht einfach unseren Vorstellungen an. Das kann frustrierend sein, aber auch unendlich faszinierend.

Sie überlegen KI in Ihrem Unternehmen einzusetzen?

Blogreihe Faszination Intelligenz

Seit meiner Jugend interessiert mich das Gebiet der künstlichen Intelligenz. Deshalb habe ich zunächst eine Universitätslaufbahn eingeschlagen bis hin zur Juniorprofessur, musste jedoch frustriert feststellen, dass das System Wissenschaft im Allgemeinen und die Forschung in der künstlichen Intelligenz im Besonderen nicht auf Innovation ausgelegt ist, sondern eher auf Konformität. Dann kam noch der große KI-Hype, der viel Publicity aber wenig wissenschaftlichen Fortschritt bringt. Am Ende hatte ich von dem Thema nur noch die Nase voll. Doch mit etwas Abstand finde ich meine Faszination an den Thema wieder und möchte diese mit anderen teilen. Diese Blogreihe ist für alle, die einfach mal (wieder) staunen wollen wie spannend, vielseitig und manchmal nervtötend komplex das Phänomen Intelligenz ist und wie viel es noch zu entdecken gibt.

← Zurück zur Blog-Übersicht