Views: 2031
Philipp Wehrli, 25. April 2003, überarbeitet am 16. Februar 2007 und am 6. Dezember 2009
Beim Induktionsproblem handelt es sich um das Schlüsselproblem der Erkenntnistheorie, nämlich um die Frage, in wie fern wir aus gemachten Erfahrungen auf zukünftige schliessen können. Dabei verwenden verschiedene Autoren den Begriff “Induktion” unterschiedlich. Manche meinen damit einen Schluss von Erfahrungen auf ein allgemeingültiges Gesetz, andere den Schluss auf eine begrenzte Anzahl weiterer Ereignisse, wieder andere meinen eine Wahrscheinlichkeitsaussage über zukünftige Ereignisse. Nicht selten werden die unterschiedlichen Definitionen durcheinander gebracht, was zu falschen Schlüssen führt.
Ich will hier diese Begriffsverwirrung klären und zeigen, wie wir gestützt auf Erfahrung Wahrscheinlichkeitsaussagen über zukünftige Ereignisse machen können. Ausserdem werde ich in Abschnitt drei das Ökonomieprinzip auf eine solide Grundlage stellen.
1. Problemstellung und verschiedene Definitionen des Begriffs “Induktion”
2. Ziffernfolgen
3. Einfachheit – Ockhams Messer – Ökonomieprinzip
4. Induktion in Ziffernfolgen
5. Induktion in der wirklichen Welt
6. Die Axiome
7. Schlussbemerkung
8. Weiterführende Literatur
1. Problemstellung und verschiedene Definitionen des Begriffs “Induktion”
David Hume erkannte die Bedeutung des Problems als erster. Er bewies, dass der Schluss von Erfahrungen auf ein allgemeingültiges Gesetz logisch nicht begründet werden kann. Demnach gibt es keine logische Rechtfertigung für die Induktion, – sofern man mit Induktion den Schluss auf ein allgemeingültiges Gesetz meint.
Wenn Philosophen behaupten, Induktionsschlüsse können nicht begründet werden, dann beziehen sie sich immer auf diesen Beweis oder einen späteren Beweis, der letztlich Humes Argument folgt. Bei all diesen Beweisen wird nur die Möglichkeit widerlegt, auf ein allgemeingültiges Gesetz zu schliessen. Viele Philosophen behaupten nun aber, auch die schwache Induktion, nämlich eine Wahrscheinlichkeitsaussage über ein zukünftiges Ereignis sei nicht begründbar. Betrand Russell z. B. schreibt in seinem Buch ‚Probleme der Philosophie‘ zum Thema Induktion (Rus 1):
„Die Erfahrung kann einsichtigerweise das Induktionsprinzip für die bereits beobachteten Fälle bestätigen; was aber die noch nicht beobachteten Fälle betrifft, so ist es allein das Induktionsprinzip selbst, das Schlüsse vom Beobachteten auf das noch nicht Beobachtete rechtfertigen kann. Alle Schlüsse, die wir auf der Grundlage unserer Erfahrung auf die Zukunft oder auf die von uns nicht erlebten Teile der Gegenwart oder der Vergangenheit ziehen, setzen das Induktionsprinzip voraus; wir können daher niemals die Erfahrung benutzen, um das Induktionsprinzip zu beweisen, wenn wir uns nicht einem unendlichen Regress (dem ständigen Wiederauftauchen des vorausgesetzten Induktionsprinzips ausliefern wollen. Wir müssen das Induktionsprinzip aufgrund seiner eigenen Evidenz akzeptieren oder den Versuch einer Rechtfertigung unserer Erwartungen für die Zukunft aufgeben. Wenn das Prinzip unhaltbar ist, dann dürfen wir nicht aus einem vernünftigen Grund erwarten, dass die Sonne morgen früh aufgehen wird, dass Brot immer nahrhafter sein wird als Steine, dass wir fallen werden, wenn wir vom Dach unseres Hauses springen. Wenn sich uns etwas nähert, das wie unser bester Freund aussieht, dann gibt es keinen Grund für die Annahme, dass dieser Körper nicht vom Geist unseres schlimmsten Feindes oder von einem völlig Unbekannten bewohnt wird. – Unser gesamtes Verhalten beruht auf Assoziationen, die in der Vergangenheit funktioniert haben und von denen wir annehmen, dass sie auch in Zukunft funktionieren werden. Die Zuverlässigkeit dieser Annahmen hängt von der Gültigkeit des Induktionsprinzips ab.“ …
„…es gibt kein Argument, das von einem noch einfacheren, noch evidenteren Prinzip ausgeht und uns das Induktionsprinzip als Folgerung liefert.“
Ich stimme mit Russell völlig überein, was die überragende Bedeutung der Induktion angeht. Die Induktion durchdringt unseren täglichen Gedankengang vollkommen. Bei der Induktion, die Russell oben schilderte, handelt es sich aber nicht um einen Schluss auf ein allgemeingültiges Gesetz! Um mir das Vertrauen zu geben, dass die Sonne morgen wieder aufgeht, brauche ich keineswegs ein allgemeingültiges Gesetz. Eine sehr hohe Wahrscheinlichkeit für dieses Einzelereignis reicht vollkommen.
Umgekehrt frage ich mich, wie bedeutsam ein allgemeingültiges Gesetz zum Sonnenaufgang für mich wäre. Natürlich reden Physiker von Naturgesetzen. Aber nach der Unbestimmtheitsrelation gibt es durchaus eine Möglichkeit, dass die Sonne morgen nicht aufgeht oder dass sogar zwei Sonnen da sind. Die Alltagsphysik bricht nicht zusammen, wenn sehr seltene Ausnahmen erlaubt sind. Es ist also wichtig, die verschiedenen Definitionen von Induktion auseinander zu halten:
1. Wichtig für die Erkenntnistheorie sind Wahrscheinlichkeitsaussagen über eine eng beschränkte Menge möglicher Ereignisse. (Ich nenne diesen Schluss schwache Induktion)
2. Widerlegt ist die Möglichkeit, allgemeingültige Gesetze aus der Erfahrung abzuleiten (starke Induktion).
In diesem Zusammenhang muss auch Sir Karl Poppers Auffassung erwähnt werden. Popper kam zum Schluss, dass Induktion gar nicht existiert. Diese Behauptung lässt sich mit dem Begriff der Information begründen. Ein induktiver Schluss kann definiert werden als ein Schluss, bei dem die Information zunimmt. Wenn es solche informationsvermehrenden Schlüsse gäbe, würde dies zu Widersprüchen führen. Hier wird aber der Begriff “Induktion” wieder anders verwendet. Durch Poppers Widerlegung der Induktion werden nämlich die “Induktionsschlüsse”, die Russell zitiert, keineswegs ausgeschlossen. Vielmehr müssten sie, wenn wir Poppers Begriffe konsequent anwenden, Deduktionen genannt werden.
Dies werde ich im folgenden zeigen. Ich werde zeigen, wie die Annahme, die Sonne morgen gehe wieder auf, begründet werden kann. Manche wie Bertrand Russell werden meine Methode “Induktion” nennen, andere, wie Sir Karl Popper, “Deduktion”. Ich werde mit Hilfe von Bayes Formel zeigen, wie wir basierend auf Erfahrungen begründete Wahrscheinlichkeitsaussagen über zukünftige Ereignisse machen können. Soweit mir bekannt ist, hat noch niemand diesen fundamentalen Satz der Erkenntnistheorie bewiesen. Meine einzige zusätzliche Annahme ist, dass wir die meisten Dinge tatsächlich ungefähr so erlebt haben, wie wir sie in Erinnerung haben.
2. Ziffernfolgen
Um die Grundlage der Induktion besser diskutieren zu können, gehe ich von einem einfachen Beispiel aus. Ich nehme an, mir werde eine Folge bestehend aus den Ziffern Null und Eins vorgelesen. Weiter nehme ich an, dass ich eine einfache Regel in der Zifferfolge entdecke, z. B. sind alle Ziffern, die ich gehört habe, Einsen. Die Frage lautet nun: Wenn ich eine gewisse Zeit lang nur Einsen gehört habe, sollte ich dann damit rechnen, dass die nächste Zahl wieder eine Eins ist oder kann ich über die folgenden Ziffern überhaupt nichts aussagen?
Dieses Beispiel scheint aus der Luft gegriffen und ziemlich abstrakt. Tatsächlich wird aber z. B. alles, was auf einem Computerbildschirm geschrieben wird, durch Nullen und Einsen dargestellt. Daher können auch alle Messungen der Physik als Ziffernfolgen mit Nullen und Einsen dargestellt werden. Wenn also die Induktion bei Ziffernfolgen erlaubt ist, dann auch in der Physik und damit auch in sehr vielen Fragen in unserem Alltag. Zum Beispiel könnte für jede Beobachtung, in welcher das Gravitationsgesetz innerhalb der Beobachtungsgenauigkeit stimmt, eine 1 stehen und sonst eine 0.
Betrachten wir zunächst Ziffernfolgen der Art:
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0 ? ? ? … (zuerst n Einsen, dann plötzlich eine Null und weiter verfolge ich die Entwicklung nicht.)
In die Natur übertragen würde diese Ziffernfolge z. B. heissen: Ich sehe n Steine, die hinunterfallen und plötzlich kommt einer, der einfach in der Luft hängen bleibt oder der wild in irgendeine Richtung davonfliegt, nur nicht hinunter. Zur Vereinfachung spreche ich von nun an nur noch von Ziffern und ich nehme an, eine solche Ziffernfolge werde mir vorgelesen. Wer an die Induktion glaubt, wird sagen:
1. Wenn ich sehr viele Einsen nacheinander gehört habe, ist es (nach meinem Wissen) wahrscheinlicher, dass die folgende Ziffer wieder eine Eins ist.
Wer nicht an die Induktion glaubt, wird sagen:
2. Eine Null kann irgendwann kommen und ich muss jederzeit damit rechnen, unabhängig davon, wie viele Einsen schon da waren.
Eine dritte Denkart ist kompensatorisch:
3. Wenn jetzt schon so viele Einsen kamen, sind sie wohl bald ‚aufgebraucht‘. Deshalb wird es immer wahrscheinlicher, dass mal eine Null kommt.
Bemerkenswerterweise sind alle drei Denkweisen richtig – je nachdem, von welchem Modell wir ausgehen. Ich habe nämlich nichts darüber gesagt, wie die Zahlenfolgen zustande kommen. (Auch, weshalb das Gravitationsgesetz gilt, bzw. bis jetzt immer galt, wissen wir nicht). Ich könnte mir z. B. folgendes vorstellen:
Zu 2. Ein Mann würfelt. Wenn er eine 1, 2, 3, 4 oder 5 würfelt, schreibt er eine Eins. Sobald er eine 6 würfelt, schreibt er eine 0. Nach diesem Modell ist Induktion nicht möglich. Die Wahrscheinlichkeit, dass die Einsenserie abbricht, ist immer 1/6.
Zu 3. Eine Glücksfee hat einen Sack mit einer schwarzen und 99 weissen Kugeln. Sie zieht Kugeln heraus, ohne sie zurückzulegen. Solange sie weisse zieht, schreibt sie Einsen auf. Sobald sie die erste schwarze Kugel erwischt, schreibt sie eine Null. Auch hier ist Induktion nicht möglich. Die Wahrscheinlichkeit, dass die Einsenserie abbricht, nimmt laufend zu je länger die Einerserie ist. Denn es sind ja immer weniger weisse Kugeln im Sack.
Zu 1. In diesem Beispiel wird die Sache etwas komplizierter, aber es wird sich herausstellen, dass dies der Normalfall ist. Ich habe bei 2.) vorausgesetzt, dass ich weiss, dass der Mann einen Würfel verwendet. Möglicherweise weiss ich dies aber nicht genau. Vielleicht wirft er auch eine Münze: Kopf bedeutet eine Eins, Zahl bedeutet eine Null. Dann wäre die Wahrscheinlichkeit, dass die nächste Ziffer eine Null ist, immer ½. Vielleicht würfelt er auch mit fünf Würfeln und schreibt erst dann eine Null, wenn er fünf Sechser gleichzeitig würfelt. Dann wäre die Wahrscheinlichkeit für eine Null bei jedem Wurf 1/65 = 1/7776.
Lustigerweise ist in diesem Fall die Induktion möglich. Ich mache dazu nur ein vereinfachtes Beispiel:
Angenommen ich weiss, dass der Mann entweder mit einem oder mit fünf Würfeln würfelt und angenommen, diese beiden Möglichkeiten sind a priori gleich wahrscheinlich. Dann kann ich nach einigen Würfen mit Hilfe von Bayes Formel Aussagen darüber machen, ob der Mann eher mit einem oder mit fünf Würfeln würfelt. Nun würfle ich 30 mal und ich erhalte 30 Einsen hintereinander. Ich weiss also, dass der Mann entweder mit einem Würfel in 30 Würfen nie eine 6 hatte oder mit fünf Würfeln in 30 Würfen nie fünf Sechser. Welches ist wahrscheinlicher?
Ich benütze die folgenden Bezeichnungen:
p(5W) = 0.5 = Die Wahrscheinlichkeit, dass der Mann mit fünf Würfeln würfelt, (bevor ich eine Ziffer gesehen habe). -> a priori-Wahrscheinlichkeit
p(1W) = 0.5 = Die Wahrscheinlichkeit, dass der Mann mit einem Würfel würfelt. -> a priori-Wahrscheinlichkeit.
p(30·1|5W) = (1-1/7776)30 = 0.996 = Die Wahrscheinlichkeit, dass die Ziffernfolge mit 30 Einsen beginnt, wenn der Mann fünf Würfel benutzt. (Bei jedem Wurf ist die Wahrscheinlichkeit für fünf Sechser 1/7776).
p(30·1|1W) = (1-1/6)30 = 0.004 = Die Wahrscheinlichkeit, dass die Ziffernfolge mit 30 Einsen beginnt, wenn der Mann einen Würfel benutzt.
(p(30·1|1W) · p(1W) + p(30·1|5W) · p(5W)) = 0.500 Die a priori-Wahrscheinlichkeit, dass am Anfang überhaupt dreissig Einsen kommen, egal auf welchem Weg.
Gesucht ist:
(5W|30·1) = Die aktualisierte Wahrscheinlichkeit, dass der Mann mit fünf Würfeln würfelt, nachdem ich weiss, dass die ersten 30 Ziffern Einsen sind.
Nach Bayes Formel gilt:
p(5W|30·1) = p(5W) · p(30·1|5W) : (p(30·1|1W) · p(1W) + p(30·1|5W) · p(5W)) = 0.9958
Mit anderen Worten: Wenn 30 Einsen kommen, weiss ich praktisch mit Sicherheit, dass der Mann fünf Würfel benützt. Die Wahrscheinlichkeit, dass z. B. die nächsten zehn Ziffern auch Einsen sind, ist damit praktisch gleich (1-1/7776)10» 1.
Bevor ich die 30 Einsen sah, war die Wahrscheinlichkeit für zehn Einsen hintereinander:
0.5 · (5/6)10 + 0.5 · (7775/7776)10» 0.58
Das heisst: In diesem Fall funktioniert die Induktion. Denn aufgrund der 30 Einsen darf ich schliessen, dass fast sicher noch weitere zehn Einsen kommen.
Betrachten wir nun noch einmal Beispiel 3. Die Glücksfee würde sagen, die Wahrscheinlichkeit nehme ständig zu, dass sie plötzlich eine schwarze Kugel zieht und deshalb eine Null schreibt. Aber die Glücksfee weiss, wie viele Kugeln etwa im Sack sind. Wir wissen dies nicht. Wir können es wieder nur mit Bayes Formel abschätzen. Nehmen wir z. B. an, die Fee habe zwei Säcke. Im einen befinden sich neun weisse und eine schwarze Kugel. Im anderen 99 weisse und eine schwarze. Wir wissen nicht, aus welchem Sack die Fee die Kugeln zieht. Und wir schätzen die a priori-Wahrscheinlichkeit für jeden Sack auf 0.5.
Wenn wir aber sehen, dass die Fee 9 weisse Kugeln aus dem Sack zieht, können wir nach Bayes Formel plötzlich fast mit Sicherheit sagen, dass diese Kugeln nicht aus dem kleinen, sondern aus dem grossen Sack stammen (Die exakte Berechnung sei dem Leser überlassen). Ausserdem wissen wir, dass -falls sie wirklich den zweiten Sack gewählt hat- in diesem nun noch 90 weisse und nur eine schwarze Kugel sind.
Mit diesem neuen Wissen erwarten wir viel eher eine weitere weisse Kugel. Für uns hat sich die Wahrscheinlichkeit für eine weitere weisse Kugel vergrössert, obwohl sie für die Fee kleiner wurde. Die Induktion funktioniert also auch in diesem Fall, solange wir nicht zum vornherein wissen, wie viele Kugeln im Sack sind.
Die obigen zwei Fälle sind sehr speziell. Denn erstens haben wir ziemlich viel Vorwissen darüber, wie die Folgen zustande kommen. Und zweitens setzen wir voraus, dass die Ziehung nach dem Induktionsschluss genau gleich ablaufen wird, wie davor. Interessant ist nun die Frage, ob die Induktion auch z. B. für das Gravitationsgesetz gilt, wo wir dieses Vorwissen nicht haben. Bevor ich diese Frage diskutiere, muss ich aber noch eine weitere Frage der Erkenntnistheorie beantworten.
3. Einfachheit – Ockhams Messer – Ökonomieprinzip
Eine der wichtigsten Grundregeln der Naturwissenschaften ist das Ökonomieprinzip (oft auch ‚Ockhams Messer‘ genannt), das besagt: „Annahmen und Hypothesen dürfen nicht über das Notwendige hinaus vermehrt werden.“ (Ursprünglich lateinisch: „Entia non sunt multiplicanda praeter necessitatem.“) Ockhams Messer ist ein entscheidendes und ständig angewendetes Kriterium, ob eine Theorie gut ist oder nicht. Leider ist bis heute überhaupt nicht klar, weshalb es gilt. Meiner Ansicht nach folgt Ockhams Messer direkt aus Bayes Erkenntnisformel und aus unserer Erfahrung.
Um dies zu zeigen, will ich wieder nicht Weltmodelle oder Theorien der Naturwissenschaften betrachten, weil dies viel zu kompliziert ist. Wie oben betrachte ich Ziffernfolgen, von denen ich jeweils nur gewisse Ausschnitte kenne, und zwar hier nicht notwendigerweise den Anfang. Ich versuche, auf Grund dieser Ausschnitte weitere Ziffern zu erraten.
Zunächst einmal muss ich definieren, was eine ‚einfache Erklärung‘ ist.
Definition:
Eine einfache Erklärung für eine Ziffernfolge liegt vor, wenn ich die Ziffernfolge stark komprimiert schreiben kann. ‚Komprimiert‘ heisst, ich brauche nicht alle Ziffern aufzuzählen, um die Folge zu definieren. Wenn ich z. B. sagen kann: ‚Die Ziffernfolge besteht aus lauter Einsen‘, so ist diese Beschreibung offensichtlich viel kürzer, als wenn ich die ganze Folge aufzählen müsste. Anderes Beispiel: Wenn ich weiss, dass jede zweite Ziffer eine Null ist, spare ich ebenfalls viel Zeit, denn ich muss jetzt nur noch die andere Hälfte der Ziffern nennen. Je kürzer meine Beschreibung einer Ziffernfolge ist, desto einfacher ist die Beschreibung. So soll ‚Einfachheit‘ definiert sein.
Nun denke ich mir zwei mögliche ‚Welten‘, nämlich zwei Schachteln K und E, welche Ziffernfolgen enthalten, die auf Papier geschrieben sind. Die Ziffernfolgen in Schachtel K sind kompliziert oder reine Zufallsfolgen, sie sind also nicht stark oder überhaupt nicht komprimierbar (K steht für kompliziert). Um eine Ziffernfolge aus K zu definieren, brauche ich ein aufwändiges Regelwerk oder ich muss sie sogar vollständig aufzählen. Kurze Definitionen gibt es nicht. Es kann zufälligerweise vorkommen, dass ein sehr langer Ausschnitt einer Ziffernfolge aus Schachtel K stark komprimierbar ist, also z. B. aus fünfzig Einsen in Folge besteht. Aber wenn ich willkürlich irgendeinen Ausschnitt aus irgendeiner Folge aus K wähle, so ist die Wahrscheinlichkeit für einen solchen Zufall ausserordentlich gering. Es gibt sogar einzelne Folgen in K, die zufälligerweise auch vollständig in einfache Regeln gefasst werden könnten und nur unnötigerweise sehr kompliziert aufgeschrieben wurden. Solche Folgen sind aber eine winzige Minderheit. Entscheidend ist: Wenn ich eine Folge aus K ziehe, darf ich a priori nicht erwarten, dass sie einfach ist.
Die Ziffernfolgen aus Schachtel E sind einfach, also komprimierbar. Wenn ich aus E eine Folge wähle und davon einen längeren Ausschnitt betrachte, so könnte dieser Ausschnitt auch kürzer geschrieben werden, als dies durch Aufzählen aller Ziffern möglich ist. Es ist allerdings nicht sicher, ob ich diese kürzere, also komprimierte Form auch finde.
Ich wähle nun zufällig eine der Schachteln K oder E, ohne zu schauen, welche ich erwische. Ich ziehe aus dieser Schachtel einen Zettel und lese einen längeren Auschnitt der Ziffernfolge. Ich stelle fest, dass die Ziffernfolge dieses Ausschnitts einer überraschend einfachen Regel folgt. Darf ich daraus schliessen, dass der Zettel aus Schachtel E kommt und dass damit auch sonst grosse Teile der Ziffernfolge einfachen Regeln folgen?
Die Frage lässt sich wieder nach Bayes Formel beantworten:
p(E|e) = p(E) · p(e|E) : (p(e|E) · p(E) + p(e|K) · p(K))
Dabei ist:
p(E|e) = Die Wahrscheinlichkeit, dass der Zettel aus Schachtel E stammt, wenn ich für den gelesenen Ausschnitt eine einfache Regel finde.
p(E) = Die Wahrscheinlichkeit, dass ich überhaupt einen Zettel aus Schachtel E ziehe, (bevor ich weiss, dass der gelesene Ausschnitt einfach ist). -> a priori-Wahrscheinlichkeit, also Wahrscheinlichkeit vor der Wahl der Schachtel.
p(K) = Die Wahrscheinlichkeit, dass ich einen Zettel aus Schachtel K ziehe. -> a priori-Wahrscheinlichkeit.
p(e|E) = Die Wahrscheinlichkeit, dass der Ausschnitt einer Ziffernfolge aus Schachtel E einfach ist und ich dies auch merke.
p(e|K) = Die Wahrscheinlichkeit, dass der Ausschnitt einer Ziffernfolge aus Schachtel K einfach ist und ich dies auch merke.
(p(e|E) · p(E) + p(e|K) · p(K)) = Alle Möglichkeiten, dass ich einen einfachen Ausschnitt aus einer Ziffernfolge lese und dies auch merke.
Im Beispiel der Schachteln und Ziffernfolgen könnten die Wahrscheinlichkeiten z. B. so aussehen:
p(E) = 0.1
p(K) = 0.9
Ich nehme also (vorsichtshalber) vor der Ziehung an, dass ich eher einen Zettel aus Schachtel K ziehe als aus E. Diese a priori-Wahrscheinlichkeiten muss ich schätzen. Es zeigt sich jedoch, dass der Einfluss dieser Schätzung sehr rasch vernachlässigbar wird, wenn ich mehrere Zettel aus der gleichen Schachtel betrachte. Weiter sei:
p(e|E) = 1
- h.: Ich nehme an, dass ich Einfachheit mit Sicherheit erkenne. Ich hätte auch p(e|E) » 1 setzen können.
p(e|K) = 0.01
- h.: In der Schachtel mit den Zufallsfolgen gibt es fast keine, die einer einfachen Regel folgen. Vereinzelt kommen solche Fälle zwar vor, aber es sind seltene Zufälle. Wenn ein sehr kompliziertes oder gar kein Regelwerk vorliegt, so führt dies in den meisten Fällen auch zu einer komplizierten Folge. Deshalb ist p(e|K) klein.
Damit ist:
p(E|e) = p(E) · p(e|E) : (p(e|E) · p(E) + p(e|K) · p(K)) = 0.92
Die Wahrscheinlichkeit, dass mein Zettel aus Schachtel E stammt, ist also wesentlich grösser, wenn ich feststelle, dass die gelesenen Ziffern einer einfachen Regel folgen. Wenn ein Ausschnitt aus einer Ziffernfolge eines beliebig gewählten Zettels einfach ist, darf ich davon ausgehen, dass der nicht gelesene Teil der Ziffernfolge und die Folgen anderer Zettel aus derselben Schachtel ebenfalls einfach sind. Dies ist ein äusserst bedeutsames und keineswegs triviales Resultat. Denn auf unsere Welt übertragen, bedeutet es:
Ökonomieprinzip
Wenn ich in meinen Naturbeobachtungen immer wieder einfache Regeln finde, dann sollte ich annehmen, dass diese Welt in vielen Bereichen von Naturgesetzen bestimmt wird. Wenn ich für ein Set von Naturbeobachtungen verschiedene mögliche Erklärungen habe, von denen eine besonders einfach ist, so ist diese mit der grössten Wahrscheinlichkeit richtig. |
In einer vereinfachenden Darstellung hätte ich das Ökonomieprinzip als Axiom voraussetzen können. Ich hätte dann -wie im Folgenden gezeigt- das Induktionsprinzip auf das Ökonomieprinzip zurückgeführt, was immer noch ein beträchtlicher Fortschritt ist.
4. Induktion in Ziffernfolgen
Wir können also mit Hilfe des Ökonomieprinzips erkennen, ob man mit weiteren einfachen Ziffernfolgen rechnen darf. Manche Leute hoffen nun, dass sich das Induktionsprinzip auf das Ökonomieprinzip zurückführen lasse. Dies geht aber nicht ohne weiteres.
Betrachten wir dazu die Folgen:
101101110110 101101110110 101101110110 10… (Periode 101101110110)
und
00000 00000 00000 00000 00000 00000 11111 11111 11111 11… (dreissig Nullen, danach Einsen)
Beide Folgen sind sehr einfach. Denn auch wenn ich nicht alle Ziffern aufschreibe, ist klar, wie die Folgen aussehen. Aber allein mit dem Kriterium der Einfachheit kann ich nach dreissig Nullen nicht schliessen, dass nicht plötzlich Einsen kommen. Nur Nullen wäre zwar einfacher als ein plötzlicher Wechsel. Aber ein einziger Wechsel macht die Sache auch nicht sehr viel komplizierter. Das Induktionsprinzip dreht sich im Wesentlichen um diese Wechsel der Regel. Ich definiere:
Definition:
Ausschnitte, die einer Regel folgen, heissen zeitlich symmetrisch. Ausschnitte, in denen die Regel wechselt oder völlig abbricht, bzw. Ausschnitte, in denen es überhaupt keine Regel gibt, nenne ich zeitlich asymmetrisch. Den Punkt, an dem die Regel wechselt, nenne ich Zeitpunkt der Asymmetrie. Komplizierte Folgen haben praktisch in jeder Ziffer eine zeitliche Asymmetrie.
Die entscheidende Frage ist: Wie gross ist dann die Gefahr, dass die Regel schon bei der nächsten Ziffer zusammenbricht? Kann ich darauf hoffen, dass die Regel wenigstens bei der folgenden Ziffer noch gültig ist? -Dies ist der eigentliche Induktionschluss. Im folgenden zeige ich, dass der Induktionsschluss auf die nächste Zukunft mit einiger Sicherheit tatsächlich erlaubt ist.
Gegeben sei eine Ziffernfolge, von der ich n hintereinanderliegende Ziffern kenne, die einer einfachen Regel folgen. Wo in der Ziffernfolge die n bekannten Ziffern liegen, sei völlig zufällig ausgewählt worden. Ich betrachte nun alle denkbaren Ziffernfolgen und untersuche sie auf die folgende Frage: Wie häufig kommen zeitsymmetrische Perioden der Länge n oder grösser vor? Für die qualitative Analyse unterscheide ich grob vier Typen:
1. Typ „<n“ sind Ziffernfolgen, in denen die meisten zeitsymmetrischen Perioden kürzer sind als n.
2. Typ „»n“ sind Ziffernfolgen, in denen die meisten zeitsymmetrischen Perioden gerade etwa n Ziffern lang sind.
3. Typ „>n“ sind Ziffernfolgen, in denen die meisten zeitsymmetrischen Perioden länger als n Ziffern lang sind.
4. Typ „>>n“ sind Ziffernfolgen, in denen die meisten zeitsymmetrischen Perioden viel länger als n Ziffern lang sind.
Für Bayes Formel benötige ich als erstes die a priori Wahrscheinlichkeiten p(<n), p(»n), p(>n) und p(>>n), also die a priori Wahrscheinlichkeiten dafür, dass die vorliegende Ziffernfolge vom entsprechenden Typ ist. Diese a priori Wahrscheinlichkeiten werden individuell geschätzt. Sie dürfen aber nicht vom Wissen abhängen, dass ich jetzt gerade n Ziffern gehört habe (sonst wären sie nicht ‚a priori‘). Weiter brauche ich die bedingten Wahrscheinlichkeiten:
1. p(n|<n), d. h.: Die Wahrscheinlichkeit, dass ich beim Betrachten von n Ziffern einer Folge vom Typ „<n“ eine Regel finde, der die n Ziffern folgen. Offensichtlich ist p(n|<n)»0, denn zeitsymmetrische Perioden der Länge n gibt es bei Folgen vom Typ „<n“ per definitionem fast nie.
2. p(n|»n)»0. Dies mag überraschen. Denn bei Folgen vom Typ „»n“ ist es durchaus möglich, zeitsymmetrische Perioden der Länge n herauszuschneiden. Das ist aber nicht gefragt. Gefragt ist vielmehr: Wenn ich willkürlich irgendeine Periode der Länge n aus der Folge herausschneide, sollte ich dann erwarten, dass dieser Ausschnitt zeitsymmetrisch ist? Man stelle sich dazu einen Zaun vor, dessen Pfosten 3m voneinander entfernt stehen. (Die Pfosten stehen für die zeitlichen Asymmetrien, die Zwischenräume für die symmetrischen Perioden der Länge n.) Wenn ich blind irgendwo 2.90m aus diesem Zaun herausschneide, steht in meinem Stück fast sicher ein Pfosten, also eine Asymmetrie. Selbst wenn der Pfostenabstand doppelt so gross ist wie das herausgeschnittene Stück, ist die Wahrscheinlichkeit, einen Pfosten mit herauszuschneiden, noch immer 50%.
Aus denselben Überlegungen gilt:
3. p(n|>n) ist eher klein.
4. p(n|>>n) Nur dieser Fall ergibt eine nennenswerte Wahrscheinlichkeit.
Betrachten wir nun Bayes Formel für die vier Typen, so ergibt sich:
1. p(<n|n) = 0
2. p(»n|n) » 0
3. p(>n|n) klein
4. p(>>n|n) gross
Oder in Worten:
Wenn ich von einer Ziffernfolge einen zufällig gewählten Ausschnitt von n Ziffern sehe, die alle einer einfachen Regel folgen, so ist die durchschnittliche Länge der zeitsymmetrischen Perioden fast sicher wesentlich grösser als n. Ich darf daher damit rechnen, dass noch einige weitere Ziffern derselben Regel folgen.
Wie weit kann ich mit Hilfe der Induktion in die Zukunft schauen? -Wieder hängt die Antwort von diversen Unsicherheiten ab, insbesondere von der a priori Wahrscheinlichkeit dafür, dass eine Ziffernfolge überhaupt keine zeitlichen Asymmetrien hat, bzw. dass in unserer Welt in der untersuchten Frage ein unabänderliches Naturgesetz gilt. Diese a priori Wahrscheinlichkeit muss jeder für sich abschätzen. Wenn in dieser Abschätzung grosse Unsicherheit besteht, kann man sich an die grobe Faustregel halten:
Wenn ich von einer Ziffernfolge eine zeitlich symmetrische Periode der Länge n beobachte und sonst nichts über die Ziffernfolge weiss, kann ich einigermassen sicher sein, dass etwa die folgenden n Ziffern ebenfalls der beobachteten Regel folgen. Wesentlich weiter reicht die Induktion nicht.
Es gibt nach obiger Argumentation keinen Hinweis darauf, ob die Ziffernfolge als ganzes zeitlich symmetrisch ist oder nicht. Die Induktion sagt also nichts über die Ziffernfolge als Ganzes aus, sondern immer nur über die nächsten paar Ziffern. Ob die Ziffernfolge aufgrund eines ewig gültigen Naturgesetzes wie gehabt weitergeht oder nur für sehr lange Zeit, ist reine Spekulation.
5. Induktion in der wirklichen Welt
Bei den Ziffernfolgen bin ich immer davon ausgegangen, dass der von mir gesehene Ausschnitt rein zufällig irgendwo aus der Ziffernfolge ausgewählt worden war. Dies ist die Voraussetzung dafür, dass ich die Wahrscheinlichkeitsrechnung anwenden darf. Ebenso darf ich die Induktion nur anwenden, wenn der Zeitpunkt des Schlusses zufällig ausgewählt wurde. Wenn ich dies nicht berücksichtige, könnte die Induktion mich in die Irre führen. Dies zeigen die folgenden Gedankenexperimente:
- Ein alter Mann denkt an seinem 80. Geburtstag über den Tod nach. Er stellt fest, dass er jetzt 80 Jahre lang gelebt hat und schliesst mittels Induktion daraus, er werde wohl noch weitere 80 Jahre leben. Offensichtlich ist in diesem Fall die Induktion nicht erlaubt. Denn wir wissen aus Erfahrung, wie alt Menschen etwa werden.
Die Induktion darf nur angewendet werden, wenn ich keinen Hinweis darauf habe, dass ich mich jetzt in einer grundsätzlich anderen Situation befinde als in der Zeit, aus der meine Erinnerungen stammen.
- Ich stehe während zwei Stunden vor einer Bank und sehe, dass alles friedlich ist. Ich schliesse daraus, dass mir keine Gefahr droht und dringe mit einem Revolver bewaffnet in die Bank ein. Entgegen meinem Induktionsschluss kommt es sogleich zu einer wilden Schiesserei.
Der Induktionsschluss verändert mich, weil ich nun anders über die Welt denke als zuvor. Wenn ich aufgrund dieser neuen Erkenntnis meine Situation grundsätzlich verändere, ist der Induktionsschluss nicht erlaubt.
Dies klingt nach einem Paradoxon: Wenn der Induktionsschluss die Situation verändert, darf er nicht gezogen werden. Das Problem taucht aber nur auf, wenn man einen einzelnen Induktionsschluss isoliert betrachtet. Im Unterschied zu den Ziffernfolgen ziehe ich im Alltag nie nur einen Induktionsschluss, der sich dann entweder bewahrheitet oder nicht. Ich ziehe Tag für Tag tausende von Induktionsschlüssen und weiss deshalb aus Erfahrung, welche Schlüsse die Situation wesentlich verändern. Ja, auch dieses Wissen beruht auf einem Induktionsschluss. Und auch diesen Schluss habe ich schon tausende von Malen in ähnlichen Situationen gezogen.
Ich habe tausend Mal festgestellt, dass die Steine auch dann hinunterfallen, wenn ich glaube, dass sie hinunterfallen. Und ich habe festgestellt, dass sie auch dann hinunterfallen, wenn ich glaube, dass es keine Rolle spielt, ob ich glaube, dass sie hinunterfallen. Und schon diese dritte Stufe des induktiven Schliessens läuft bei mir im Allgemeinen völlig unbewusst ab. Wann genau ich auf der vierten oder fünften Stufe angelangt bin, kann ich unmöglich sagen. Nur wenn ich beim induktiven Schliessen in eine höhere Stufe komme, verändert sich meine Situation. Wenn ich aber nicht einmal erkennen kann, wann dies geschieht, ist meine Situation in diesem Punkt nicht anders als bei all den anderen Schlüssen, die ich davor schon gezogen habe.
6. Die Axiome
Das schlagendste Argument gegen die reine Induktion ist die Feststellung, dass wir nicht mit Hilfe der Induktion beweisen können, dass die Induktion in unserer Welt gilt. Ich darf nicht sagen: „Weil die Induktion schon immer funktioniert hat, wird sie wohl auch noch in Zukunft funktionieren.“ Denn dieses Argument verwendet die Induktion, um von der Vergangenheit auf die Zukunft zu schliessen.
Ich behaupte, in meiner obigen Argumentation sei kein solcher Kreisschluss. Was genau habe ich denn vorausgesetzt? Es geht im Folgenden darum, die minimalen Bedingungen aufzuschreiben, damit ich Bayes Statistik anwenden darf. Entscheidend für den Erfolg meines Projekts sind dabei zwei Fragen:
- Reichen die Bedingungen aus, damit ich von der Vergangenheit auf die Zukunft schliessen kann?
- Sind die Bedingungen weniger aufwändig als das Induktionsprinzip?
Ich stütze mich auf 6 Bedingungen:
1. Ich kann einige meiner Erinnerungen als Elemente einer Menge ansehen, für die die Axiome der Mengenlehre gelten.
Damit ich zeitlich geordnete Muster, also Kausalität erkennen kann, fordere ich:
2. Für fast alle Erinnerungen gilt: Je zwei Erinnerungen lassen sich zeitlich ordnen in eine ‚ältere‘ und eine ‚jüngere‘.
Die Begriffe ‚älter‘ und ‚jünger‘ dienen der Anschauung und brauchen sich nicht auf den Begriff der Zeit zu stützen. Wichtig ist nur, dass zwischen je drei zeitgeordneten Erinnerungen Relationen gelten, welche die Regel befolgen: Wenn A ‚älter als‘ B ist und B ‚älter als‘ C, dann ist A ‚älter als‘ C.
Die Wahrscheinlichkeitsrechnung funktioniert nur, wenn der Zeitpunkt des Induktionsschlusses zufällig gewählt ist. Deshalb fordere ich:
3. Fast alle Erinnerungen beruhen auf Erlebnissen.
„Die Erinnerung E beruht auf einem Erlebnis“ heisst: Es gab eine Zeit, in der ich nur die Erinnerungen kannte, die ‚älter‘ sind als die Erinnerung E. Ich hatte eine Vermutung, wie die Erinnerung E einmal aussehen wird. Das ‚Erlebnis‘ ist entweder die Bestätigung oder die Widerlegung dieser Vermutung.
Die Idee hinter dieser Voraussetzung ist: Es gibt keinen Dämon, der mir falsche Erinnerungen vorspiegelt, um mich dann plötzlich mit einem völlig andersartigen Erlebnis zu überraschen.
Wenn ich mich daran erinnere, wie ich einen Tennisgegner 74 mal geschlagen habe, während es in Wirklichkeit nur einmal war, ziehe ich für das nächste Spiel falsche Schlüsse. Daher:
4. Fast jedes Erlebnis kommt in meiner Erinnerung genau so oft vor, wie es erlebt wurde.
Durch die Bedingungen 3 und 4 ist eine Bijektion definiert zwischen der Menge der Erinnerungen und der Menge der Erlebnisse, an die ich mich erinnere. Insbesondere sind deswegen auch die Erlebnisse -und nicht nur meine Erinnerungen- zeitlich geordnet.
Diese ‘Bijektion’ ist natürlich nie mit mathematischer Exaktheit erfüllt. Deshalb funktioniert die Induktion im Alltag auch oft zu Fehlern. Z. B. haben viele Badmintonspieler die Tendenz, sich an Siege besser zu erinnern als an Niederlagen (ich auch). Dies führt dazu, dass sie gegen einen bestimmten Gegner oft unzulässigerweise einen Sieg erwarten. Die Induktion funktioniert dann nicht perfekt, weil die Voraussetzungen 3 und 4 nicht exakt erfüllt sind. Wären sie aber überhaupt nicht erfüllt, so wäre überhaupt keine brauchbare Induktion mehr möglich. Menschen mit verzerrter Erinnerung schätzen auch die Zukunft falsch ein.
Weiter muss ich Hypothesen über die Zukunft bilden können:
5. Ausgehend von meinen Erinnerungen kann ich mir mögliche Welten ausdenken, wie die folgenden Ziffern (die nächste Zukunft) aussehen werden. Ich kann diese möglichen Welten zu einer Menge zusammenfügen, in der die Axiome der Mengenlehre gelten.
Insbesondere gilt: Die Menge der möglichen Welten, in welchen die ersten n Ziffern einer bestimmten Regel folgen, lässt sich unterteilen in zwei komplementäre Teilmengen, nämlich die Menge der Welten, in denen die Regel für die Ziffer n+1 gilt und die Menge der Welten, in denen sie dies nicht tut. Die Möglichkeit, dass überhaupt keine Ziffer folgt oder dass etwas völlig Neues, z. B. ein Buchstabe erscheint, wird zur zweiten Teilmenge gerechnet.
Ich muss diese Hypothesen auch überprüfen können. Deshalb:
6. Wenn ich in meinen Erinnerungen eine Regel gefunden habe, kann ich bei fast jedem weiteren Erlebnis beurteilen, ob es dieser Regel folgt oder nicht.
Ich vermute, dass diese 6 Bedingungen noch weiter reduziert werden können. Ich denke aber, mit dieser Formulierung bin ich auf der sicheren Seite.
Zusammengefasst lässt sich sagen:
Die Unsicherheit, ob Induktion erlaubt ist, ob ich also von meinen Erinnerungen auf die Zukunft schliessen darf, reduziert sich auf die Frage, ob ich überhaupt meinen Erinnerungen trauen darf und ob die Gesetze der Logik gelten.
Weshalb denke ich, dass durch meine Überlegung die Anzahl der Annahmen reduziert worden sei?
Selbst wenn ich das Induktionsprinzip als unreduzierbar betrachte, muss ich zusätzlich noch all meine obigen Annahmen hinzufügen. Denn sonst könnte ich die Induktion gar nicht durchführen. Zusätzlich setzt das Induktionsprinzip aber noch weitere Dinge voraus:
– Wenn ich das Induktionsprinzip voraussetze, mache ich Aussagen über das Verhalten der Aussenwelt. Die Welt muss so weitergehen, wie sie es schon immer getan hat. In meinen Annahmen kommen keine Ausagen über die Aussenwelt vor, abgesehen von der Forderung (3 und 4), dass die Erlebnisse in gleicher Weise zeitlich geordnet sein müssen wie meine Erinnerungen an sie. Ich stelle ganz einfach fest, dass die Welt sehr oft gewissen Regeln gehorcht, die zumindest über längere Zeit gleich bleiben. Sie könnte aber ebenso gut chaotisch sein. Dann würde ich eben feststellen, dass sie chaotisch ist.
– Bei der Induktion habe ich den Eindruck, hier werde ein ewig gültiges Naturgesetz vorausgesetzt: Die Steine müssen bis in alle Ewigkeit immer hinunterfallen, weil sie gar nicht anders können. Ich setze dagegen nur voraus, dass sie dies über eine grössere Zeitspanne hinweg tun. Vielleicht finde ich irgendwann zusätzlich eine Begründung, weshalb die Steine gar nicht anders können. Ich brauche dies aber nicht vorauszusetzen, um daran zu glauben, dass die nächsten paar Steine auch hinunter fallen werden.
– Nach meiner Analyse ist es grundsätzlich möglich, dass sich die Naturgesetze ändern. Das Induktionsprinzip dagegen setzt voraus, dass z. B. die Steine bis in alle Zukunft immer hinunterfallen müssen. Dies ist eine unbegründete und nicht falsifizierbare Annahme, die ich nicht benötige. Vielmehr kann mit meinen Argumenten abgeschätzt werden, wie gross die Gefahr ist, dass ein plötzlicher Wechsel der Naturgesetze in naher Zukunft stattfindet.
Aus diesen Gründen denke ich, meine Argumentation bringt eine klare Reduktion der Annahmen.
7. Schlussbemerkung
Ich rechne damit, dass es zu den obigen Überlegungen verschiedene Einwände gibt. Die Argumente sind wie gesagt auch nicht im Detail dargelegt. Insbesondere müsste eindeutiger definiert werden, was die Begriffe ‚komplexe‘ und ‚einfache Ziffernfolge‘ heisst, wenn es um Naturgesetze geht. Dennoch hoffe ich, gezeigt zu haben, dass wir in den eingangs gestellten Fragen keineswegs völlig im Dunkeln tappen. Das Induktions- und das Ökonomieprinzip sind keine ad-hoc-Annahmen, die nicht auf grundlegende Axiome zurückgeführt werden können. Ich hoffe, einen Anstoss gegeben zu haben, wie eine Erkenntnistheorie aufgebaut werden könnte.
Ich möchte diese sehr abstrakten Überlegungen mit einer Anekdote von Niels Bohr abschliessen, die ich mitsamt dem dazugehörigen Kommentar von Thomas Görnitz zitiere (Gör 1):
“Bei einem Skiurlaub auf einer Berghütte, die stilvoll ohne den zivilisationsüblichen Komfort ausgestattet war, war Bohr mit dem Abwasch der Gläser beschäftigt. Als er stolz das Ergebnis seiner Arbeit betrachtete, meinte er dazu: “Dass man mit schmutzigem Wasser und schmutzigen Tüchern schmutzige Gläser sauber bekommt – wenn man es einem Philosophen erzählen würde, er würde es nicht glauben. “
Mir gefällt diese Anekdote, die Carl Friedrich v. Weizsäcker gern und oft berichtet, ganz besonders gut, denn ich habe den Eindruck, dass unsere Versuche, die Welt zu verstehen, nur in ähnlicher Art und Weise ablaufen können. Wir müssen mit unscharfen und nur teilweise verstandenen Begriffen beginnen, die Welt zu beschreiben. Trotz dieser unzureichenden Ausgangslage gelingt es uns, diese Beschreibung immer besser werden zu lassen. Aber bisher sind wir stets in der Lage verblieben, keine tatsächlich gewisse Erkenntnis erhalten zu können. Physik ist, wie wohl jede Naturwissenschaft, ihrem Wesen nach nur Annäherung, nur Approximation.”
8. Weiterführende Literatur
Weiterführende Links auf dieser Homepage:
Bayes Erkenntnisformel
Was ist Realität?
Weiterführende Bücher:
Poundstone William, ‚Im Labyrinth des Denkens – Wenn Logik nicht weiterkommt: Paradoxien, Zwickmühlen, Sackgassen, Rätsel und die Hinfälligkeit des Wissens‘, (1992), Rowohlt Verlag GmbH.
Ein scharfsinniges Buch für scharfsinnige Denker, unterhaltsam geschrieben.
Russell Bertrand, ‘Probleme der Philosophie‘, (1967), Suhrkamp Verlag
von Randow, Gero, ‘Das Ziegenproblem – Denken in Wahrscheinlichkeiten’, (1992), Rowohlt Taschenbuch Verlag GmbH, Reinbek bei Hamburg
Sehr unterhaltsames allgemeinverständliches Buch über alltägliche Fehlüberlegungen aus der Wahrscheinlichkeitsrechnung. Nebenbei werden die Grundbegriffe der Wahrscheinlichkeitsrechnung und Bayes Erkenntnisformel sehr anschaulich erklärt.
Wickmann, Dieter, ‘Bayes-Statistik – Einsicht gewinnen und Entscheiden bei Unsicherheit’, (1990), Bibliographisches Institut & F.A. Brockhaus AG, Mannheim
Ein Mathematiklehrbuch zur Bayes Statistik für Profis.