KI und das Schreckgespenst BIAS – 805

Künstliche Intelligenz? Ja genau, der nächste billionenschwere Hype, die Lösung für alle Probleme jedes Unternehmens und der Menschheit überhaupt. Der Drops mit Digitalisierung und Transformation ist schon lange gelutscht, sorgt gelegentlich noch für etwas Aufregung.

Aber bei dem Begriff KI läuft es einem immer noch leicht über den Rücken – man denkt unweigerlich an den Film Terminator und der Aufstand der Maschinen‘. Wie wohl bekannt, haben diese irgendwann einmal beschlossen, die Menschheit sei überflüssig und sogar gefährlich für den Planeten – und haben die Menschheit deshalb ausgerottet. Naja, nicht ganz, sonst wäre der Film ja schon nach fünf Minuten zu Ende und es gäbe nichts Weiteres zu erzählen.

Aber erst einmal Entwarnung: heutige KI-Systeme sind von echter Intelligenz – wenn es sowas geben sollte – in etwa so weit entfernt wie das Brain einer Stubenfliege von Albert Einstein. Aber man weiß ja nie, wie schnell sich diese Rechenknechte entwickeln

1. das Problem

Nehmen wir doch mal meinen uralten Texas Instruments TI-30 von damals. Dort tippe ich eine beliebig hohe 5-stellige Zahl ein und ziehe davon jetzt irgendetwas ab. Einfach – und auf das Ergebnis des TI kann ich mich zu 100 Prozent verlassen.

Jetzt ins nächste Jahrhundert und zu einem Vergleichsportal im Internet. Dort frage ich z.B. die günstigsten Angebote für einen Kredit ab und bekomme das Ergebnis im Vergleich von 100 Banken in richtiger Reihenfolge angezeigt. Jetzt ist es aber an mir zu entscheiden – gibt es evtl. irgendwelche Zusatzfeatures wie Ratenpause oder ist mir eine bestimmte Bank besonders sympathisch? Ich entscheide!

Und jetzt genau hier kommt das eigentliche Problem mit KI-Systemen – die KI entscheidet! Das Problem: ist das Ergebnis, was die KI ermittelt hat überhaupt richtig? Und ist die Entscheidung, die KI auf dieser Basis getroffen hat, überhaupt richtig? Und wie können wir das überhaupt feststellen?

Ok, das Problem ist jetzt noch etwas abstrakt und schwirrt so in der Luft. Also ein Beispiel: ein großer Konzern erhält pro Jahr mehrere zehntausende Bewerbungen auf alle möglichen Stellen. Um jetzt die HR [Personalabteilung] zu entlasten, wird ein KI basiertes System eingeführt, was schon mal im Vorwege völlig ungeeignete Bewerber für eine bestimmte Stelle anhand von Lebenslauf und anhand von Vergleichen mit der Besetzung ähnlicher Positionen herausfiltern soll – prima, läuft!

Jetzt wird eine höhere Management- oder Abteilungsleiterposition neu ausgeschrieben, viele Bewerbungen gehen ein und das KI-System schlägt auf einmal nur noch männliche, weiße und Ü40 Bewerber vor – nix mehr mit weiblich, mit Migrationshintergrund und jünger, obwohl fachlich durchaus erfahren, geeignet und wertvoll für das Unternehmen?

Und es kommt noch schlimmer, es stellen sich auch ethische Fragen! In KI-basierten Systemen im Gesundheitsbereich können Krankheitsdiagnosesysteme z.B. in der Radiologie bestimmte Muster im Gewebe und damit Tumore schon im Frühstadium erkennen oder auch nicht – und entscheiden somit … über Leben und Tod!

Ok, jetzt nicht mal so schwarzmalen und einfach mal den gesunden Menschenverstand gegen den Rechenknecht einsetzen. Aber dennoch wird mit KI eindeutig eine rote Linie überschritten und die grundsätzliche Frage lautet: wie erkennen, kontrollieren oder besser wie verhindern man diesen Bias in der KI?

2. der Bias

So what? Der Begriff kommt aus der Psychologie oder genauer Verhaltenspsychologie und bezeichnet das Phänomen einer Verzerrung – in einer Umfrage kann durch gezielte suggestive Fragestellungen zu einer bestimmen Aussage hingeführt oder gezwungen werden, um damit bewusst oder unbewusst ein bestimmtes gewünschtes Umfrageergebnis zu erzielen.

Wie antworten wir auf eine Frage? Nun, zuerst ist da mal unsere Erfahrung, die wir in unserem Leben bisher gesammelt haben – verabschiede dich von der Mär objektiver Erfahrungen – Wahrnehmung ist immer subjektiv, selektiv und aktiv. Diese Erfahrungen sind unsere Datenbasis!

Und weiter? Nun, jetzt kommt es auf die Fragestellung an. Enthält die Fragestellung z.B. durch bestimmte Formulierung eine Wertung in die eine oder andere Richtung? Bin ich dadurch vielleicht gleich einverstanden mit der einen oder anderen Aussage? Diese Fragestellungen ist die Programmierung!

[und selbst ich als rein logisch denkender Vulkanier falle darauf gelegentlich immer noch rein]

Und genau so funktionieren auch KI basierte Systeme und genau hier liegen die Ansatzpunkte zu Optimierung und Kontrolle!

Datenbasis und Programmierung!

3. overfitted oder underfitted – Bias, Varianz und die ground line

What the hell? Wir bleiben erst einmal bei der Datenbasis, der Erfahrung eines KI-Systems und Basis der Entscheidungsfindung.

Klar, ein solches System muss mit Daten ‚gefüttert‘ werden – z.B. mit Bildern eines sich anbahnenden Krebsgeschwürs in der Radiologie oder – weniger dramatisch – mit den typischen Merkmalen der Besetzung einer bestimmten Stelle für Personalentscheidungen.

Doch was passiert, wenn der Rechenknecht mit zu vielen Daten zur Mustererkennung gefüttert wird – overfitted? Wir erinnern uns, das Personalsystem schlägt auf einmal nur noch männliche Bewerber und Ü40 ohne Migrationshintergrund vor. Eben statistische Verzerrung oder Bias.

Und umgekehrt, was passiert, wenn der Rechenknecht mit zu wenigen Daten zur Mustererkennung gefüttert wird – underfitted? Klar, jetzt kommt bei jeder Abfrage alles Mögliche und nur keine klare Aussage raus. Eben Varianz oder völlige Uneindeutigkeit.

Und jetzt noch einmal ein kurzer philosophischer Schwenk: die echte und einzige Wahrheit gibt es natürlich nicht – man kann nur versuchen, sich einer von allen Seiten akzeptierten ground line anzunähern und die Datenbasis auf overfitted oder underfitted hin zu untersuchen und zu optimieren.

Im Personalsystem lässt man z.B. einfach die Angaben zu Geschlecht, Alter oder sonstige diffamierende Daten außen vor – was aber letztendlich noch nicht vollständig garantiert, dass die KI und der Algorithmus in dieser Hinsicht nicht doch noch etwas ausknobelt.

4. die Abfrage

Und weiter im bunten Galopp, nachdem die Frage zur Datenbasis geklärt scheint. Und ebenso klar, selbst die dickste SQL Datenbank ist noch keine KI und liefert irgendwelche Mustererkennung oder Entscheidungen, dazu bedarf es jetzt schlauer Programmierung.

… Fortsetzung folgt!


Galerie-Nonfinito

die blaue oder die rote Pille?-1014

Lesezeit 5 Minuten

Morpheus zu Neo nach eindrücklicher Warnung und Darstellung zur Matrix: “Wählst Du jetzt die blaue oder die rote Pille?” … nun, eines der wohl berühmtesten Zitate aus der neueren Filmgeschichte und aus dem sicherlich bahnbrechenden Film “Matrix”.

Und weiter: wählt Neo die blaue Pille, so bleibt sein bisheriges und etwas langweiliges Leben als Programmierer in seinen gewohnten Bahnen – nichts wird sich ändern und alles läuft einfach so weiter. Mit der roten Pille jedoch wird er quasi aufgeweckt und landet in der – sicherlich nicht sehr charmanten – Realität!

Allgemein so weit bekannt – nicht das ich hier jetzt irgend jemanden beleidigen möchte – isch schwör yo Bro and Sis!

https://www.youtube.com/watch?v=GL5D7sm9ixo

Aber hier nochmal die Kurzfassung für alle homo neanderthalensis da draußen, die den Film doch tatsächlich nicht kennen sollten.

Was ist passiert? Künstliche Intelligenz oder die Maschinen haben einen Atomkrieg angezettelt – und zwar einen richtig heftigen – Grund oder Motivation dafür erst einmal unbekannt. Die Erde liegt also in Schutt und Asche und die Menschheit ist fast ausgerottet. Die Maschinen stehen jetzt vor dem Problem, woher Energie oder Strom nehmen? Naheliegende Sonnenenergie fällt aus, da sich die Erde durch den Krieg in einem nuklearen Winter befindet und wohl noch für die nächsten zehntausende Jahre von einer kilometerdicken Staubschicht umhüllt ist, durch die kein Sonnenstrahl mehr dringt.

Also versetzen die Maschinen die wenigen noch verbliebenen Menschen in ein künstliches Koma, lagern diese dann in speziellen Tanks und nutzen die Körperwärme zur Stromerzeugung. Damit es diesen menschlichen Batterien nicht allzu langweilig wird, bekommen sie von einem richtig dicken Computer eine halbwegs angenehme Realität direkt in ihr Hirn eingespielt!

Aber es gibt natürlich auch einen Widerstand – Menschen, die noch nicht als künstliche Batterien benutzt werden und die auch nicht in dieser künstlich eingespielten, sondern in der echten Realität leben – Morpheus eben! Und selbstverständlich nimmt Neo die rote Pille und schließt sich diesem Widerstand an, sonst wäre der Film ja schon nach fünf Minuten zu Ende!

Soweit zum Film “The Matrix”. Jetzt noch etwas allgemeines Vorgeplänkel zum Aufwärmen, bevor ich den Hammer der Simulationshypothese von Nick Bostrom auspacke, viel Spaß!

 

1. Die Realität ist simuliert

Ok, also eine durchaus berechtigte Frage. Wer garantiert mir also, das ich gerade jetzt wirklich vor meinem Laptop sitze und diesen Text tippe? Oder umgekehrt, wer garantiert dir, dass du jetzt gerade vor deinem Laptop sitzt und diesen Text liest? Genau! Es sind eigentlich nur elektrische Impulse, die gerade in erhöhter Anzahl und ziemlich wirr durch mein Hirn flitzen – vielleicht noch etwas abgebremst und modelliert durch den synaptischen Spalt zwischen zwei Nervenzellen.

Aber wirklich ausgelöst durch meine Sinnesorgane? Also Auge, Gehör, Sonstiges? Oder vielleicht doch durch einen dicken Supercomputer eingespielt? Und mein Hirn schwimmt einfach so und heftig verkabelt in einer Nährstofflösung … The Matrix.

Und jetzt? Erst einmal tief Luft holen!

Die Sache mit dieser tatsächlichen Realität und Existenz hat übrigens schon Generationen – vor allem von Philosophen – umgetrieben. Zum Beispiel René Descartes – genialer Denker, Universalgelehrter, Wegbereiter der Aufklärung und der modernen Philosophie – hat dieses Problem ganz pragmatisch mit einem einfachen Satz beantwortet: “cogito ergo sum” – “Ich denke, also bin ich” – und Ende der Durchsage! Ok einverstanden … muss ich aber trotzdem nochmal drüber nachdenken.

Jetzt noch viel weiter zurück in das alte Griechenland. Na klar! Der alte bärtige Plato und sein Höhlengleichnis! Wir sitzen also in einer dunklen Höhle – gefesselt – und sehen nur die rückseitige Wand der Höhle. Alles, was jetzt vor dem Höhleneingang vorbeispaziert – was auch immer – wirft einen Schatten auf diese Wand. Wir können uns ja nicht einfach umdrehen – da gefesselt- und halten die Schatten auf der Wand für die tatsächliche Realität – wow!

 

2. Die "echte" Realität gibt es nicht

Nur mal so am Rande: “… aber ich sehe doch meine Umgebung und meine Realität, nehme sie war, das muss doch alles echt sein?” … Pustekuchen! Immer noch letzte Zweifel?

Gar nicht mal so weit entfernt vom alten Plato ist die aktuelle Wahrnehmungspsychologie: Diese sagt: “Wahrnehmung ist subjektiv, selektiv und aktiv!”. Es gibt keine “echte” Realität!

Subjektiv? Klar! Und zwar vom Individuum abhängig … fahre ich jetzt mit einem Beifahrer/in durch eine beliebige Stadt, so nimmt mein Beifahrer/in natürlich ganz andere Dinge am Wegesrand war als ich selbst, da ich ja auf Straße und Verkehrsgeschehen fokussiert bin – ich lebe in einer anderen Realität.

Selektiv? Auch klar! Und zwar von der Situation abhängig … habe ich jetzt zum Beispiel richtig Hunger, so fällt mir auf einmal ein unscheinbarer Burgerladen am Wegesrand auf, der mir vorher noch nie aufgefallen ist und obwohl ich die Strecke schon zigmal gefahren bin – durch meinen Hunger erweitert sich auf einmal meine Realität.

Aktiv? Ebenso klar! Will ich nichts mitbekommen und bin in meine Gedanken vertieft, laufe ich vielleicht schon mal feste gegen eine geschlossene Tür -Smombie halt.

 

3. Alles ist Simulation!

Doch wieder zurück zu der Sache mit der der Simulation. Der Philosoph Nick Bostrom hat dazu aktuell eine recht radikale Simulationshypothese entwickelt – Alles, vom Urknall, über Galaxien und Atome, Evolution bis hin zum Higgs Bosom ist nur simuliert!!! Wieso? Nun, eine Millionen von Jahre alte posthumane Zivilisation betreibt Forschung und will ihren eigenen Ursprung besser verstehen, fertig!

Das ganze Universum also als berechneter Raum und selbst dazu gibt es Einschätzungen: Seth Lloyd, US-amerikanischer Informatiker und Physiker, schätzte dazu in seinem Aufsatz “The Computational Universe” den Informationsgehalt des Universums seit seinem Anbeginn auf etwa 10120 Operationen bzw. Bits.

4. Beweise durch Fehler in der Simulation

Beweise für die eine oder andere Theorie sind jetzt natürlich schwierig aber nicht unmöglich, jede Simulation hat Fehler und die stellen wir immer häufiger fest.

Zuerst ganz einfach: geht es dir nicht auch manchmal so, das der aktuelle Tag mit nur minimalen Abweichungen den vorherigen Tagen gleicht? Du kommst dir wie in einem Hamsterrad vor? Klar, einen völlig neuen Tag zu programmieren und einzuspielen ist aufwendig. Einfacher ist es, den vorherigen Tag einfach etwas zu modifizieren und wiederzuverwenden – egal ob einfache oder totale Simulation..

Aber auch die aktuelle Physik hat Interessantes zu berichten, nämlich Messungen, die allen Naturkonstanten und Theorien widersprechen – Fehler in der Simulation! So gibt es zum Beispiel Teilchen, die sich mit Überlichtgeschwindigkeit bewegen oder Messungen ungleich verteilter kosmischer Hintergrundstrahlung – und auch das quantenphysikalische Phänomen der Verschränkung – also Informationsübertragung in Echtzeit über beliebige Entfernung hinweg – ist mittlerweile zumindest im Ansatz bewiesen – noch ein Fehler in der Simulation!

Ok, wie dem jetzt auch letztendlich sein mag, ich habe fertig – Kommentare und Kritik [auch vernichtend] sind gerne erwünscht und für mich erst einmal real!

Markus