Anzeige


Einzelnen Beitrag anzeigen
Alt 15.03.2013, 13:10   #1   Druckbare Version zeigen
Godwael Männlich
Moderator
Themenersteller
Beiträge: 12.173
Blog-Einträge: 12
Persönlichkeitseigenschaften mit Facebook-Likes vorhersagen? Echt jetzt? - Technik

Derzeit geht im Internet die Meldung um, Wissenschaftler könnten mit Hilfe von Facebook-Likes private Informationen wie zum Beispiel sexuelle Orientierung erschließen - mit der mehr oder weniger offen ausgesprochenen Implikation, nicht einmal intimste Geheimnisse seien noch sicher vor den "Datenkraken". Grundlage ist diese Veröffentlichkeit in PNAS, deren Ergebnisse durchaus eindrucksvoll klingen.

Da heißt es zum Beispiel im Abstract:

The model correctly discriminates between homosexual and heterosexual men in 88% of cases, African Americans and Caucasian Americans in 95% of cases, and between Democrat and Republican in 85% of cases.

Machen also unsere arglosen Klicks und Zugriffe uns zu einem offenen Buch für Facebooks mächtige Algorithmen? Ich habe meine Zweifel. Statistik hat nämlich so ihre Tücken.

Nehmen wir das Beispiel sexuelle Orientierung. Da ist das Modell des Forscherteams zu 88% treffsicher. Was aber heißt das in der Praxis? Rechnen wir mal durch.

Angenommen, zehn Prozent der Bevölkjerung seien Homosexuell. Ich lasse jetzt mal die ganzen Komplikationen und Grauzonen rund um sexuelle Identität weg, darum geht es hier gar nicht. Das ist eine Beispielrechnung. Nehmen wir eine Stichprobe von 1000 Menschen, von denen 100 homosexuell sind. Und das wollen wir mit dem Algorithmus rausfinden.

Der Algorithmus liegt in 88% der Fälle richtig. Das heißt, bei den 100 Homosexuellen identifiziert er 88 als homosexuell, 12 als heterosexuell. Bei den 900 Heterosexuellen bezeichnet er 900 * 0,88 = 792 Menschen als Heterosexuell und die restlichen 108 als homosexuell.

In der gesamten Stichprobe findet der Algorithmus also 196 Homosexuelle und 804 Heterosexuelle. Wir wissen aber, dass unter den so gefundenen Homosexuellen nur 88 tatsächlich Homosexuell sind. Der Rest sind falsch-positive Treffer.

Das heißt summa summarum, dass in unserem Rechenbeispiel die Wahrscheinlichkeit lediglich 45 % Prozent ist, dass jemand, den der Algorithmus als homosexuell identifiziert, auch tatsächlich schwul oder lesbisch ist. Das ist, vorsichtig ausgedrückt, nicht so dolle. Und wenn die Anteile an der Bevölkerung kleiner werden, wird die Unsicherheit noch größer. Ganz zu schweigen davon, dass für viele Eigenschaften (inklusive sexuelle Orientierung) die tatsächlichen Anteile an der Gesamtbevölgerung nicht bekannt sind.

Der gläserne Nutzer ist jedenfalls noch ne Ecke undurchsichtiger, als uns die Kulturpessimisten und Algorithmengläubigen weismachen wollen.





Weiterlesen...

Quelle: Fischblog - Wissenschaft für alle
Godwael ist offline   Mit Zitat antworten
 


Anzeige