Angenommen, Sie sind ein Ermittler. Oder vielleicht ein zwanghafter Stalker. Oder vielleicht einfach ein Werbetreibender. Sie möchten aus … Gründen einige persönliche Eigenschaften einer Person herausfinden. Sie melden sich also bei Facebook an, durchsuchen sie und scannen ihr Profil.
Pech aber. Sie haben alle wichtigen Informationen hinter einer Mauer der Privatsphäre untergebracht. In einer einfachen und langweiligen Welt sollte die Geschichte hier enden.
Aber unsere Welt ist voller Intrigen und Wunder und Sie sind niemand, der schnell aufgibt. Sie graben also etwas mehr im Profil des Benutzers und schaffen es tatsächlich, sich mit einigen persönlichen Interessen vertraut zu machen, die sie offen auf Facebook offengelegt haben.
Wenn Sie die deduktiven Fähigkeiten von Sherlock Holmes hätten, wäre es vielleicht genug gewesen, alles herauszufinden, was Sie über die betreffende Person wissen müssen, allein aufgrund ihrer Interessen.
Während keiner von uns hier Sherlocks ist, ist künstliche Intelligenz eine vernünftige Annäherung an die Talente der großen Detektive.
Das ist Forschern mit Hilfe eines NLP-Algorithmus (Natural Language Processing) tatsächlich gelungen: Sie sagten verborgene persönliche Eigenschaften von Facebook-Nutzern allein anhand ihrer öffentlich offengelegten Interessen voraus.
Insbesondere konnten die Forscher die folgenden persönlichen Eigenschaften der Nutzer allein aufgrund ihres Musikinteresses vorhersagen:
- Alter
- Standort
- Geschlecht
- Beziehungsstatus
Obwohl das Papier, in dem die Forscher ihre Ergebnisse veröffentlichten, jetzt ein wenig alt ist (veröffentlicht im Jahr 2012), dient es als hervorragendes Beispiel dafür, wie private Informationen durch soziale Mediennetzwerke durchsickern können, selbst wenn Sie so ziemlich alle Daten über sich selbst unsichtbar gemacht haben Dritte.
Du bist, was dir gefällt
Die Datenschutzeinstellungen auf Social-Media-Websites geben den Benutzern heute eine viel größere Kontrolle über die Sichtbarkeit ihrer Informationen (die unzähligen Datenschutzverletzungen von Social-Media-Netzwerken hatten schließlich einen gewissen Nutzen).
Aber reicht das wirklich aus, um zu verhindern, dass Ihre versteckten Informationen offengelegt werden? Leider beweist die Forschung von Wissenschaftlern von INRIA France das Gegenteil.
Die Forscher zeigten, dass es möglich ist, anhand der musikalischen Vorlieben und Interessen eines Benutzers, wie sie auf Facebook offengelegt wurden, sein Alter, Geschlecht, Beziehungsstatus und Standort vorherzusagen.
Da die Interessen, Vorlieben und Abneigungen der meisten Benutzer öffentlich verfügbar sind, muss sich ein potenzieller Stalker nicht allzu sehr anstrengen, um zu sehen, was den meisten Benutzern auf Facebook gefällt. Von dort aus ist es eine Frage der statistischen Korrelation und Wahrscheinlichkeit, Ihre persönlicheren Attribute wie Beziehungsstatus und Standort herauszufinden.
Also, wie genau ermittelt ein KI-Programm persönliche Details über Sie auf der vereinfachten Basis dessen, was Ihnen gefällt?
Vom Musikgeschmack bis zu persönlichen Details
Angenommen, ein verstecktes persönliches Attribut in Ihrem Facebook-Profil ist Ihr Alter (darauf wollen wir schließen) und Sie haben die offizielle Seite von Metallica geliked (die Sie öffentlich machen möchten). Nehmen Sie weiter der Einfachheit halber an, dass es 5 andere öffentliche Facebook-Profile gibt, die an Metallica interessiert sind und zufällig auch ihr Alter für alle sichtbar offengelegt haben. Wenn 4 von 5 davon in der Altersgruppe 18-24 sind, dann wird Ihr verstecktes Attribut (in diesem Fall Ihr Alter) per Mehrheitswahl wahrscheinlich auch 18-24 sein.
(Dieses Beispiel dient nur der Veranschaulichung und entspricht nicht unbedingt der Realität)
Während der Ansatz zu einfach erscheint, um effektiv zu sein, erzielten die Forscher für einige Benutzerattribute eine Inferenzgenauigkeit von 72,5 % . Dies wurde erreicht, indem der einzige prädiktive Faktor des Musikinteresses aus einem viel größeren Pool öffentlich einsehbarer persönlicher Interessen verwendet wurde. Anspruchsvollere Modelle, die mehrere Benutzerinteressen berücksichtigen können, werden nicht nur in der Lage sein, auf eine größere Bandbreite persönlicher Attribute zu schließen, sondern sie tun dies auch mit noch größerer Genauigkeit.
Und das ist ein Grund zur Beunruhigung, denn datenschutzrelevante Attribute von Benutzern in sozialen Medien sind, selbst wenn sie verborgen sind, nicht so sicher, wie uns die herkömmliche Meinung glauben macht.
Das Zustimmungsdilemma
Das stärkste Merkmal dieser Methode zur Vorhersage persönlicher Attribute ist, dass sie sich ausschließlich auf die selbst offengelegten Informationen von Facebook-Nutzern über Musikinteressen stützt.
Der Ansatz ist absolut nicht zweifelhaft, wie z. B. die Verwendung von Malware oder erzwungene Datenschutzverletzungen. Die Technik macht einfach das Beste aus dem, was online verfügbar ist, und Informationen über unsere Interessen sind im Zeitalter der sozialen Netzwerke zufällig etwas, das reichlich verfügbar ist.
Dies macht die besagte Technik zu einer außerordentlichen Herausforderung, wenn es um Datenschutzgesetze geht, zumal die Zustimmung des Benutzers in öffentlich zugänglichen Informationen enthalten ist. Das Gesetz kann unsere Privatsphäre schützen, wenn es Hinweise auf einen Verstoß oder Missbrauch von Benutzerinformationen gibt, z. B. wenn Dritte auf Ihre privaten Informationen zugreifen.
Im vorliegenden Fall stützt sich die Technik ausschließlich auf ausgeklügelte Vermutungen, die vollständig durch öffentlich verfügbare Benutzerinformationen ermöglicht werden, die die implizite Zustimmung der öffentlichen Zugänglichkeit mit sich bringen.
Dagegen erscheint mir eine Rechtsverteidigung nicht denkbar. Sie würden darum bitten, das Raten selbst zu verbieten, um jeden zu verklagen, der Ihren Beziehungsstatus anhand Ihrer musikalischen Vorlieben genau vorhergesagt hat, die Sie gerne freiwillig offengelegt haben.
Nichtsdestotrotz kann das Modell des Forschers für schändlichere und rechtlich vertretbarere Zwecke als bloße Ratespiele verwendet werden.
Vorbereitung auf einen Datenschutz-Notfall
Einige der möglichen Missbräuche der Technik der Forscher beinhalten Doxing. Mit der Möglichkeit, persönliche Daten eines Benutzers basierend auf seinen Interessen zusammenzufügen, wird Doxing für Angreifer einfacher, wodurch eine größere Anzahl von Benutzern anfällig für potenzielle Informationslecks und Online-Offenlegung wird.
Spammer könnten auch einen großen Tag haben, wenn sie das Facebook-Profil eines Benutzers mit seiner E-Mail-Adresse abgleichen und seinen Posteingang mit zielgerichteten Anzeigen spammen, die so gestaltet sind, dass sie den vorhergesagten Interessen eines Benutzers entsprechen.
Für Werbetreibende könnten diese Vorhersagetechniken genau das sein, was sie brauchen, um Benutzer effizient für die Anzeigenausrichtung zu profilieren, während interessenbasierte Vorhersagen individueller Attribute zu einer entscheidenden Komponente der kommenden Technologie werden könnten, da Browser-Cookies kurz vor dem Aussterben stehen.
Wie auch immer Sie es betrachten, es ist der Benutzer, der das kurze Ende des Stocks hat, da unsere Privatsphäre auf einen locker hängenden Faden reduziert wird, der in jede Richtung weht, in die der Wind ihn nimmt.
Und gerade als Sie dachten, Sie könnten nicht mehr unter Druck stehen, einen Anschein von Privatsphäre zu wahren, versetzen unsere fortschreitenden technologischen Fähigkeiten einen weiteren Schlag, um sicherzustellen, dass wir online nackt bleiben.
Wir nähern uns immer mehr einer Situation, in der der einzige Weg nach vorne darin bestehen könnte, eine Welt ohne digitale Privatsphäre zu akzeptieren; ein Recht, das wir eingetauscht haben, um unsere eigene wachsende Technophilie zu nähren. Privatsphäre mag sehr wohl ein notwendiges Opfer für weiteren technologischen Fortschritt sein, aber wie bereit sind wir, einen Schritt in eine Welt zu tun, in der Schatten nur zum Schutz des Angreifers existieren und die invasiven Scheinwerfer auf den Angegriffenen geklebt bleiben?