Mustererkennung

zuletzt geändert am 13.08.2022

Mit dem Verfahren der Mustererkennung kommen Social Media Dienste und alle anderen Datensammler auch ohne Fingerprinting, Cookies und IP-Adresse an die Identität der Besucher im Internet. Es spielt prinzipiell auch keine Rolle mehr, ob Besucher ein VPN nutzen oder den Browser wechseln oder ihren Browser mit Add-ons spicken. Mustererkennung nutzt nur noch die Datenmasse, die Besucher als Spur bei ihren Besuchen im Internet hinterlassen.

Nehmen wir zur Veranschaulichung ein sehr, sehr vereinfachtes und theoretisches Beispiel. In der gesamten Datenmasse, die Google aus allen Besuchen des Internets besitzt, findet der Computeralgorithmus immer wieder das Wort „Kilimandscharo“. Gleichzeitig stößt er in Verbindung damit wiederkehrend auf „Ausrüstung“. Damit kann schon klassifiziert werden, dass es sich um „Bergsteigen“ handeln könnte. In Addition weiterer wiederkehrender Elemente und in Verbindung mit Statistiken (wie z.B., aus welchen Ländern stammten die häufigsten Expeditionen?) verengt sich das Raster so sehr, dass am Ende eine einzige Klasse übrig bleibt, nämlich der Teilnehmer X der englischen Expedition aus dem Jahr 2013.

Nach diesem Prinzip werteten im Jahr 2015 das Massachusetts Institute of Technology (MIT) und die Universität Aarhus Kreditkartentransaktionen aus. Dafür waren Daten über einen Zeitraum von drei Monaten von 1,1 Millionen Menschen in 34 Ländern und zehntausenden Geschäften untersucht worden, wobei die Datensätze und Kreditartennummern völlig anonymisiert waren. Dennoch konnten die Forscher auf der Suche nach gleichen Mustern im Einkaufsverhalten rund 90 Prozent der Käufer eindeutig identifizieren. Das heißt, die Ausspähung der Benutzer gelingt zwar nicht vollständig, aber zu einem hohen Prozentsatz auch, alleine durch die Auswertung ihrer Spuren beim Besuch des Internets. Zudem jeder Benutzer im Laufe der Zeit mehr als genug Spuren hinterlässt, wie der Fall „Made to Measure“ belegt.

Das Prinzip der Mustererkennung

Bei der Mustererkennung spielen statistische Merkmale eine wichtige Rolle. Besucht jemand etwa eine Webseite zum Thema Gesundheit, so handelt es sich mit einer Wahrscheinlichkeit von 74% um eine Frau. Das heißt, das Merkmal des Besuchs einer Webseite zum Thema Gesundheit erhält mit einer Wahrscheinlichkeit von 74% die Klasse „Frau“. Als nächstes erfolgte auf derselben Website die Suche nach einem Medikament, das nur ältere Menschen benötigen. Somit erhält die Klasse eine Erweiterung zu „ältere Frau“ mit sagen wir 76%. Mit der Klassifizierung aller folgenden Webseitenbesuche verfeinert sich das Bild Zug um Zug bis zu 100%. Dann steht das Ergebnis fest: es handelt sich um BesucherIn XYZ. Da es ausreichend viele Statistiken gibt, führt die Auswertung aller statistischen Merkmale mit an Sicherheit grenzender Wahrscheinlichkeit zur Identifizierung jedes Benutzers.

Statistische Merkmale sind eines der Hilfsmittel bei der Mustererkennung. Im Grunde kommt Mustererkennung auch ohne jede Statistiken aus, weil Mustererkennung aus der Masse an Daten wiederkehrende Kriterien und gemeinsame Elemente filtern kann, an Hand derer eine Klassifizierung nach und nach möglich wird. So eschah dies bei der Mustererkennung von Kreditkartentransaktionen.

Die vollständige Erkennung erfolgt so gut wie nie aus einem einzigen Besuch des Internets. Solches würde nur gelingen, wenn ein Besucher stets oder wenigstens sehr häufig als einziger eine Internetseite besuchte. Dann wäre er selbst in einer großen Datenmasse sofort erkannt. Nun ist es so gut wie ausgeschlossen, dass ein Besucher immer nur ein und dieselbe Webseite aufruft.

In der Realität wird BesucherIn XYZ im Internet ganz unterschiedliche Webseiten auswählen und bei jedem Besuch werden an Hand von statistischen Merkmalen und Wiederholungen stets alte Klassen vertieft und neue Klassen gebildet. Anfänglich ist nicht bekannt, dass verschiedene Klassen von BesucherIn XYZ stammen. Daher werden im nächsten Schritt alle Klassen nach gemeinsamen Merkmalen durchforstet. Man legt dazu die Klassen gewissermaßen übereinander und sucht nach identischen Strukturen, aus denen sich schließlich die eindeutige oder sehr wahrscheinliche Zuordnung aller identischen Klassen zu BesucherIn XYZ ergibt. Damit ist das Persönlichkeitsprofil von BesucherIn XYZ erstellt und bei jedem weiteren Besuch des Internets verfeinert es sich.

Meister der Mustererkennung

Für Menschen ist die Auswertung solcher Massendaten unmöglich, für Computer ist es eine Frage der Zeit und der Qualität der eingespeisten Such- und Vergleichsalgorithmen. Sie sind Meister der Mustererkennung. Am Ende des Prozesses bleibt eine mehr oder weniger kleine Menge an nicht identifizierbaren Spuren übrig. Diese Restdatenmenge wird künftig immer wieder in die Computersuche eingespeist und siehe da, nach und nach schälen sich weiter Profile heraus, weil sich die Datenmenge aus weiteren Internetbesuchen so angereichert hatte, dass Erkennung möglich wurde.

Aus der Mustererkennung sind neuronale Netze wie das Bayes’sche Netzwerk mit der Fähigkeit zum automatischen Lernen nicht mehr wegzudenken. Sie sind die Basis für Künstliche Intelligenz, mit der die Datensammler Mustererkennung durchführen und Persönlichkeitsprofile erstellen, um Menschen zu manipulieren. Manipulation bedeutet die Einschränkung der Informationsbreite auf das entsprechende Persönlichkeitsprofil. Der Reiche erhält nur noch teure Angebote, der Nazi nur noch Nachrichten aus seiner Szene, Schopper immer mehr Kaufangebote, Zocker laufende Verführung zum Wetten und Zocken, etc. Es bilden sich die berühmten Blasen, in denen nur noch Menschen und Umwelt existieren, die von ihresgleichen sind. Alles andere ist ausgeblendet. So kann multikulturelle Wahrnehmung und Diskussion nicht mehr stattfinden, sondern die Gesellschaft wird gespalten.

Siehe auch

Wenn es Ihnen beliebt, so teilen Sie den Artikel auch anderen mit. Ihre Stimme hilft, kaschmaeh.net zu überleben.