Missing Link: Woher soziale Netzwerke wissen, wen wir kennen (könnten)

Ob enger Freundes- und Kollegenkreis oder flüchtige Online-Bekanntschaften: Im Zentrum sozialer Netzwerke stehen die Kontakte. Damit wir unsere Netzwerke erweitern können, werden uns immer neue Profile vorgeschlagen. Doch wie kommen diese Kontaktvorschläge eigentlich zustande?

Facebook, Instagram, StayFriends, Pinterest, Snapchat, Xing oder LinkedIn – zahlreiche soziale Netzwerke buhlen um unsere Mitgliedschaft. Damit wir diese Dienste oft und gerne nutzen, ist es wichtig, dass wir dort auf interessante Menschen stoßen: Familie, Bekannte und andere Personen, mit denen man im Alltag Kontakt hat. Wir sollen unser Netzwerk aber auch erweitern können. Deshalb werden uns neben Personen, die wir selbst suchen und hinzufügen, auch Profile vorgeschlagen, die wir kennen oder interessant finden könnten. Das erhöht den Nutzwert für die Mitglieder und dadurch die Bindung an einen Dienst.

Kleine Welten: Wie Programme soziale Verbindungen ermitteln

Die Betreiber versuchen also, bestehende Bekanntschaften und soziale Verbindungen (‚links‘) auf der Plattform nachzubilden – eine komplexe Aufgabe, denn die Netzwerke zwischen Menschen sind dynamisch und haben viele variable Parameter. Die Entwicklerinnen und Entwickler nutzen daher statistische Methoden und Computermodelle. Diese basieren unter anderem auf Erkenntnissen der Sozialforschung, wonach soziale Gruppen und Gemeinschaften durch kurze Wege miteinander verbunden sind, also viele ‚kleine Welten‘ bilden. Kontakte werden dabei als Knoten (‚nodes‘) in einem Netzwerk (‚graph‘) verstanden. Um die Nähe oder Ähnlichkeit zwischen Knoten A und Knoten B zu bestimmen, aggregiert die Software Informationen über die Mitglieder einer Plattform und ihre möglichen Verbindungen. Wie genau die Algorithmen der verschiedenen Plattformen dabei jeweils arbeiten, bleibt meist ein Geschäftsgeheimnis. Es gibt aber Anhaltspunkte, wie Kontaktvorschläge grundsätzlich zustande kommen.

Vielsagende Informationen: Adressbuchdaten, Verhalten und Dritte

Der effizienteste Weg führt über vorhandene soziale Kontakte. Dafür sind Informationen nötig, die eine direkte Verbindung nahelegen, wie beispielsweise Telefonnummern oder E-Mail-Adressen. Mit solchen konkreten Daten können Algorithmen das Netzwerk einer Person am besten modellieren, sprich: ‚nachbauen‘. Apps erfragen dazu beim ersten Einrichten beispielsweise das Zugriffsrecht auf gespeicherte Kontakte. Auch wenn man seine Profile verschiedener Dienste verknüpft, kann das dazu führen, dass einem die Kontakte aus dem einen auch im anderen Netzwerk vorgeschlagen werden.

Darüber hinaus suchen die Vorschlagsalgorithmen kontinuierlich nach weiteren Verknüpfungen. Während manche davon nahe liegend sind, gibt es auch weniger offensichtliche – und solche, die vielleicht erst noch entstehen. Bei der Vorhersage von Verknüpfungen (‚link prediction‘) analysiert eine Software die Eigenschaften bestehender Netzwerke, um die Wahrscheinlichkeit einer (zukünftigen) Verbindung zwischen zwei Profilen vorherzusagen. Dieselben Kontakte auf der Plattform, eine gemeinsam besuchte Schule oder Arbeitsstelle sind – vor allem in Kombination – verlässliche Marker dafür, dass zwei Personen sich kennen könnten. Bei Facebook etwa bezieht der Algorithmus auch Mitglieder derselben Diskussionsgruppen oder Personen, die gemeinsam auf Fotos markiert wurden, in die Entscheidung für Kontaktvorschläge mit ein.

Vorhersehbare Verbindungen: Auf Netzwerkseiten wie Facebook, Instagram oder Snapchat suchen Algorithmen immerzu nach Profilen, die sie uns als neue Kontakte vorschlagen können. Dafür nutzen die Programme Kontaktadressen und weitere Informationen, die auf Verbindungen schließen lassen. Zum Beispiel gemeinsame Bekannte.

All das sind Informationen, die wir freiwillig preisgeben. Welche weiteren Details in die Vorhersage von Verbindungen einfließen, darüber halten sich die Anbieter bedeckt. Die teils verblüffende Treffgenauigkeit der Vorschläge ist immer wieder Anlass für Spekulationen. Häufig wird vermutet, dass auch Verhaltensdaten eine Rolle spielen: Statusmeldungen, Interaktionen mit anderen Mitgliedern (Kommentare und Chats), ‚soziale Signale‘ wie Likes und Freundschaftsanfragen oder Sucheingaben. Aus Kontakten zu Kolleginnen und Kollegen könnte die Software etwa auf das Arbeitsumfeld schließen. Auch Informationen zum Standort oder Daten, die in anderen Apps anfallen, könnten einbezogen werden – zumindest legen das Software-Patente nahe. Die Anbieter dementieren häufig, dass diese technischen Möglichkeiten in der Praxis eingesetzt werden – oder schweigen dazu. Vermutlich, weil dies kein gutes Licht auf ihren Umgang mit teils sehr persönlichen Informationen werfen würde.

Welche Bekannten wir gern mögen, wissen Algorithmen nicht

Es ist sicher praktisch, nicht nach allen Kontakten selbst suchen zu müssen – wer weiß schon, ob die Mitschülerin oder der Mitschüler von früher heute noch genauso heißt. Durch die Auswertung zahlreicher Daten werden aber auch Verbindungen vorhergesagt, die wir selbst so nicht erwarten. Und manchmal können die Vorschläge problematisch ausfallen, wenn sie etwa Bekanntschaften aufzeigen, die nicht öffentlich werden sollen. Oder Personen vorgeschlagen werden, mit denen man lieber keinen Kontakt (mehr) hätte. Weil sekündlich für unzählige Profile automatisch komplexe Datenauswertungen stattfinden, sind solche Situationen für die Entwicklerinnen und Entwickler kaum vorhersehbar und nur schwer vermeidbar. Der Algorithmus rechnet lediglich eins und eins zusammen – welche Art von Beziehung wir tatsächlich zu dem vorgeschlagenen Kontakt haben, kann ein Programm nicht wissen.

Überraschende Vorschläge
Auf dem (fiktiven) Netzwerk FriendNet wird Anna unerwartet Onkel Uwe als Freund vorgeschlagen. Wie sie damit umgeht, verrät die Podcast-Folge „Meine Daten, deine Daten“.

Festzuhalten ist: Kontaktvorschläge von Netzwerkseiten basieren zu einem großen Teil auf Daten, die von den Mitgliedern selbst hochgeladen werden. An den Vorschlägen sind jedoch immer zwei Seiten beteiligt. Eine mögliche Verbindung muss also gar nicht durch Daten errechnet worden sein, die man selbst hinterlassen hat. Es reicht, wenn andere Personen die eigenen Kontaktdaten mit ihrem Profil verknüpft haben. Die Ergebnisse sind manchmal auch deshalb überraschend, weil das Hochladen lange zurückliegt oder automatisch im Hintergrund passiert. Daher sollte man hin und wieder in den Einstellungen prüfen, welche Zugriffsberechtigungen der jeweilige Dienst – womöglich ungewollt – besitzt. Und bei Bedarf einschränken, wie sichtbar das eigene Profil ist und wer Kontakt aufnehmen darf.

Importierte Kontakte
Viele sozialen Netzwerke bieten bei der Neuanmeldung an, das persönliche Adressbuch hochzuladen, damit man seine persönlichen Kontakte schneller finden kann. Dadurch erhalten die Anbieter möglicherweise aber auch Zugriff auf die Daten von Personen, die damit nicht einverstanden sind. Wer die Daten seiner Bekannten schützen möchte, kann die Synchronisation der Kontakte in den Einstellungen der Netzwerke oder des eigenen Mobilgeräts deaktivieren. Bei Facebook beispielsweise geht das hier.

Wenn Maschinen Verbindungen von Menschen vorhersagen

Die Beispiele Dating und soziale Netzwerke zeigen: An vielen Stellen unseres digitalen Miteinanders sortieren im Hintergrund Algorithmen passende Profile oder werten eine Vielzahl an Informationen aus, um uns mit anderen Menschen zu verbinden. Die Anbieter von Dating-Diensten setzen dabei auf die Hoffnung ihrer Kundinnen und Kunden, mithilfe einer Mischung aus Technik und Psychologie das ‚perfekte Match‘ zu finden. Auch für die Betreiber sozialer Netzwerke ist unser Bedürfnis nach Austausch und Vernetzung ein lohnendes Geschäft.

Manchmal überrascht es, wie berechenbar unser soziales Miteinander für Computerprogramme zu sein scheint. Dabei stellen sie beim Matching oder bei Kontaktvorschlägen mittels Datenauswertung und statistischen Verfahren lediglich Prognosen, sprich: fundierte Vermutungen an. Einen Kontakt oder das erste Date können technische Systeme zwar in die Wege leiten, alles Weitere liegt jedoch bei uns. Und wie wir mit den Vorschlägen umgehen, kann ein Algorithmus nicht vorhersagen.

Bei der digitalen Kommunikation werden viele Daten verarbeitet – unsere eigenen, aber oft auch die jener Menschen, mit denen wir vernetzt sind. Was man für eine sichere und datensparsame Nutzung beachten kann, zeigt der Beitrag „Eine Frage der Einstellung“.