Yandex Code-Leak: Einblicke in die Tiefen einer Suchmaschine

Jan. 31, 2023 | Knowledge, SEO

Es dauerte nur wenige Stunden bis sich die Nachricht in der SEO-Szene wie ein Lauffeuer verbreitet hatte – ein ehemaliger Mitarbeiter von Yandex hat vor wenigen Tagen den Quellcode der Suchmaschine, die insbesondere im russischen Raum stark verbreitet ist, geleakt.

Wir haben uns eine Übersicht verschafft und zusammengefasst, was bisher bekannt ist und welche Auswirkungen der Leak für Google haben kann.

Yandex – die marktführende Suchmaschine Russlands

Die Suchmaschine Yandex ist klarer Markführer im Bereich der Suchmaschinen in Russland. Weltweit sichert sie sich zudem eine starke Platzierung innerhalb der Top 10 der meistbesuchten Webseiten und reiht sich damit neben Marktmacht Google und Baidu in die wichtigsten Suchmaschinen der Welt ein. Auch wenn Yandex nicht mit Google gleichzusetzen ist, so bieten die geleakten Informationen SEOs weltweit dennoch interessante Einblicke in die Funktionsweise von Suchmaschinen.

Besonders spannend: Der veröffentlichte Quellcode beinhaltet 1.922 Ranking-Faktoren, die von der Suchmaschine eingesetzt werden. War zunächst von einem Hack die Rede, so dementierte dies Yandex selbst nur kurze Zeit später.

„Yandex was not hacked. Our security service found code fragments from an internal repository in the public domain, but the content differs from the current version of the repository used in Yandex services. A repository is a tool for storing and working with code. Code is used in this way internally by most companies.

Repositories are needed to work with code and are not intended for the storage of personal user data. We are conducting an internal investigation into the reasons for the release of source code fragments to the public, but we do not see any threat to user data or platform performance.“

Quelle: Yandex gegenüber BleepingComputer

Die publizierten Daten beziehen sich auf einen Stand von Juli 2022. Somit ist zu vermuten, dass dieser nicht mehr eins zu eins dem aktuellen Code von Yandex entspricht. Dennoch sorgt der Leak für Besorgnis bei Suchmaschinenbetreibern. Der Leak schafft ein Sicherheitsrisiko – mögliche Sicherheitslücken könnten identifiziert und genutzt werden. Daher kann davon ausgegangen werden, dass es zu Abänderungen am Code selbst kommen wird.

Was kann die SEO-Szene an Erkenntnissen aus dem Leak ziehen?

Da die grundsätzliche Funktionsweise der weltstärksten Suchmaschinen ähnlich ist, bieten die veröffentlichten Informationen auch in Hinblick auf Google spannende Erkenntnisse – wenngleich diese nicht eins zu eins auf den Suchmaschinenriesen übertragen werden können.

Verschiedene SEO-Experten haben sich die veröffentlichten Daten im Detail angeschaut und ihre Erkenntnisse dokumentiert. Im Vordergrund stehen dabei insbesondere wichtige Ranking-Faktoren und spezifische Sonderregelungen.

Malte Landwehr identifizierte bereits wenige Stunden nach der Veröffentlichung nach eigenen Angaben 49% der aufgeführten Rankingfaktoren. In einem Kommentar auf LinkedIn macht er zudem deutlich, worin konkret er den Gewinn aus den vorliegenden Informationen sieht:

“To me, this is not about Yandex.

This is about a state-of-the-art search engine that solves similar problems to Google, with similar access to talent and similar economic constraints.

Additionally, both Google and Yandex are hiring engineers from each other.

It is fair to assume that there is at least some overlap in the solutions Yandex and Google implemented and maintained.

Of course, we cannot take a single ranking factor from the Yandex leak and claim that Google is doing the same. But it can help to understand how a major search engine works on the inside.”

Quelle: Malte Landwehr, LinkedIn

Eine Vielzahl der veröffentlichten Ranking-Faktoren weist jedoch Tags auf, die darauf schließen lassen, dass sie keine aktive Anwendung (mehr) finden. Gemäß Johannes Beus – CEO & Founder von Sistrix bleiben danach jedoch weiterhin 417 aktive Rankingfaktoren übrig. Die gemäß einer Gewichtungsliste bedeutendsten Rankingsignale sind dabei:

  1. Links
  2. Nutzersignale
  3. Relevanz des textlichen Contents
  4. Trust- & Qualitätsfaktoren
Quelle: Johannes Beus, LinkedIn

Dies bestätigt viele klassische SEO-Annahmen. Hinsichtlich der Bewertung von Links kommt ein PageRank-Algorithmus zum Einsatz. Interessant ist, dass auch Linktext und Alter eine wichtige Rolle spielen. Bestehende Links sind dabei wertvoller, als solche die erst vor kurzem gesetzt wurden.

Auch hinsichtlich der Nutzersignale zeigt sich eine spannende Erkenntnis. Während Google abstreitet, diese aktiv zur Rankingbewertung heranzuziehen, beeinflussen unterschiedliche KPIs das Yandex-Ranking.

Die Relevanz von Trustfaktoren wird zudem bestärkt. Verschiedene Ranking Faktoren für die Bereiche Medizin, Finanzen und Recht untermauern die Sonderstellung von YMYL-Themen (Your-Money- Your-Life).

Einige Sonderregeln bieten zudem interessante Informationen. Gemäß Sistrix bewertet Yandex auf Wikipedia.org veröffentlichte Inhalte generell besser, als andere Inhalte und auch Serverfehler senden negative Signale. Aber auch der Aufbau einer URL kann Auswirkungen haben. Wie bei SEO Südwest dokumentiert, können Zahlen in einer URL genauso wie eine hohe Anzahl an Slashes zu Abwertungen führen.

Quelle: SEO Südwest

Leak der Yandex Rankingfaktoren – eine Gefahr auch für Google?

Alex Buraks fasst in einer Reihe von Tweets zusammen, welche Ähnlichkeiten er zwischen Yandex und Google sieht. Zusammengefasst sieht er eine Überschneidung von ca. 70% zwischen beiden Suchmaschinen. Diese Annahme beruht auf verschiedenen Aspekten:

  • RankBrain – MatrixNet
  • PageRank
  • Übereinstimmende Text Algorithmen
  • Ex-Google Mitarbeiter, die für Yandex arbeiten
  • Der ursächliche Aufbau Yandex als Google Clone
  • Ähnliche SEO-Taktiken von Experten im russischen Raum für Yandex und Google

John Mueller reagiert derweil auf Twitter lediglich sarkastisch auf etwaige Annahmen einer 70%igen Überschneidung:

Quelle: John Mueller, Twitter

Fest steht: Yandex ist nicht ein zu eins mit Google gleichzusetzen. Dennoch bietet der Leak SEOs aus aller Welt eine wichtige Unterstützung dabei, die Funktionsweise von Suchmaschinen generell besser deuten zu können und verstärkt bzw. dementiert verschiedene Annahmen, die von SEO-Experten bisher getroffen werden.

Malte Landwehr bezeichnet den Leak als einen der meist informativen Ereignisse in der SEO-Zeitgeschichte. Es bleibt mit Spannung abzuwarten, welche Erkenntnisse in den nächsten Wochen folgen werden.

Bild: The office of the company Yandex
Quelle: © stock.adobe.com | fifg | #398032805

Autor

Julia | Key-Account-Managerin

Julia ist seit ihrem Studium der Sozialwissenschaften im (Online)-Marketing aktiv. Seit 2021 ist sie Teil der seo2b und betreut als Key-Account-Managerin unsere KundInnen im Segment SEO.

Was dürfen wir für Sie tun?

Ihr Ansprechpartner:
Florian Ries

INFO@SEO2B.DE

seo2b GmbH
Monaiser Straße 27
54294 Trier

Datenschutz