Was ist Google News?
Im Dezember 2001 ging Google News zum ersten mal an den Start. Begleitet von 100 Newsquellen, die bis heute auf 4.500 Newsquellen angewachsen ist. Die Geschichte hinter Google News ist interessant: Ende September 2001 wollte einer der Google Ingenieure einfach auch mal andere Nachrichten als ausschließlich News zu den Anschlägen vom 11. September lesen.
Und so programmierte Krishna Bharat an einem Wochende die Basis für Google News und stellte sie ins Google-Intranet. Nachdem seine News-Suche unter Kollegen immer populärer wurde, wurden ihm drei Sidekicks zur Seite gestellt, mit denen er sich aufmachte die Adaption von News und Themen zu revolutionieren.
Google News basiert auf einem Algorithmus und nicht auf die Auswahl von Redakteuren. Der Google News Algorithmus crawlt News Seiten und die dort gefundenen Ergebnisse nach bestimmten Faktoren, bewertet und verarbeitet sie dann. Dabei durchsucht er die Inhalte der Seite nach Storys und bewertet deren Quellen. Darüber hinaus findet er heraus, wie wichtig diese Story für die jeweiligen Quellen ist und bestimmt daran, ob es eine große oder eine kleine Story ist. Die Storys werden zudem geographisch und einzelnen Sprachen zugeordnet. Um die Qualität der Nachrichten genauer bestimmen zu können hat Google den TrustRank eingeführt. 2005 zum Patent angemeldet, sortiert der TrustRank Google News Ergebnisse nach Qualität und nicht nach “Datum” oder “Relevanz” zu einem Suchbegriff. Die Qualität basiert dabei auf einer reinen Auswertung von gesammelten Daten:
Allgemein
- Anzahl der Storys zu einem Thema aus allen News-Quellen
- durchschnittliche Storylänge
News-Quelle
- Anzahl der Redaktionen
- Alter der Redaktion
- Anzahl der Redakteure
- Internet Traffic der News-Quelle
- Anzahl der Länder, die auf die News-Quelle zugreifen
Aber auch der Verfasser der Story ist wichtig und wird bewertet. Google liest dabei die Verfasserzeile (oder Boilerplate) und durchsucht die News-Quelle, aber auch das Internet nach weiteren Veröffentlichungen von diesem Verfasser. Die gesammelten Daten werden in einem Wert zusammengefasst, der dann ähnlich funktioniert wie der urprüngliche PageRank.
Interessanter Weise ähneln sich TrustRank und PageRank auch in Bezug auf die Verlinkung einer Seite. So hat eine Studie der Stanford Universität herausgefunden, dass eher Seiten einen hohen TrustRank erhalten, die wenige Inbound Links aber qualitative Links zu anderen Seiten aufweisen. Seiten, die viele Inbound Links (hoher PageRank) aufweisen, können dabei eher als SPAM durchgehen.
Für die Aufnahme in Google News ist es also nicht wichtig zu einem Thema möglichst sofort und auf seiten mit hohem Pagerank etwas veröffentlicht zu haben, sondern es vor allem gut platziert zu haben. Denn Google durchsucht seine Quellen zu Veröffentlichungen aus den letzten 30 Tagen. So kann man zu einem Thema durchaus gelistet werden, wenn man seine Meldung beispielsweise schon vor 3 Wochen veröffentlicht hat, das Thema aber erst jetzt von anderen Newsseiten aufgegriffen wird.
Welches sind nun die Quellen für Google News, die alle diese Anforderungen erfüllen?
Genau wird man das, wie so vieles von und bei Google, nicht herausfinden können. Newsknife beobachtet Google News jedoch schon seit 2004 und listet mit Stand vom 01. März 2008 6.379 News-Quellen für Google News aus dem englischsprachigen Raum(in alphabetischer Reihenfolge). Auf dem Google News Service von Search Bistro und Private Radio kann man sich für 12 Länder, darunter auch Deutschland, die aktuellsten Nachrichten aber auch die Top 25 Newsquellen anzeigen lassen.
