Mit dem March Update 2024 hatte Google angekündigt, 40 % minderwertige Inhalte aus dem Index zu entfernen. Erste Studien haben gezeigt, dass allein die Hälfte der abgestraften Websites zwischen 90 und 100 % KI-generierten Content hatten. Die Strafe bestand in der Deindexierung, also in der vollständigen Entfernung der Seite aus den Suchergebnissen. Damit ist dieses Core-Update wieder ein deutliches Signal, dass Google Content-Spam mit aller Härte abstraft.
So kann Google KI-generierte Texte erkennen
Der Suchmaschinenriese hat in der Vergangenheit mehrfach Stellung genommen zu der Frage, ob KI-generierter Content abgestraft wird oder nicht. Die klare Richtschnur dazu lautet:
KI-Content wird abgestraft, wenn die Texte in manipulativer Absicht produziert wurden, um höhere Rankings in den Suchmaschinen zu erzeugen, ohne den Lesern dabei einen Mehrwert zu bieten. [Katrin Winkler, SEO Texterin Wortverkauf]
Dabei ist es übrigens irrelevant, ob jemand einen Texter für 1 Cent/Wort mit der Textproduktion beauftragt hat oder ChatGPT.
Google deutet Signale, die auf KI-Content hinweisen
Kann Google KI-generierte Texte erkennen und wenn ja, wie? Diese Frage wird oft viel zu einseitig betrachtet. Auch die massenhaft aus dem Boden schießenden KI-Detektoren haben nur den reinen Text im Blick. Google betrachtet derweil aber viele Signale der Website. Anzeichen für manipulativen KI-Content sind beispielsweise:
- Plötzlich erhöhte Publikationsfrequenz
Eine Website, die vorher nur 3 neue Blogs im Jahr veröffentlich hat, und nun 50 Postings pro Monat rausschießt, macht sich verdächtig. - Instinkte der Besucher
Menschen haben einen sehr feinen Instinkt und spüren, wenn ein Bild oder ein Text sich „irgendwie komisch“ anfühlt. Unnatürliche Sprachmuster, die typischen KI-erzeugten Verschachtelungen und vieles mehr triggern die Besucher, was sich wiederum auf ihr Besuchsverhalten auswirkt – das ein wichtiges UX-Signal für die Suchmaschine ist. - Quality Rater
Google setzt sogenannte Quality Rater ein, die mit der manuellen Überprüfung von Websites beauftragt werden. Diese sind nach den neusten Richtlinien dazu angehalten, eine Website, die beispielsweise selbst auf KI-generierte Inhalte hinweist, auf die niedrigste Qualitätsstufe zu setzen.
Google arbeitet intensiv daran, diese und viele weitere Signale – die wir Menschen schon instinktiv spüren – in Algorithmen umzusetzen. Es entstehen neue Filter, die wiederum beim nächsten Core-Update zum Tragen kommen.
Was passiert nun mit Seiten, die einen hohen Anteil an KI-Texten haben?
Wer auf der Welle der blitzschnell, kostengünstig und massenhaft produzierten Texte mitgeschwommen ist, bekommt zu Recht Schweißperlen auf der Stirn.
Ich beobachte die Reaktion Googles auf neue Entwicklungen und Technologien seit über 15 Jahren. Meine persönliche Prognose lautet: Wer KI nicht in Maßen und nur dort einsetzt, wo sie sinnvoll ist, wird mit Abstrafungen rechnen müssen. [Katrin Winkler, SEO-Texterin Wortverkauf]
Es sind viele weitere Vorgehensweisen denkbar. Nicht ausgeschlossen ist es beispielsweise, dass Google zukünftig Websites mit einem hohen KI-Content-Anteil in den Suchmaschinen markiert. Es ist wie immer im Leben: man kann die Erfolgsleiter sehr schnell hochklettern und dabei Stufen überspringen. Der Weg nach unten ist in jedem Fall schneller.
Rechtsfragen bei der KI-Texterstellung: Erste Klagen KI-generierte Textkopien
In unmittelbarem Zusammenhang mit der Diskussion um die Bewertung KI-generierter Inhalte stehen rechtliche Fragen. Denn wer garantiert, dass ChatGPT & Co. die Inhalte so abwandeln und zusammenkopieren, dass sie wirklich einzigartig sind und nicht blanke Kopien bestehender Inhalte?
Ein aktueller Fall aus Dezember 2023
Die New York Times hat die Betreiber von ChatGPT auf Schadensersatz in Höhe eines Milliardenbetrages verklagt. Grund war, dass die KI-Systeme mit den Texten der Zeitschrift trainiert wurden und Texte teils wortwörtlich die kostenpflichtigen Inhalte wiedergeben.
Noch ist offen, wie Juristen generell mit der Urheberrechtsfrage umgehen. Würde aber ein Urteil fallen, dass KI-Content das Urheberrecht verletzt, bekämen schon heute viele Website-Betreiber ein existenzielles Problem. Das LLM- (Large Language Model) Geschäftsmodell beruht auf der Verwendung von geistigem Eigentum anderer. Rein rechtlich liegt es durchaus im Bereich des Möglichen, dass zukünftige Urteile in die Richtung gehen, dass Urheber am Erfolg der Inhalte beteiligt werden müssen, die auf ihrem originären Beitrag beruhen.
Das Urteil steht noch aus, könnte aber richtungsweisend für alle sein, die sich aktuell an der KI für die Content-Erstellung bedienen.
Wissenswert: Googles Definition für „guten“ Content
Die Frage, was guter Content ist, muss regelmäßig neu betrachtet werden. Nach dem Google Update lohnt es sich, eine aktuelle Definition dafür aufzustellen, welche Texte die Suchmaschine als gut und damit empfehlenswert einstuft.
- Inhalte müssen nützlich sein (People-first-Ansatz)
- Texte müssen für Menschen geschrieben sein
- Originäre Inhalte (kein Third-Party-Content)
- Texte nehmen die Perspektive von Lesern ein, die sich mit dem Thema nicht auskennen
- Gute Texte haben eine leicht verständliche Textstruktur
- Es gibt keine inhaltlichen Redundanzen
Eine gute User Experience bleibt einer der wichtigsten Rankingfaktoren. Empfindet ein Leser einen Text als hilfreich, liest er ihn vollständig oder zeigt eine Interaktion – beispielsweise durch einen Klick auf die Kontaktseite. Google erkennt und bewertet diese Signale. Sendet ein Text diese positiven Signale nicht aus, dann ist er für Google auch nicht gut. Punkt.