Guttenberg-Plagiate: Wie sieht’s aus mit doppeltem Content?
Die Berichterstattung über die aus unterschiedlichen Versatzstücken zusammenkopierte Dissertation (wie man sie im Guttenplag-Wiki nachlesen kann) von Verteidigungsminister Guttenberg hat ja schon die unterschiedlichsten Facetten beleuchtet. Aber die SEO-Sicht fehlt bisher noch – dabei ist die ganz unterhaltsam. Woran denkt der Suchmaschinenoptimierer, wenn er Copy-and-Paste hört? Genau, an duplicate Content.
Wie in der seriösen Wissenschaft straft Google nämlich das einfache Kopieren von Inhalten ab. Um den Plagiatoren auf die Schliche zu kommen, haben die Fachleute von Google ein Verfahren entwickelt, das bereits 2003 patentiert wurde.
In dem Verfahren werden Wortgruppen in einem Sliding Window verglichen. Die Länge der geprüften Wortgruppen liegt wahrscheinlich zwischen Satz- und Absatzlänge.
Ganz ähnlich wie Google arbeiten die unterschiedlichen Plagiatssoftwares, die teilweise an den Universitäten zur Aufdeckung unredlicher Zitierweisen eingesetzt werden. Um von der Software nicht überführt zu werden, muss man innerhalb der Wortgruppen variieren – also am besten in jedem Satz ein paar Wörter umstellen.

Gelb markiert sind die Abweichungen vom Original im Vergleich zur Guttenberg-Diss. Dieses Beispiel würde Google als duplicate content werten.(Quelle: spiegel.de)
Fazit: Wäre Guttenbergs Arbeit digital veröffentlich worden, würden ihm wegen zu langer kopierter Textpassagen unter Umständen sogar noch die Google-Gelbe-Karte für doppelten Content drohen. Ob ihn das schrecken würde?

Letzte Kommentare