2 Texte vergleichen und Ähnlichkeit ermitteln

Mit diesem Text Vergleich-Tool kannst du zwei Texte oder Dateien unterstützter Typen (z.B. .txt) vergleichen und dir die Gemeinsamkeiten und Unterschiede anzeigen lassen. Das Tool erkennt auch, ob Zeilen oder Wörter eventuell einfach fehlen und übersprungen wurden. Im Folgenden wird dir erklärt, wie du mit dem Tool arbeiten kannst und wie du die Werte deuten solltest.

So geht’s: Texte vergleichen

Im oberen Teil dieses Artikels findest du den Button „Zum Tool“ klicke darauf und schon gelangst du zu dem Dienst. Nun musst du die beiden Texte auswählen die du vergleichen möchtest.

1. Text: Wenn es sich bei dem ersten Text um eine Datei handelst klickst du auf den Button (dort steht z.B. „Datei auswählen“ oder „Durchsuchen…“) und wählst die Datei aus. Ansonsten fügst den Text einfach in das obere Textfeld ein.

2. Text: Beim 2. Text gilt genau das gleiche. Du kannst natürlich eine Datei mit einem einfachen Text vergleichen. Du solltest nur beachten, dass immer wenn einmal beides für eine Spalte ausgewählt wurde, die Datei gewählt wird.

Anschließend fährst du mit klick auf den großen Button „Weiter. Mit dem nächsten Schritt fortfahren“ fort.

Übrigens: Es gibt auch ein englischsprachiges Tutorial.

Die Auswertung des Text Vergleichs

Nun wird dir dein Ergebnis angezeigt.

  • Wenn dir auf der einen Seite eine rot hinterlegte Zeile angezeigt wird, fehlt hier eine Ziel, die im anderen Text zu finden ist.
  • Wenn eine Zeile dunkelgrau hinterlegt ist unterscheiden sich nur einzelne Wörter, diese werden farblich (grün) auf beiden Seiten hervorgehoben.
  • Zeilen, die nicht farblich hinterlegt sind, unterscheiden sich nicht voneinander.

Die Ähnlichkeit in %

Zudem wird dir über dem Vergleich die Ähnlichkeit in roter Schrift angezeigt. Um damit etwas anzufangen, solltest du zunächst wissen, wie dieser Wert ermittelt wird.

Das Tool geht Zeile für Zeile durch. Innerhalb einer Zeile zählen auch die Wörter dazu. Das sieht dann zum Beispiel so aus:

  • 1. Zeile: gleich > 100 %
  • 2. Zeile: 5/10 Wörtern gleich > 50 %
  • 3. Zeile: ungleich > 0 %

In diesem Fall würde die Ähnlichkeit, bei 50 % liegen, den Mittelwert aus allen drei Werten. Würde man dies einfach nur wörterweise machen (z.B. 50/100 Wörtern gleich) könnten sich hier ganz andere Werte ergeben. Dieses Tool ermittelt die Ähnlichkeit also anhand der Zeilen und lässt die Wörter innerhalb dieser mit einfließen.

Doch was kannst du nun mit diesem Wert anfangen? Sollte jemand die Zeilen komplett gemischt haben, wird die Ähnlichkeit sehr gering sein, auch wenn die Zeilen eventuell noch gleich sind. Im Normalfall wurden aber nur einige Zeilen und Wörter verändert oder weggelassen, dann ist der Wert relativ genau und bedeutet laut unserer Einschätzung folgendes:

  • Über 90 Prozent: Wir gehen davon aus, dass es sich um eine Kopie handelt.
  • Über 80 Prozent: Die Wahrscheinlichkeit ist (sehr) groß, dass es sich um eine Kopie handelt.
  • Über 70 Prozent: Die Texte sind sich relativ ähnlich, viele Stellen könnten übernommen wurden sein. Es handelt sich eventuell um leicht abgeänderte Texte.
  • Über 50 Prozent: Es gibt zwar viele ähnliche Stellen, jedoch mindestens so viele, die sich nicht gleichen. Einige Stellen wurden eventuell übernommen.
  • Zwischen 0 und 49,9 Periode Prozent: Diese Texte sind sich definitiv nicht ähnlich.

Beachte bitte folgendes: Je länger beide Texte desto größter sollte der Ähnlichkeitswert sein, damit die Texte als ähnlich gelten können. Bei Texten die eine Ähnlichkeit von über 90 Prozent haben, kann aber fast immer davon ausgegangen werden, dass diese Texte nahezu identisch sind.

Unterstützte Dateitypen

Nun wäre es natürlich interessant zu wissen, welche Dateitypen unser Text Vergleich korrekt lesen kann.

Unkodierte Dateien (z.B. TXT-Dateien) sind in der Regel kein Problem, kodierte Dateien (z.B. von Office Programmen) werden häufig falsch angezeigt. Du kannst die Datei auch mit einem einfachen Editor öffnen. So wie die Inhalte die dort angezeigt werden, so wird unser Tool sie wahrscheinlich auch verarbeiten.

Fazit: 2 Texte vergleichen

Der Text Vergleich (auch als DiffChecker bezeichnet) bietet dir die Möglichkeit 2 Texte schnell & einfach zu vergleichen. Neben den farblich hevorgehobenen Gemeinsamkeiten und Unterschieden wird dir auch die Ähnlichkeit in % angezeigt. Wenn du weißt wie du diese Angaben deuten musst, können sie auch sehr hilfreich sein.

Egal ob du prüfen möchtest, ob bei der Doktorarbeit einer abgeschrieben hat 😉 – wobei hier die Zeichenbegrenzung von 100.000 zu beachten ist – oder ob du belegen möchtest, dass jemand deinen Artikel kopiert hat, dieses Online Tool macht es möglich.

2 Gedanken zu „2 Texte vergleichen und Ähnlichkeit ermitteln“

  1. Hallo.

    Richtig guter, aufschlussreicher Artikel. Wir haben auf unserer Webseite nicht nur den hier erwähnten Uniqueness Checker besprochen, sondern ihn auch mit anderen Werkzeugen verglichen. So kann man durch verschiedene Tools eine noch bessere Qualität der Analyse bekommen.

    Ist zwar eine Menge Arbeit, aber was tut man nicht alles für ein gutes Ranking, oder?

    Viele Grüße und Danke für den tollen Artikel!
    Sven