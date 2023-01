Seit der Einführung des OpenAI-Chatbots ChatGPT im November beispielsweise haben Studenten bereits begonnen, ihn zum Schummeln zu verwenden, indem sie Aufsätze für sie schreiben. Die Nachrichten-Website CNET hat ChatGPT zum Schreiben von Artikeln verwendet, nur um unter Plagiatsvorwürfen Korrekturen herausgeben zu müssen. Aber es gibt einen vielversprechenden Weg, KI-Text zu erkennen: durch Einbetten versteckter Muster, die es uns ermöglichen, KI-generierten Text in diesen Systemen zu identifizieren, bevor sie veröffentlicht werden.

In Studien haben diese Wasserzeichen bereits gezeigt, dass sie KI-generierten Text mit ziemlicher Sicherheit identifizieren können. Einer, der von einem Team der University of Maryland entwickelt wurde, war in der Lage, Text zu erkennen, der mit Metas Open-Source-Sprachmodell OPT-6.7B erstellt wurde, indem er einen von ihnen entwickelten Erkennungsalgorithmus verwendete. Die Arbeit wird in einem Papier beschrieben, das noch von Experten begutachtet werden muss, und der Code wird um den 15. Februar herum kostenlos verfügbar sein.

KI-Sprachmodelle funktionieren, indem sie jeweils ein Wort vorhersagen und generieren. Nach jedem Wort teilt der Wasserzeichenalgorithmus das Vokabular des Sprachmodells zufällig in Wörter auf einer „grünen Liste“ und einer „roten Liste“ und fordert das Sprachmodell dann auf, Wörter auf der grünen Liste auszuwählen.

Je mehr Wörter auf der grünen Liste in einer Passage stehen, desto wahrscheinlicher ist es, dass der Text von einer Maschine generiert wurde. Von einer Person geschriebener Text enthält in der Regel eine zufälligere Mischung von Wörtern. Beispielsweise könnte der Wasserzeichenalgorithmus für das Wort „schön“ das Wort „Blume“ als grün und „Orchidee“ als rot klassifizieren. Das KI-Modell mit dem Wasserzeichenalgorithmus würde eher das Wort „Blume“ als „Orchidee“ verwenden, erklärt Tom Goldstein, Assistenzprofessor an der University of Maryland, der an der Forschung beteiligt war.