Am 30. November 2022 stellte OpenAI das KI-System “ChatGPT” (https://openai.com/blog/chatgpt/) vor, eine universelle künstliche Intelligenz, die eine Reihe von Texten erstellen kann, darunter unter anderem auch Schulaufgaben oder Essays. Der Output (z. B. Aufsätze, Blogposts) und die Fähigkeiten von ChatGPT sind herausragend, absolut erstaunlich – vor allem wenn man bedenkt, wie schnell sich diese Technologie entwickelt.
Wenn ich ein Schüler oder Student wäre, würde ich ChatGPT unter Garantie benutzen, um die meisten meiner Schulaufgaben mit kleinen Korrekturen gewissermaßen im Handumdrehen zu erledigen.
Das schafft ein nicht zu unterschätzendes Problem für Lehrer, Professoren und Ausbilder, da es schwierig ist, zu erkennen, ob ein Aufsatz von einem Schüler oder von einer künstlichen Intelligenz a la ChatGPT geschrieben wurde. Man bräuchte eine Art von Instrument, um dies zu überprüfen.
Die Frage ist also:
Wie OpenAI ChatGPT Text identifizieren?
GPT Output Detector
Die gute Nachricht ist, dass die KI Community Hugging Face ein Tool namens GPT-2 Output Detector entwickelt hat, das in Zusammenarbeit mit OpenAI und Personen der Harvard University entstanden ist (für weitere Informationen: https://huggingface.co/roberta-base-openai-detector).
Ich habe ChatGPT gebeten, uns einen Blogbeitrag über das bekannte WordPress Caching Plugin WP Rocket und einen Aufsatz von 500 Wörtern über William Shakespeare auf Englisch zu schreiben, um die Verwendung des Programms illustrieren zu können.
ChatGPT brauchte etwa 10 Sekunden, um einen kurzen, vollständigen Blogbeitrag mit 375 Wörtern (!) zu verfassen und etwa 30 Sekunden, um einen Aufsatz mit über 500 Wörtern zu verfassen. Ohne weitere Anpassungen vorzunehmen, haben wir die Ergebnisse einfach kopiert und in dem GPT Detector eingefügt:
Das Tool hat treffend festgestellt, dass der Blogbeitrag mit einer Wahrscheinlichkeit von 99,98 % mit OpenAI GPT erstellt wurde.
Interessanterweise hat es auch korrekt erkannt, dass der Aufsatz über Shakespeare mit einer Wahrscheinlichkeit von 99,98 % von einer KI generiert wurde.
Es ist wichtig zu bedenken, dass dieses Tool, genau wie alles andere, was mit KI zu tun hat, eine hohe Wahrscheinlichkeit hat, ChatGPT Text zu erkennen, aber halt nicht hundertprozentig.
Hier die schlechte Nachricht.
Im Folgenden sehen Sie, wie die Prognose ausfiel, nachdem wir bestimmte Änderungen am Blogbeitrag vorgenommen hatten, die von einer Technologie zur Umformulierung von Phrasen automatisch vorgenommen wurden. Die erforderliche Zeit betrug ganze zwei Minuten.
Wie man sehen kann, ist es nicht so schwer, trotz Detector KI-generierte Inhalte zu nutzen. Es wird sehr spannend sein, zu sehen, wie sich dies in Zukunft entwickeln wird.
Probieren Sie das Tool aus! Wenn Sie mehr über die Erkennung von OpenAI ChatGPT erfahren möchten, werfen Sie einen Blick auf die Forschungsarbeit, auf die weiter oben in diesem Blogbeitrag verwiesen wurde.
Wenn Sie Fragen oder Kommentare haben, können Sie diese hier stellen.
Quellen
Nachfolgend finden Sie eine Liste der in diesem Tutorial verwendeten oder referenzierten Ressourcen:
- Hugging Face (https://huggingface.co/)
- GPT-2 Output Detector Demo (https://huggingface.co/openai-detector)
- Details on GPT-2 Output Detector (https://huggingface.co/roberta-base-openai-detector)
- OpenAI chatGPT (https://chat.openai.com/chat)
- LearnGPT, dozens of ChatGPT Examples (https://www.learngpt.com/)
Frequently Asked Questions
Wie wir gezeigt haben, gibt es Tools, die KI-generierte Inhalte wie GPT-3 mit hoher Wahrscheinlichkeit erkennen können. Dennoch gibt es keine 100%ige Sicherheit. Die OpenAI-Forscher haben weiterhin bereits gezeigt, dass es möglich ist, von KI erzeugte Inhalte unsichtbar mit einer Art Wasserzeichen zu versehen.
ChatGPT wurde mit großen Datenmengen aus dem Internet trainiert, darunter auch Gesprächsaufzeichnungen. Außerdem wurde es mit einer maschinellen Lerntechnik namens “Reinforcement Learning from Human Feedback” (RLHF) trainiert, bei der menschliche Trainer dem Modell Gespräche vorgaben, in denen sie sowohl die Rolle des KI-Chatbots als auch die des Nutzers spielten. Das Modell wurde dann auf beide Arten von Daten trainiert. Die Ingenieure gaben an, dass die gesamten Daten insgesamt 45 Terabyte umfassten.
Wenn Sie bereits ein Konto bei labs.openai.com oder beta.openai.com haben, können Sie die gleichen Anmeldeinformationen bei chat.openai.com verwenden. Wenn Sie noch kein Konto haben, müssen Sie eines auf chat.openai.com erstellen.
Wie wir gezeigt haben, gibt es Tools wie dem Hugging Face GPT Detector, die KI-generierte Inhalte wie GPT-3 mit einer hohen Wahrscheinlichkeit erkennen können. Dennoch gibt es keine 100%ige Sicherheit. OpenAI-Forscher haben gezeigt, dass es möglich ist, von KI generierte Inhalte unsichtbar mit einer Art von Wasserzeichen zu versehen.
Wiederholungen sind eines der offensichtlichsten Anzeichen dafür, dass ein Inhalt von einem Algorithmus geschrieben wurde. Bislang verfügt ein Bot einfach nicht über den gleichen Wissensschatz wie ein menschlicher Autor, auch nicht, wenn er Daten aus externen Quellen kombiniert. Es verfügt nicht über die Intuition, Texte zu sortieren und originelle Ideen zu finden. Das Ergebnis ist ein Text, der immer wieder umgeschrieben wird.
Man geht davon aus, dass selbst der fortschrittlichste KI-Schreiber etwa 100 Wörter zu einem bestimmten Thema schreiben kann, bevor er anfängt, sich zu wiederholen oder neue Wörter zu erfinden (Stand: 2022). Studien zeigen, dass die beste Bloglänge für die Suchmaschinenoptimierung bei mindestens 2.000 Wörtern liegt. Es ist also unwahrscheinlich, dass die aktuelle Generation von KI Bots in der Lage sein wird, lange Artikel zu schreiben, die aussehen, als wären sie von einem Menschen geschrieben worden. Die Betonung liegt hier auf “aktuell”.
Unsere anderen Blog posts

Top 10 Mistakes Small Business Owners Make When Using SEO
Know Which Common SEO Mistakes to Avoid to Grow Your Local Business In spite of the importance of search engine
6 Top Places to Hire WordPress Developers
Sometimes you need the help of a WordPress Professional. As WordPress is so widely used, there is no shortage of