ChatGPT – Ein persönlicher Zwischenstand

Es ist wichtig, dass …“  Eine Phrase wird für mich zum Symbol einer Sprache, die ich selbst so nie sprechen würde. In den ChatGPT-Texten kommt sie gefühlt sehr häufig vor. Und so ein bisschen nervt die so perfekte und pseudo-individuelle Ausdrucksweise – ähnlich übrigens wie die KI-generierten Bilder: Perfekt ausgeleuchtete, selbst wenn faltig noch glattgebügelte, letztlich seelenlose Plastikmenschen. 

Das zweite Jahr im ChatGPT-Zeitalter nähert sich dem Ende. Grund genug für eine kurze, sehr persönliche Rückschau – und einen Ausblick.

Mal wieder schwarzfahrende Kids

Erst die schlechte Nachricht: Auch die neuste Version des bekanntesten Sprachmodels kommt mit meiner Lieblingsfrage nicht zurecht. Immer noch ist Schwarzfahren eine „Ordnungswidrigkeit“ und immer noch gilt das für Minderjährige genau so wie für Erwachsene. Immer noch gibt ChatGPT sprachgewandt und plausibel begründet eine leider falsche Auskunft. Die von Version zu Version erhoffte und auch versprochene Verbesserung ist ausgeblieben.

Nun die gute Nachricht: Es gibt mittlerweile Chatbots, die dem Problem Herr werden. Einen davon habe ich selbst einmal auf Basis von ChatGPT implementiert. Und dabei konnte ich viel lernen. So lässt sich KI ganz gerne von zu viel Information ablenken. Es fällt ihr schwer, wichtiges von unwichtigem zu unterscheiden. Aber eine kurze und prägnante Vorinformation (Kontext) reicht, um unsere neue Assistentin auf den rechten Pfad zu lenken. Entstanden ist eine brauchbare Beraterin für die Betroffenen, die gerne und richtig Auskunft erteilt und sogar Briefe an Verkehrsbetriebe formuliert. 

Rechnet man aber den Aufwand für dieses kleinteilige Rechtsthema hoch auf all das, was da noch denkbar ist, wird die Optimierung von ChatGPT wohl noch etwas Zeit in Anspruch nehmen. Hoffnungsvoller, allerdings nur für juristische Profis, sind da Ansätze, die ihr Trainingsmaterial nicht aus der Masse, sondern aus der Klasse, sprich juristischen Fachtexten beziehen. Sie können auch ohne vertikale Spezialisierung richtige Antworten liefern. Ein Test bei einem hier ungenannten Anbieter war da tatsächlich erfolgreich und brachte einige überraschend gute Fundstellen zutage. Für Laien ist das aber nichts.

Damit bleibt natürlich die Frage offen, ob man wirklich guten Gewissens einen generischen KI Chatbot auf beliebige naive und unerfahrene Nutzer:innen loslassen darf. Ich tendiere hier trotz klaren Hinweises „ChatGPT can make mistakes. Check important info“ zur Ablehnung.

Ganz persönliche Projekte

Wenn mir dieses Thema aufgrund seiner banalen Ausgangslage (Minderjähriger fährt schwarz) und der dennoch nicht so banalen Rechtslage immer wieder als Testszenario Spaß macht, so gab es doch mehr.

Emozipnal, ein aus einer Laune heraus erfundenes Medikament, diente als Ausgangspunkt für ein KI-generiertes Büchlein, das bereits zweimal erweitert und neu aufgelegt wurde. Mit einer Sammlung von Texten aus verschiedenen Genres demonstriert es nicht nur die Vielseitigkeit von KI, sondern hält auch den entsprechenden Disziplinen einen digitalen Spiegel vor. Auf einer Webseite emozipnal.xyz kann man zudem mit dem Erfinder diskutieren und Neuigkeiten abrufen.

Etwas berufsnäher ist die Seite des EDVGT edvgt.2be.legal mit einer ganzen Sammlung unterschiedlicher juristischer Chatbots. Man sieht vor allem die Möglichkeiten der Optimierung durch Spezialisierung. Man sieht auch die Möglichkeiten der Manipulation. Glaube keinem Chatbot, den Du nicht selbst konditioniert hast. 

Meinen guten alten Show Case news.2be.legal habe ich mit State of the Art KI-Features aufgehübscht. Die Ergebnisse sind interessant aber weit weg von optimal. Viel Schönes dabei.

Womit kann ich Ihnen helfen“ steht im Suchschlitz der neuen Homepage unseres Landratsamtes. Aber wenn man in natürlicher Sprache eine Frage eingibt, kommen keine sinnvollen Ergebnisse.  So entstand rathaus.chat, eine Seite, die ich selbst regelmäßig nutze und die wirklich hilfreich ist. Sie demonstriert einen modernen, bürger:innenfreundlichen Zugang zu wichtigen Informationen: Zuständigkeiten, Telefonnummern, E-Mails und Tipps.

Auch hier gab es einige Learnings bis das so funktionierte, wie gewünscht. Einfach ist auch bei KI nichts. Aber das Ergebnis ist aus meiner Sicht sehenswert.

Experimente

Die „Psychologie“ von KI-Systemen im Kosmos überschaubarer Probleme sollte eine Reihe von Experimenten aus den letzten Wochen demonstrieren.  In Reminiszenz eines Tests von neuronalen Netzen aus einem Seminar Ende der 1980er entstand eine Reihe von kleineren Versuchen mit einem simplen Ziel: Aus drei Klausurnoten eine Endnote zu ermitteln. 

Klingt trivial? Man kann hier einiges über den Unterschied von Denken und Trainieren erfahren, zwischen guten, schlechten und zu vielen Trainingsdaten und über die Unzuverlässigkeit von Try and Error. Es ging um die Schädlichkeit eintöniger Information genau so wie um Ausnahmen und Widersprüche.

Mit einer Prise Phantasie erschließen sich auf ganz eigene Weise Möglichkeiten und Grenzen von KI auch im Rechtsbereich.

Dos and Don’ts

Und dann kam neulich die Frage: „Wofür kann man KI nun im juristischen Umfeld einsetzen – und wofür nicht?“ Ich möchte die Antwort mit zwei ganz aktuellen, etwas politischen Beispielen geben:

Kontaminierte Äpfel

Schorf an Apfelfrucht. Foto © Pflanzenschutzamt Berlin
Schorf an Apfelfrucht. Foto © Pflanzenschutzamt Berlin

Gerade war in den Medien zu hören, Agrarminister Cem Özdemir möchte dieses Jahr die Grenzwerte für Folpet bei Äpfeln auf das 20-fache erhöhen – so könnten diese unerträglichen Schorfstellen auf der Apfelschale verhindert werden.

Nur wie hoch ist der Grenzwert aktuell?

Ich: „Wie hoch darf die maximale Belastung von Äpfeln mit Folpet in der EU sein?“ – Ich frage immer wie Lieschen Müller und ich stehe dazu.

ChatGPT: „Die maximale Rückstandshöchstmenge … von Folpet in Äpfeln … ist durch die Verordnung (EG) Nr. 396/2005 festgelegt. Laut dieser Verordnung beträgt die MRL für Folpet in Äpfeln 5 mg/kg. ….
Es ist wichtig, die aktuellen Verordnungen zu konsultieren, um sicherzustellen, dass die Informationen aktuell sind.“ 

Die Verordnung stimmt. Tatsächlich liegt die Höchstmenge aber bei 0,3mg/kg. Das System hat da wohl die Träume der Obstbauern und die harte EU-Realität verwechselt. Die vorgenannten Experimente hätten das mit widersprüchlichem Training aus Wunsch und Wirklichkeit erklärt.

Hätte man übrigens die Datenbank der EU konsultiert, wäre aufgefallen, dass die Werte bei Äpfeln im Vergleich zu anderem Obst ohnehin sehr hoch sind. Ein Link auf diese Datenbank wäre die bessere Antwort gewesen.

Also Rückstandshöchstmengen sind so ziemlich das negative Extrem des Einsatzgebiets von KI. Kein Thema für „ungefähr“ und „wahrscheinlich„. Die Angaben müssen präzise und gut nachprüfbar sein, es gibt eine passable aber versteckte Datenbank und sonst nur fragmentarische Informationen im Netz. Letztlich hängt aber die Gesundheit von Menschen davon ab. Sicher ein hochspannendes Spezialprojekt. Aber für ChatGPT gilt: „Si tacuisses …

Urlaub und Asyl

KI-generiertes Bild eines Politikers mit Text "Wenn Afghanistan als Urlaubsland sicher ist, dann muss man dahin auch abgeschoben werden können."
KI-generiertes Symbolbild eines Politikers mit manuell zugefügtem Text. Der Versuch, den Text von der KI einbauen zu lassen, ist kläglich gescheitert.

Ein paar Tage später postet der Fraktionssprecher einer christlichen und sozialen Union in Bayern folgende Aussage: „Wenn Afghanistan als Urlaubsland sicher ist, dann muss man dahin auch abgeschoben werden können.

Ich: „Was hältst Du von folgender Aussage? ….

ChatGPT: „… Fazit – Die Aussage stellt eine Vereinfachung dar und greift zu kurz, da sie die komplexen rechtlichen und humanitären Überlegungen, die bei Abschiebungen eine Rolle spielen, außer Acht lässt. Afghanistan mag für bestimmte Personen oder in bestimmten Regionen als unsicher gelten, ohne dass dies bedeutet, dass das gesamte Land als unsicher für touristische Reisen gilt oder umgekehrt. Die Sicherheit eines Landes für Touristen ist nicht gleichbedeutend mit der Sicherheit für eine Abschiebung.

Das hätte ich kaum besser sagen können. Und vor allem so schön unaufgeregt.

Damit haben wir gleich einige fast ideale Anwendungsbereiche: Textanalyse, Ideenenwicklung, Argumentationshilfe und vor allem Ermittlung eines Common Sense. Wer wissen will, was man so meint, ist bei ChatGPT ganz gut aufgehoben. Ob das immer wirklich der Mittelwert von Volkes Meinung ist oder durch einen Bias stark tendenziös verfärbt, mag dahingestellt sein.

Als Sparringspartner ist die KI allemal sehr hilfreich. Zum Schreiben belangloser aber umfassender Reden für Politiker:innen und anderer fachfremder Führungspersonen übrigens auch. 

Ausblick

Und ich könnte noch jede Menge andere Anwendungsgebiete aufzählen. KI hat unsere Arbeitsweise verändert und wird es weiter tun. Sie hilft zu analysieren, formulieren, zu programmieren und übersetzen, zu visualisieren, ja sogar zu sprechen. 

KI ist mehr Mediatorin als Richterin, mehr Assistentin als Entscheiderin, mehr Advocata Diaboli als Advokatin der Mandantschaft. In diesem Sinne ist sie eine wahre Gamechangerin, die bereits jetzt meine Effizienz steigert und auf die ich nicht mehr verzichten möchte.