KI-Training: Ist mehr immer mehr?

In einem leicht destruktiven Test gehe ich der Frage nach, ob mehr Testdaten immer auch zu besseren Ergebnissen führen. Damit verbunden ist natürlich eine kleine Kritik an der Sammelwut einiger KI-Projekte.

KI Begeisterte sind auf der Suche nach immer mehr Daten. Im Bereich Legal Tech geht der Wunsch um, möglichst viele Urteile, auch unterer Instanzen zum Training eines juristischen Sprachmodells zu nutzen.

Aber ist das tatsächlich sinnvoll. Im folgenden Video geht es um die Grenzen des Trainingsbereichs und um die Frage, ob blinde Sammelwut wirklich der KI dienlich ist. Das Experiment lässt jedenfalls Zweifel aufkommen.

Viel Spaß beim Schauen!