Selbst-lernende LLMs mit RAG Anbindung

Einführung

In diesem Blog zeigen wir Ihnen, wie KI aus ihren Fehlern lernt, und durch einmalige Korrekturen ihre zukünftigen Ergebnisse verbessern kann. Diese Technik kann für jeden Arbeitsprozess der LLMs mit RAG Anbindung verwendet mit wenig Aufwand eingebunden werden. Zur Veranschaulichung wird der Prozess von automatisierter Dokumentenverarbeitung herangezogen.

Problem

LLMs können nur eine bestimmte Menge an Daten verarbeiten, bevor sie mit neuem Input überfordert sind. Dieser limitierte „Context“ macht es notwendig, immer wieder neue Instanzen zu erstellen, die nicht auf die Ergebnisse ihrer Vorgänger zugreifen können, und ähnliche Fehler produzieren.

Diesem Problem kann teilweise mit speziellen Nachrichten (System Prompts), die dem System die wichtigsten DOs und DON’Ts mitteilen, entgegengewirkt werden. Sollte sich jedoch ein neues Problem ergeben, muss dieser Prompt angepasst und getestet werden, ob durch die Änderungen keine vorangegangene Probleme auftreten.

Mit der Methode von RAG, bei der spezifische Informationen basierend auf der Frage aus einer Datenbank extrahiert und der Frage als Kontext beigefügt werden, kann diese Problematik überwunden werden.

Unsere Umsetzung

Durch die Notwendigkeit, Fehler des LLMs zu korrigieren, braucht es einen „Human-in-the-loop“, einen Menschen, der die Ausgaben der KI überprüft und absegnet. Initial falsche, korrigierte Ausgaben können mit unserem System an die RAG-Datenbank übermittelt werden, und somit in einer zukünftigen Anfrage als Kontext fungieren. Dadurch erhöht sich nachweisbar die Wahrscheinlichkeit, dass der gleiche Fehler bei einem zukünftigen Dokument nicht mehr auftritt, ohne einen neuen Arbeitsschritt (Anpassung des System Prompts) in der Ablauf einzuführen.

Am Beispiel der Blumatix Intelligence GmbH, eine Firma welche automatisiert Rechnungsdaten extrahiert und verarbeitet, konnte die Implementierung erfolgreich getestet werden. Dokumente welche bei erstmaliger Verarbeitung fehlerhafte Daten lieferten (z.B. Umsatzsteuer-Nummer, Netto-Betrag, …) wurden nach der Korrektur und Einspeisung in die Datenbank korrekt als Kontext extrahiert und der Inhalt richtig klassifiziert.

Fazit

Die Implementierung des FHS-Blumatix Prototypen brachte eine Verbesserung gegenüber Kontext-losen LLMs in allen 6 getesteten Teilbereichen gegenüber dem Referenz-Wert. Vor allem im zuvor schwierigsten Teilbereich ließ sich eine deutliche Steigerung erkennen.

Diese Technik bildet eine simple und unaufwändige Möglichkeit, wiederkehrende Fehler effizient zu minimieren und kann für eine große Bandbreite an Anwendungen eingesetzt werden.

Referenzen

Yepes, A. J., You, Y., Milczek, J., Laverde, S., & Li, R. (2024). Financial report chunking for effective retrieval augmented generation. arXiv preprint arXiv:2402.05131.
Bhat, S. R., Rudat, M., Spiekermann, J., & Flores-Herr, N. (2025). Rethinking Chunk Size For Long-Document Retrieval: A Multi-Dataset Analysis. arXiv preprint arXiv:2505.21700
Asai, A., Wu, Z., Wang, Y., Sil, A., & Hajishirzi, H. (2024). Self-rag: Learning to retrieve, generate, and critique through self-reflection.
Tao, Z., Lin, T. E., Chen, X., Li, H., Wu, Y., Li, Y., … & Zhou, J. (2024). A survey on self-evolution of large language models. arXiv preprint arXiv:2404.14387.
Béchard, P., & Ayala, O. M. (2024). Reducing hallucination in structured outputs via Retrieval-Augmented Generation. arXiv preprint arXiv:2404.08189.
Cuconasu, F., Trappolini, G., Siciliano, F., Filice, S., Campagnano, C., Maarek, Y., … & Silvestri, F. (2024, July). The power of noise: Redefining retrieval for rag systems. In Proceedings of the 47th International ACM SIGIR Conference on Research and Development in Information Retrieval (pp. 719-729).