
Prompt-Optimierung wird immer wichtiger, weil LLM in Lern- und Arbeitsprozessen zuverlässig, konsistent und strukturiert antworten müssen. DSPy (Declarative Self-improving Python) hilft dabei, indem man Aufgaben deklarativ beschreibt und Prompts bzw. Komponenten automatisch anhand von Beispielen und Metriken optimieren lässt – statt alles manuell zu „prompten“.
Manuelle Prompt-Iterationen sind zeitaufwendig, schwer reproduzierbar und oft instabil: Kleine Änderungen am Input oder Modell führen zu stark unterschiedlichen Ergebnissen. Gleichzeitig steigen die Erwartungen an Qualität und genau das lässt sich ohne systematische Optimierung nur schwer skalieren.
In Zusammenarbeit mit der Firma Blumatix GmbH wurde ein Proof-of-Concept für einen automatisierten Prompt-Optimierungsworkflow für die Extraktion von Rechnungsdaten entwickelt, der auf dem DSPy-Framework basiert. Statt Prompts manuell zu iterieren, nutzt das System MIPROv2- und GEPA-Optimierer, um Prompts systematisch zu verbessern. Folgende Kernkomponenten wurden verwendet für das Projekt.
Die automatische Prompt-Optimierung mit DSPy zeigt, dass datengetriebene Ansätze die manuelle Prompt-Entwicklung deutlich übertreffen können. Durch systematische Evaluierung und metrik-basierter Auswahl erreichen wir nicht nur höhere Extraktionsgenauigkeit, sondern auch bessere Reproduzierbarkeit und geringeren Wartungsaufwand. Die Kombination aus DSPy, automatischer Optimierung und qualitätssichernden Mechanismen macht LLM-basierte Extraktion zu einer potentiellen produktionsreifen Lösung für die strukturíerte Datenextraktion aus Dokumenten.
Gerne optimieren und automatisieren wir Ihre Prozesse. Hierfür senden Sie gerne eine Mail an: markus.tatzgern@fh-salzburg.ac.at