Was ist Semantic Chunking?

Semantic Chunking ist der Prozess der Segmentierung von Langtexten in kleinere, eigenständige Einheiten basierend auf inhaltlicher Kohärenz statt Zeichenbegrenzung. Dies gewährleistet, dass die KI den Kontext behält und präzise Quellen zitiert. Wer smart chunked (etwa nach Absätzen statt Zeichenanzahl), kann Genauigkeit von 75% auf 98% erhöhen.

Was ist Datenbereinigung (Data Cleaning)?

Datenbereinigung ist der Prozess der Bereinigung von Rohdaten vor der Analyse — Entfernung von Duplikaten, Ausreißern und fehlenden Werten. Dies liegt zeitlich vor der semantischen Analyse und ist Voraussetzung für qualitativ hochwertige KI-Systeme. Datenbereinigung und Chunking sind komplementäre, nicht austauschbare Prozesse.

Was sind AI-Evals (AI-Evaluations)?

AI-Evals sind Frameworks zur quantitativen und qualitativen Bewertung von LLM-Outputs. Sie nutzen vordefinierte Test-Sets, um Performance gegen Benchmarks zu validieren oder mittels LLM-as-a-Judge automatisierte Bewertungen durchzuführen. Evals sind die Qualitätskontrolle der KI — ohne Evals wissen Sie nicht, ob Ihr System zu 60% oder 95% korrekt antwortet.

Was ist Grounding bei KI-Systemen?

Grounding ist der Prozess, LLM-Antworten strikt auf verifizierte Datenquellen zu limitieren. Das Modell wird angewiesen, Behauptungen ausschließlich auf im Prompt bereitgestellte Kontexte zu stützen. Grounding ist das effektivste Mittel gegen Halluzinationen in Fachanwendungen und ist essentiell für Enterprise-KI.

Enterprise-KI-Glossar: RAG-Systeme, AI-Evaluations & Datenbereinigung | Blog

Q: Was ist RAG (Retrieval-Augmented Generation)?

RAG kombiniert ein Large Language Model mit einem externen Information-Retrieval-System. Vor der Antwortgenerierung wird eine Abfrage an eine Datenquelle durchgeführt, um relevante Kontexte zu extrahieren. Dies verhindert, dass die KI auf veraltetes Wissen zurückgreift und liefert Antworten basierend auf aktuellen Dokumenten statt Trainingsdaten von vor zwei Jahren.

Q: Was sind Embeddings?

Embeddings transformieren unstrukturierte Daten wie Text, Bilder oder Audio in hochdimensionale numerische Vektoren. Dieser Prozess bildet semantische Relationen in einem mathematischen Vektorraum ab, wobei inhaltlich verwandte Konzepte eine geringere Distanz zueinander aufweisen. Dies ermöglicht es der KI, die Bedeutung hinter Wörtern zu verstehen, nicht nur ihre wörtliche Form.

Q: Was ist eine Vektordatenbank?

Eine Vektordatenbank ist spezialisierte Infrastruktur zur Speicherung und Indizierung von Embeddings. Sie ermöglicht effiziente Ähnlichkeitssuchen (Approximate Nearest Neighbor Search) in multidimensionalen Räumen. Dies erlaubt den performanten Zugriff auf Millionen von Datensätzen in Millisekunden und stabilisiert Betriebskosten bei wachsendem Datenvolumen.

Q: Was sind Halluzinationen in KI-Modellen?

Eine Halluzination ist ein Phänomen, bei dem ein generatives Modell syntaktisch korrekte, aber faktisch falsche oder nicht durch Quelldaten gedeckte Informationen erzeugt. Dies resultiert meist aus der probabilistischen Natur der Token-Vorhersage. Durch RAG und Grounding wird dieses Risiko im Enterprise-Umfeld minimiert.

Q: Was ist Faithfulness als Evaluierungsmetrik?

Faithfulness misst, inwieweit die generierte Antwort konsistent mit bereitgestellten Quelldokumenten ist. Sie prüft, ob alle in der Antwort enthaltenen Fakten direkt aus dem Kontext abgeleitet werden können. Hohe Faithfulness garantiert, dass die KI keine eigenen, potenziell falschen Fakten hinzuerfindet.

Q: Was ist Prompt Composition?

Prompt Composition ist die methodische Strukturierung komplexer Eingabebefehle. Dies umfasst die Integration von System-Instruktionen, dynamischen Kontexten, Few-Shot-Beispielen und Output-Formatvorgaben in eine logische Abfolge. Dies ermöglicht hochgradig personalisierte und konsistente KI-Antworten in automatisierten Workflows.

Warum dieses Glossar? In fast jedem Discovery-Gespräch passiert dasselbe: Der Entscheider nickt bei ‚RAG‘, aber meint etwas anderes als der Entwickler im selben Raum. Dieses Glossar soll hier Abhilfe schaffen.

1. Kernarchitektur: RAG-Architektur & Retrieval-Systeme

RAG (Retrieval-Augmented Generation)+

Definition: Ein Architektur-Muster, das ein Large Language Model (LLM) mit einem externen Information-Retrieval-System kombiniert. Vor der Antwortgenerierung wird eine Abfrage an eine Datenquelle durchgeführt, um relevante Kontexte zu extrahieren, die dem Modell als zusätzliche Eingabe (Prompt-Erweiterung) bereitgestellt werden.

Wirtschaftlicher Nutzen: RAG-Systeme verhindern, dass die KI auf veraltetes Wissen zurückgreift. Sie liefert Antworten basierend auf Ihren aktuellen Dokumenten, nicht auf Trainingsdaten von vor zwei Jahren. Interne Daten werden zur Grundlage, während Datenhoheit bestehen bleibt.

Beispiel-Case: Ein mittelständischer Maschinenbauer hat 5.000 PDF-Wartungshandbücher. Techniker benötigen im Feld oft 15 Minuten, um die korrekte Drehmoment-Einstellung zu finden.

Lösung: Implementierung eines RAG-Systems. Der Techniker stellt eine Frage per Spracheingabe. Das System extrahiert die exakte Passage aus dem Handbuch Modell-Revision 2023 und liefert die Antwort in 2 Sekunden inkl. Quellenangabe.

Embedding+

Definition: Die Transformation von unstrukturierten Daten (Text, Bild, Audio) in hochdimensionale numerische Vektoren. Dieser Prozess bildet semantische Relationen in einem mathematischen Vektorraum ab, wobei inhaltlich verwandte Konzepte eine geringere Distanz (z. B. Kosinus-Ähnlichkeit) zueinander aufweisen.

Wirtschaftlicher Nutzen: Embeddings ermöglichen es der KI, die Bedeutung hinter Wörtern zu verstehen. So findet das System Informationen über „Kosteneffizienz“, auch wenn im Dokument nur von „Sparen“ die Rede ist.

Mehr erfahren

Beispiel-Case: Ein Kunde sucht in einem Onlineshop für Ersatzteile nach „Vorrichtung zum Feststellen von Bolzen“, im System ist jedoch nur „Arretierungsstift“ hinterlegt.

Lösung: Durch Embeddings erkennt die KI die semantische Ähnlichkeit. Der Kunde findet das Produkt sofort, was die Conversion-Rate um 12 % steigert.

Vector Database (Vektordatenbank)+

Definition: Eine Vektordatenbank bildet die Grundlage für RAG Systeme. Sie ist eine spezialisierte Datenbank-Infrastruktur zur Speicherung und Indizierung von Embeddings. Sie ermöglicht die effiziente Durchführung von Ähnlichkeitssuchen (Approximate Nearest Neighbor Search) in multidimensionalen Räumen.

Wirtschaftlicher Nutzen: Skalierbarkeit der AI-Infrastruktur. Sie erlaubt den performanten Zugriff auf Millionen von Datensätzen in Millisekunden, was die Betriebskosten bei wachsendem Datenvolumen stabilisiert. Vektordatenbanken ermöglichen den Einbau von Metadaten, um z.b. Zeiträume zu filtern, um die Wissensbasis vorzufiltern und genau einen Ausschnitt der Daten zu nutzen.

Beispiel-Case: Ein Rechtsportal möchte 2 Millionen Gerichtsurteile durchsuchbar machen. Eine herkömmliche SQL-Datenbank wird bei komplexen semantischen Abfragen zu langsam.

Lösung: Einsatz einer Vektordatenbank (z. B. Pinecone oder Weaviate). Die Abfragegeschwindigkeit wird um den Faktor 50 beschleunigt, was die Serverkosten pro User-Session um 18 % senkt.

Chunking (Semantic Chunking)+

Definition: Der Prozess der Segmentierung von Langtexten in kleinere, eigenständige Einheiten (Chunks). Beim Semantic Chunking erfolgt die Segmentierung nicht nach Zeichenbegrenzung, sondern basierend auf inhaltlichen Kohärenz-Schnittstellen, um die semantische Integrität der Informationseinheit zu wahren.

Wirtschaftlicher Nutzen: Nur wer „smart“ chunked (z.B. nach Absätzen statt nach Zeichenanzahl), stellt sicher, dass die KI den Kontext behält und präzise Quellen zitiert.

Beispiel-Case: Ein 50-seitiger Projektvertrag soll auf Compliance-Risiken geprüft werden. Einfaches Chunking zerschneidet einen wichtigen Haftungsparagraphen in der Mitte.

Lösung: Semantic Chunking erkennt das Ende des Paragraphen. Die KI erhält den vollständigen Kontext der Klausel, was die Genauigkeit der Risikoanalyse von 75 % auf 98 % hebt.

Datenbereinigung (Data Cleaning)+

Definition: Der Prozess der Bereinigung von Rohdaten vor der Analyse, d.h. Entfernung von Duplikaten, Ausreißern, fehlenden Werten. Liegt vor der semantischen Analyse.

Data Cleaning vs. Semantic Chunking:

Datenbereinigung braucht es immer zuerst (Datenqualität)
Chunking kommt danach (für Retrieval-Systeme relevant)

2. KI-Qualitätskontrolle: AI-Evaluations & Grounding

AI-Evals (AI-Evaluations)+

Definition: Frameworks zur quantitativen und qualitativen Bewertung von LLM-Outputs. Dabei werden vordefinierte Test-Sets genutzt, z.b. um die Performance gegen Benchmarks oder mittels LLM-as-a-judge (automatisierte Bewertung durch ein übergeordnetes Modell) zu validieren. Darüber hinaus existieren zahlreiche Methoden, AI-Evals anzuwenden.

Wirtschaftlicher Nutzen: Evals sind die Qualitätskontrolle der KI. Ohne Evals wissen Sie nicht, ob Ihr System zu 60% oder 95% korrekt antwortet.

Mehr erfahren

Grounding+

Definition: Der Prozess, die Antworten eines LLMs strikt auf verifizierte Datenquellen zu limitieren. Hierbei wird das Modell angewiesen, Behauptungen ausschließlich auf die im Prompt bereitgestellten Kontexte zu stützen.

Wirtschaftlicher Nutzen: Grounding ist das effektivste Mittel gegen Halluzinationen in Fachanwendungen.

Hallucination+

Definition: Ein Phänomen, bei dem ein generatives Modell syntaktisch korrekte, aber faktisch falsche oder nicht durch die Quelldaten gedeckte Informationen erzeugt. Dies resultiert meist aus der probabilistischen Natur der Token-Vorhersage.

Wirtschaftlicher Nutzen: Ein hohes Risiko für die Reputation. Durch RAG und Grounding wird dieses Risiko im Enterprise-Umfeld minimiert.

Faithfulness+

Definition: Eine spezifische Evaluierungsmetrik, die misst, inwieweit die generierte Antwort konsistent mit den bereitgestellten Quelldokumenten ist. Sie prüft, ob alle in der Antwort enthaltenen Fakten direkt aus dem Kontext abgeleitet werden können.

Wirtschaftlicher Nutzen: Hohe Faithfulness garantiert, dass die KI keine eigenen (potenziell falschen) Fakten hinzuerfindet. Grounding ist das Prinzip, Faithfulness ist der Score, mit dem man misst, ob das Prinzip eingehalten wird.

3. Strategisches Prompting & Engineering

Prompt Composition+

Definition: Die methodische Strukturierung komplexer Eingabebefehle. Dies umfasst die Integration von System-Instruktionen, dynamischen Kontexten, Few-Shot-Beispielen und Output-Formatvorgaben in eine logische Abfolge.

Wirtschaftlicher Nutzen: Ermöglicht hochgradig personalisierte und konsistente KI-Antworten in automatisierten Workflows.

Context Window (Kontextfenster)+

Definition: Die maximale Anzahl an Token (Wörtern/Zeichenteilen), die ein LLM in einem einzelnen Inferenzschritt verarbeiten kann. Dies umfasst sowohl die Eingabe (Prompt + Kontext) als auch die generierte Ausgabe.

Wirtschaftlicher Nutzen: Ein größeres Kontextfenster erlaubt es, ganze Bücher oder hunderte E-Mails in einer Anfrage zu analysieren.

Few-Shot Prompting+

Definition: Eine Technik, bei der dem Modell innerhalb des Prompts eine geringe Anzahl von Beispielen (Input-Output-Paare) bereitgestellt wird, um die gewünschte Aufgabe und das Zielformat ohne Parameter-Anpassung (Fine-Tuning) zu spezifizieren.

Wirtschaftlicher Nutzen: Erhöht die Trefferquote bei komplexen Aufgaben (z.B. Datenextraktion in ein bestimmtes JSON-Format) drastisch.

Warum technisches Vokabular für Entscheider zählt

Wenn Sie in einem laufenden KI-Projekt über einen dieser Begriffe stolpern, wir prüfen gern, ob die Architektur dahinter stimmt. Das gemeinsame Verständins dieser Begriffe schafft eine Basis ohne Missverständnisee den Erfolg Ihres KI-Projekts voran zu treiben .

Bei SMADEV übersetzen wir diese Konzepte in funktionale Business-Lösungen. Wir bauen nicht nur KI, wir bauen validierte, skalierbare Systeme, die den Unternehmenserfolg messbar machen.

Wer die Architektur versteht, sieht schnell, wo im eigenen System etwas fehlt. Wenn Sie beim Lesen an ein konkretes Projekt gedacht haben — das ist der richtige Moment für ein Gespräch.

Kostenloses Strategiegespräch anfragen →

Enterprise-KI-Glossar: RAG-Systeme, AI-Evaluations & Datenbereinigung