01 — AUSGANGSLAGE
02 — LÖSUNG
PGROONGA TOKENBIGRAM
Wie japanischer Text ohne Wortgrenzen durchsuchbar wird
01
Dokument-Text
02
Bigram-Index Überlappende 2-Zeichen-Fragmente
03
Suchanfrage
03 — ARCHITEKTUR
LIGHTRAG WISSENSGRAPH — BEISPIEL-DOMÄNE FERTIGUNG
QUERY
品質管理 → 海外工場の検品報告
3 Entitäten, 2 Relationen — Pfad in unter einer Sekunde aufgelöst
04 — ERGEBNISSE
TECH STACK
AUSBLICK
NÄCHSTER SCHRITT
Ähnliches Projekt?
KONTAKTIEREN SIE UNS ALLE CASE STUDIESHäufig gestellte Fragen — Parfun RAG Agent Case Study
Wie funktioniert die multilinguale RAG-Suche von Kuroko Labs?+
Eine dreistufige Pipeline: Ein domain-bewusster Query Planner zerlegt jede Frage in einen strukturierten Suchplan mit multilingualen Keywords und Produktcode-Filtern. Drei parallele Suchkanäle — pgvector (semantisch), PGroonga TokenBigram (japanische Volltextsuche) und LightRAG (Wissensgraph) — liefern Ergebnisse, die per Reciprocal Rank Fusion konsolidiert und von Cohere Rerank v3.5 final bewertet werden. Claude synthetisiert daraus eine zitierte Antwort — auf Japanisch, Englisch oder Thailändisch.
Welche Dokumentenformate werden unterstützt?+
PDF (inklusive gescannte Dokumente via Mistral OCR), DOCX, PPTX (via LibreOffice Headless), XLSX und CSV. Excel-Dateien werden besonders behandelt: Ein Tabular Deep Dive erkennt automatisch Header-Zeilen, findet relevante Datenzeilen per Volltextsuche und erweitert den Kontext um benachbarte Zeilen. Dokumente können über SharePoint, Browser-Upload oder als Meeting-Transkripte eingespeist werden.
Warum orchestriert das System fünf verschiedene KI-Provider?+
Jeder Provider exzelliert in einer spezifischen Rolle: gpt-4o-mini als schneller Query Planner mit Produktcode-Erkennung, OpenAI Embeddings für die Vektorisierung, Cohere Rerank für die semantische Relevanzoptimierung, Mistral OCR für hochqualitatives Dokumentenparsing, und Claude für die Tier-basierte Synthese. Ein einzelnes Modell könnte nicht alle Anforderungen gleich gut abdecken.
Kann Kuroko Labs eine ähnliche RAG-Lösung für mein Unternehmen entwickeln?+
Ja — die Architektur ist modular und auf jede Branche und Dokumentenlandschaft übertragbar. Ob juristische Dokumente, technische Handbücher oder Vertriebswissen: Kuroko Labs analysiert Ihre Informationsflüsse und baut eine maßgeschneiderte RAG-Pipeline. Erstgespräch und Potenzialanalyse sind kostenfrei.
Wie wird die Qualität der Antworten sichergestellt?+
Durch eine automatisierte Testsuite mit 94 Abfragen, die den Qualitätsscore kontinuierlich überwacht (aktuell 3.25–4.0/5.0). Ein Learned Facts Feedback Loop extrahiert Nutzerkorrekturen und injiziert sie in zukünftige Synthesen. Hash-basierte Deduplizierung verhindert redundante Verarbeitung, und ein Anti-Loop Session State sorgt dafür, dass Follow-up-Fragen neue Ergebnisse liefern.