Zum Inhalt

Unterstützte Dateitypen

Die Read-File-Komponente verarbeitet eine Reihe von Formaten. Welche Formate in einer bestimmten Konfiguration akzeptiert werden, hängt vom gewählten Extraktions-Backend ab — und bei Upload-Targets zusätzlich vom Feld Allowed Upload Extensions.

Standard-Dateiunterstützung

Die folgenden Formate sind vom Upstream-Langflow übernommen (Backend docling).

KARLI-Extraktions-Unterstützung

Steht Extraction Backend auf karli, hängen die unterstützten Formate vom gewählten Modell ab:

Modell Akzeptiert
karli/default-data-extraction Jede unterstützte Datei (der Dienst wählt den Extraktor).
karli/data-extraction-moe-latest Jede unterstützte Datei (MoE-Router wählt pro Dateityp und pro Seite bei PDFs den optimalen Extraktor).
docling-project/docling, datalab-to/marker, opendatalab/MinerU, karli/multimodal-data-extraction Dokumentformate (PDF und ähnliches).
openai/whisper-large-v3 Audioformate.

Vor dem Upload prüft die Komponente die Datei gegen den akzeptierten Typ des gewählten Modells.

Das MoE-Modell unterstützt eine breite Palette an Formaten: PDF, Word (doc/docx), Präsentationen (ppt/pptx), Tabellen (xls/xlsx/csv), HTML, Bilder (png/jpg/gif/bmp/tiff/webp), Audio (aac/mpeg/wav/webm/mp3/mp4), E-Mail (eml/msg/pst) und Klartext. Die vollständige Routing-Tabelle findet sich unter Modelle → Datenextraktion.