KI-Erkennung medizinischer Dokumente
Medizinische Dokumente kommen in jedem Format: PDFs moderner Labore, Papier-Scans, Handyfotos, handschriftliche Verordnungen. Manuelle Eingabe ist mühsam und fehleranfällig. Lissa Health löst dies mit einer KI-Pipeline mit über 90 % Genauigkeit auf typischen Formularen.
Erkennungspipeline
1. Klassifikation
Das System bestimmt den Typ: Laborformular, Ultraschallbefund, Entlassungsbericht, Rezept. Unterschiedliche Modelle für Tabellen und Fließtext.
2. OCR
Bei Bildern und Scans — Texterkennung. Unterstützung mehrspaltiger Tabellen, gemischten RU/EN-Texts und Referenzbereiche.
3. NLP
Aus verrauschtem OCR-Text werden extrahiert: Testnamen, Werte, Einheiten, Daten, Befunde aus Berichten. Mapping auf LOINC und SNOMED CT.
4. Validierung
Plausibilitätsprüfung (Glukose 500 — wahrscheinlicher OCR-Fehler), Einheiten-Normalisierung, Deduplizierung.
Unterstützte Formate
| Format | Unterstützung |
|---|---|
| PDF (digital) | Vollständig |
| PDF (Scan) | OCR |
| JPEG/PNG | Vollständig |
| Handschrift | Teilweise (abhängig von Lesbarkeit) |
Genauigkeit und Grenzen
Funktioniert gut: Standard-Panels großer Labore, digitale PDFs.
Schwieriger: nicht standardisierte Formulare, schlechte Fotos, Handschrift.
Jeder Wert hat einen confidence score; niedrige Zuversicht — Hinweis zur Prüfung.
Von der Erkennung zur Analytik
Extrahierte Biomarker fließen automatisch in Diagramme, Gesundheitsindex und biologisches Alter. Das Argus-OCR-Modul erreichte Platz 1 auf ProductRadar.
Vertraulichkeit
TLS 1.3, AES-256, Einhaltung des Gesetzes 152-FZ, keine Weitergabe von Daten an Dritte zum Training.
Tipps
- Dokument flach und bei gutem Licht fotografieren.
- Ganze Seite mit Datum erfassen.
- PDF aus dem Laborportal bevorzugen.
- Markierte Werte prüfen.
Fazit
KI-Dokumentenerkennung beseitigt die größte Hürde beim Gesundheits-Tracking — manuelle Dateneingabe. Lissa Health verwandelt Fotos und PDFs in strukturierte Longitudinaldaten.
Original veröffentlicht auf Habr