KI-Erkennung medizinischer Dokumente

Medizinische Dokumente kommen in jedem Format: PDFs moderner Labore, Papier-Scans, Handyfotos, handschriftliche Verordnungen. Manuelle Eingabe ist mühsam und fehleranfällig. Lissa Health löst dies mit einer KI-Pipeline mit über 90 % Genauigkeit auf typischen Formularen.

Erkennungspipeline

1. Klassifikation

Das System bestimmt den Typ: Laborformular, Ultraschallbefund, Entlassungsbericht, Rezept. Unterschiedliche Modelle für Tabellen und Fließtext.

2. OCR

Bei Bildern und Scans — Texterkennung. Unterstützung mehrspaltiger Tabellen, gemischten RU/EN-Texts und Referenzbereiche.

3. NLP

Aus verrauschtem OCR-Text werden extrahiert: Testnamen, Werte, Einheiten, Daten, Befunde aus Berichten. Mapping auf LOINC und SNOMED CT.

4. Validierung

Plausibilitätsprüfung (Glukose 500 — wahrscheinlicher OCR-Fehler), Einheiten-Normalisierung, Deduplizierung.

Unterstützte Formate

Format	Unterstützung
PDF (digital)	Vollständig
PDF (Scan)	OCR
JPEG/PNG	Vollständig
Handschrift	Teilweise (abhängig von Lesbarkeit)

Genauigkeit und Grenzen

Funktioniert gut: Standard-Panels großer Labore, digitale PDFs.

Schwieriger: nicht standardisierte Formulare, schlechte Fotos, Handschrift.

Jeder Wert hat einen confidence score; niedrige Zuversicht — Hinweis zur Prüfung.

Von der Erkennung zur Analytik

Extrahierte Biomarker fließen automatisch in Diagramme, Gesundheitsindex und biologisches Alter. Das Argus-OCR-Modul erreichte Platz 1 auf ProductRadar.

Vertraulichkeit

TLS 1.3, AES-256, Einhaltung des Gesetzes 152-FZ, keine Weitergabe von Daten an Dritte zum Training.

Tipps

Dokument flach und bei gutem Licht fotografieren.
Ganze Seite mit Datum erfassen.
PDF aus dem Laborportal bevorzugen.
Markierte Werte prüfen.

Fazit

KI-Dokumentenerkennung beseitigt die größte Hürde beim Gesundheits-Tracking — manuelle Dateneingabe. Lissa Health verwandelt Fotos und PDFs in strukturierte Longitudinaldaten.

Original veröffentlicht auf Habr

KI-Erkennung medizinischer Dokumente ​

Erkennungspipeline ​

1. Klassifikation ​

2. OCR ​

3. NLP ​

4. Validierung ​

Unterstützte Formate ​

Genauigkeit und Grenzen ​

Von der Erkennung zur Analytik ​

Vertraulichkeit ​

Tipps ​

Fazit ​