Semantische Dekomposition medizinischer Daten

Die meisten Gesundheits-Apps speichern Informationen als Dateien: ein PDF hier, ein Foto dort, ein Entlassungsbericht in einem Ordner. Suchen heißt scrollen. Dynamik heißt manuell vergleichen. Lissa Health wählte einen anderen Weg — semantische Dekomposition, jedes Dokument in atomare medizinische Fakten zerlegen.

Die dokumentenzentrierte Falle

Traditionelle Gesundheitsakten machen das Dokument zur Haupteinheit. Sie laden eine Analyse von März 2023 und eine von September 2024 hoch. Um Glukose zu vergleichen, öffnen Sie beide Dateien und lesen die Werte manuell.

Das Modell bricht schnell: Verschiedene Labore benennen denselben Test unterschiedlich (« Glucose », « GLU », « Blutzucker »), Referenzbereiche unterscheiden sich, klinische Befunde im Fließtext sind für Suche und Analytik unsichtbar.

Faktorzentrierte Architektur

Lissa Health kehrt die Hierarchie um. Die Haupteinheiten sind medizinische Faktoren: Biomarker, Diagnosen, Verordnungen, klinische Beobachtungen. Jeder hat einen Standardcode (LOINC, SNOMED CT), Wert, Datum und Link zum Quelldokument.

Beim PDF-Upload läuft die Pipeline: OCR → NLP-Parsing → Normalisierung → Validierung → Speicherung im Longitudinalprofil. Das Dokument bleibt zugänglich, die Analytik arbeitet mit Faktoren.

Warum Standardcodes wichtig sind

Ohne Standardisierung sind « Glukose » aus Labor A und « GLU » aus Labor B zwei unverbundene Zeilen. Mit LOINC-Code 2345-7 ist es ein Faktor in einem einheitlichen Diagramm.

Extraktion klinischer Befunde

Schwieriger als Zahlentabellen — Narrativ: « fokale Veränderungen der Schilddrüse », « Zeichen einer Lebersteatose ». NLP extrahiert sie als SNOMED-codierte Befunde. Sie fließen in Gesundheitsindex und KI-Berichte ein.

Vorteile

Für Nutzer: automatische Diagramme, Gesundheitsindex, biologisches Alter, KI-Berichte.

Für Ärzte: strukturierte Zusammenfassung, sichere Weitergabe per Link, bis zu 25 % Zeitersparnis bei der Dokumentation.

Grenzen

OCR-Qualität hängt vom Foto ab. Nicht standardisierte Formulare erfordern Modellanpassungen. Fließtext wird mit geringerer Zuversicht erkannt. Wir zeigen confidence score und Flags für manuelle Prüfung.

Fazit

Der Übergang von Dokumenten zu Faktoren verwandelt das Archiv in ein analytisches Asset — Grundlage für Biomarker-Tracking, digitalen Zwilling und KI-Berichte.

Original veröffentlicht auf Habr

Semantische Dekomposition medizinischer Daten ​

Die dokumentenzentrierte Falle ​

Faktorzentrierte Architektur ​

Warum Standardcodes wichtig sind ​

Extraktion klinischer Befunde ​

Vorteile ​

Grenzen ​

Fazit ​