Reconnaissance de documents médicaux par IA

Les documents médicaux arrivent sous toutes les formes : PDF de laboratoires modernes, scans papier, photos au téléphone, ordonnances manuscrites. La saisie manuelle est fastidieuse et sujette aux erreurs. Lissa Health y répond avec un pipeline IA atteignant plus de 90 % de précision sur les formulaires typiques.

Pipeline de reconnaissance

1. Classification

Le système détermine le type : formulaire de laboratoire, compte rendu d'échographie, lettre de sortie, ordonnance. Modèles distincts pour tableaux et texte narratif.

2. OCR

Pour images et scans — reconnaissance de texte. Prise en charge des tableaux multicolonnes, texte mixte RU/EN et plages de référence.

3. NLP

À partir du texte OCR bruité, extraction des noms de tests, valeurs, unités, dates et constatations. Mapping vers LOINC et SNOMED CT.

4. Validation

Vérification de plausibilité (glucose 500 — probable erreur OCR), normalisation des unités, déduplication.

Formats pris en charge

Format	Prise en charge
PDF (numérique)	Complète
PDF (scan)	OCR
JPEG/PNG	Complète
Manuscrit	Partielle (selon lisibilité)

Précision et limites

Fonctionne bien : panels standard des grands laboratoires, PDF numériques.

Plus difficile : formulaires non standard, mauvaises photos, manuscrit.

Chaque valeur a un confidence score ; faible confiance — signal de vérification.

De la reconnaissance à l'analytique

Les biomarqueurs extraits alimentent automatiquement graphiques, indice de santé et calcul de l'âge biologique. Le module Argus OCR a atteint la 1re place sur ProductRadar.

Confidentialité

TLS 1.3, AES-256, conformité loi 152-FZ, aucune transmission de données à des tiers pour l'entraînement.

Conseils

Photographiez le document à plat, avec une bonne lumière.
Incluez la page entière avec la date.
Préférez le PDF du portail du laboratoire.
Vérifiez les valeurs signalées.

Conclusion

La reconnaissance par IA supprime la principale barrière du suivi de santé — la saisie manuelle. Lissa Health transforme photos et PDF en données longitudinales structurées.

Original publié sur Habr

Reconnaissance de documents médicaux par IA ​

Pipeline de reconnaissance ​

1. Classification ​

2. OCR ​

3. NLP ​

4. Validation ​

Formats pris en charge ​

Précision et limites ​

De la reconnaissance à l'analytique ​

Confidentialité ​

Conseils ​

Conclusion ​