Reconnaissance de documents médicaux par IA
Les documents médicaux arrivent sous toutes les formes : PDF de laboratoires modernes, scans papier, photos au téléphone, ordonnances manuscrites. La saisie manuelle est fastidieuse et sujette aux erreurs. Lissa Health y répond avec un pipeline IA atteignant plus de 90 % de précision sur les formulaires typiques.
Pipeline de reconnaissance
1. Classification
Le système détermine le type : formulaire de laboratoire, compte rendu d'échographie, lettre de sortie, ordonnance. Modèles distincts pour tableaux et texte narratif.
2. OCR
Pour images et scans — reconnaissance de texte. Prise en charge des tableaux multicolonnes, texte mixte RU/EN et plages de référence.
3. NLP
À partir du texte OCR bruité, extraction des noms de tests, valeurs, unités, dates et constatations. Mapping vers LOINC et SNOMED CT.
4. Validation
Vérification de plausibilité (glucose 500 — probable erreur OCR), normalisation des unités, déduplication.
Formats pris en charge
| Format | Prise en charge |
|---|---|
| PDF (numérique) | Complète |
| PDF (scan) | OCR |
| JPEG/PNG | Complète |
| Manuscrit | Partielle (selon lisibilité) |
Précision et limites
Fonctionne bien : panels standard des grands laboratoires, PDF numériques.
Plus difficile : formulaires non standard, mauvaises photos, manuscrit.
Chaque valeur a un confidence score ; faible confiance — signal de vérification.
De la reconnaissance à l'analytique
Les biomarqueurs extraits alimentent automatiquement graphiques, indice de santé et calcul de l'âge biologique. Le module Argus OCR a atteint la 1re place sur ProductRadar.
Confidentialité
TLS 1.3, AES-256, conformité loi 152-FZ, aucune transmission de données à des tiers pour l'entraînement.
Conseils
- Photographiez le document à plat, avec une bonne lumière.
- Incluez la page entière avec la date.
- Préférez le PDF du portail du laboratoire.
- Vérifiez les valeurs signalées.
Conclusion
La reconnaissance par IA supprime la principale barrière du suivi de santé — la saisie manuelle. Lissa Health transforme photos et PDF en données longitudinales structurées.
Original publié sur Habr