Arkangel Ai diseña una herramienta de IA de código abierto para la detección precoz de la leucemia infantil

Escrito por Alvaro el 31 Aug 2021

Arkangel Ai diseña una herramienta de IA de código abierto para la detección precoz de la leucemia infantil

El reto

Según el último informe de la Organización Mundial de la Salud, la leucemia es uno de los tres cánceres infantiles más comunes en todo el mundo. Debido a la falta de personal experimentado, de cobertura del sistema de salud y de protocolos de detección eficaces, el diagnóstico de la leucemia es un reto importante, especialmente en los países de ingresos bajos y medios.

En particular, en Colombia, estos desafíos en el diagnóstico temprano son tales que la tasa de supervivencia a cinco años de los niños diagnosticados con la enfermedad se estima en un 41%, muy por debajo del 80% estimado para los países de altos ingresos.

Nos propusimos generar una solución precisa, rápida, asequible y objetiva para diagnosticar la leucemia infantil utilizando la Inteligencia Artificial; este blog-post es sobre lo que logramos en sólo 24 horas utilizando el poder computacional de Hippocrates AutoML.

“Hippocrates AutomML es la nueva funcionalidad de Arkangel Ai que permite a las instituciones sanitarias utilizar sus recursos de datos para generar modelos de Inteligencia Artificial de acuerdo con sus objetivos médicos. Dice Leonardo Velásquez Growth Lead en Arkangel Ai”.

Resumen del dispositivo

El algoritmo ai pretende detectar y clasificar automáticamente los linfocitos en imágenes de muestras de sangre y médula ósea teñidas tomadas con un microscopio. La solución tiene dos componentes principales:

Un algoritmo de aprendizaje profundo que identifica y segmenta los linfocitos presentes en las muestras de los pacientes.
Un algoritmo de clasificación de aprendizaje profundo que clasifica los linfocitos entre normal-linfocitos y anormal-linfocitos (linfoblastoma).

De esta manera, si al final del análisis de la muestra del paciente, hay más de un 20% de linfoblastoma, será clasificado como paciente con leucemia.

¡Desarrollo del modelo usando Hippocrates, Eureka!

Para este proyecto, utilizamos 15.135 imágenes de 118 pacientes con dos clases etiquetadas: “Célula normal” y “Ráfaga de leucemia”. Una vez que las fotos y los archivos de anotación se prepararon para cumplir con los requisitos de Hippocrates, los subimos a la plataforma en la nube y pulsamos “start experiment”, e Hippocrates comenzó la construcción del algoritmo.

Para este experimento de caso real, estábamos muy nerviosos y emocionados. Después de 24 horas, a primera hora de la mañana, Hippocrates nos envió un correo electrónico notificando que el experimento había finalizado con éxito, y esto es lo que encontramos una vez que nos conectamos a la plataforma:

El ranking con el modelo TOP 5, el mejor tenía estas especificaciones:

Precisión: 0,82
Sensibilidad: 0,91
Especificidad: 0,60
F1-macro: 0.76

¡¡Definitivamente no está mal para un experimento de 24 horas!! Lo celebramos e hicimos algunas llamadas a algunos amigos de UNICEF.

Aunque esta primera iteración mostró un gran potencial y la potencia de la herramienta Hippocrates, estamos interesados en desarrollar un algoritmo práctico para la detección de la leucemia en niños. En ese sentido, nuestros próximos pasos son mejorar las métricas en general y construir el algoritmo de segmentación. También combinaremos ambos algoritmos en una API pública para servir como un servicio gratuito para empezar a pilotar en un laboratorio con una institución asociada en Colombia.

Objetivos/metas del proyecto para los próximos 12 meses:

Implementar el prototipo en 5 laboratorios líderes en detección de leucemia en Latam usando la API de código abierto.
Ejecutar 15.000 predicciones en muestras de pacientes (~1.250/mes) en los laboratorios seleccionados. Informar de los resultados en métricas de precisión, ahorro de costes y tiempo, y resultados de los pacientes frente al método tradicional.
Crear conjuntamente el primer conjunto de datos de leucemia de Latinoamérica con la ayuda de anotadores expertos. Utilizaremos este conjunto de datos para volver a entrenar el prototipo buscando mejorar las métricas anteriormente descritas. -Crear alianzas para mejorar la distribución, el apoyo al repositorio y la posterior financiación durante dos años más. He aquí algunas ideas: Ministro de Salud y Protección Social, el Fondo Colombiano de Enfermedades de Alto Costo, la Fundación Colombiana de Leucemia y Linfoma y el Instituto Nacional de Salud de Colombia.

Finalmente, nuestro objetivo principal es poner la inteligencia artificial al servicio de toda la comunidad médica. Dejamos aquí el enlace al modelo final y sus futuras iteraciones. Si quieres contribuir, no dudes en abrir un pull request.

Informe de la Organización Mundial de la Salud Informe sobre la leucemia en Colombia