Un equipo dirigido por científicos de Google desarrolló una herramienta de aprendizaje automático que puede ayudar a detectar y controlar condiciones de salud a través de ruidos como la tos y respiración. Este sistema de inteligencia artificial (IA) incluso podría ser utilizado en un futuro para diagnosticar enfermedades como covid-19 y la tuberculosis.
“Esta no es la primera vez que un grupo de investigación explora el uso del sonido como biomarcador de enfermedades. El concepto ganó fuerza durante la pandemia de covid-19 cuando los científicos descubrieron que era posible detectar enfermedades respiratorias a través de la tos de una persona”, refiere en un artículo la revista científica Nature.
Los investigadores del sistema de Google, denominado “Representaciones acústicas de salud (HeAR)”, apuntan que aún es demasiado pronto para saber si será un producto comercial. Ahora, el plan es dar acceso al modelo a los científicos interesados para que puedan utilizarlo en sus propias investigaciones.
“Nuestro objetivo como parte de Google Research es estimular la innovación en este campo incipiente”, indica Sujay Kakarmath, gerente de producto de Google.
De acuerdo con Nature, la mayoría de las herramientas de IA que se están desarrollando se basan en grabaciones de audio, por ejemplo, de tos. Estas se combinan a su vez con datos de salud del paciente que emitió los sonidos; resulta un proceso de entrenamiento llamado “aprendizaje supervisado”.
LA HERRAMIENTA DE GOOGLE QUE USA LA TOS PARTE DEL “APRENDIZAJE AUTOSUPERVISADO”
Sin embargo, el equipo de Google uso el “aprendizaje autosupervisado”. Mediante un proceso automatizado, extrajeron más de 300 millones de clips de sonido cortos de tos, respiración, carraspeo y otros sonidos humanos de videos de YouTube disponibles.
Cada clip se convirtió en una representación visual del sonido llamada espectrograma. Posteriormente, los investigadores bloquearon segmentos de los espectrogramas para ayudar al modelo a aprender a predecir las partes faltantes.
“Es similar a cómo se le enseñó al gran modelo de lenguaje que subyace al chatbot ChatGPT a predecir la siguiente palabra en una oración después de haber sido entrenado con innumerables ejemplos de texto humano. Utilizando este método, los investigadores crearon lo que llaman un modelo básico, según dicen, puede adaptarse para muchas tareas”, indica la revista académica.
Para HeAR, los expertos lo adaptaron para detectar covid-19, tuberculosis y características como si una persona fumara. En una escala donde 0.5 representa un modelo que no funciona mejor que una predicción aleatoria y 1 representa un modelo que hace una predicción precisa cada vez, HeAR obtuvo una puntuación de 0.645 y 0.710 para la detección del virus SARS-CoV-2. Para la tuberculosis, la puntuación fue de 0.739.
Ali Imran, ingeniero de la Universidad de Oklahoma en Tulsa, dice que el gran volumen de datos utilizados por Google da importancia a la investigación. “Nos da la confianza de que se trata de una herramienta fiable”, afirma.
“La ciencia acústica existe desde hace décadas. La diferencia es que ahora, con la IA y el aprendizaje automático, tenemos los medios para recopilar y analizar una gran cantidad de datos al mismo tiempo”, concluye. N