• Inicio
Newsweek El Salvador
  • Nacional
  • Internacional
  • Horizontes
  • Nuestro Mundo
  • Salud
  • Ciencia y Tecnología
  • Cultura
  • In-Focus
  • Negocios
No Result
View All Result
  • Nacional
  • Internacional
  • Horizontes
  • Nuestro Mundo
  • Salud
  • Ciencia y Tecnología
  • Cultura
  • In-Focus
  • Negocios
No Result
View All Result
Newsweek El Salvador
No Result
View All Result

Alimentar a la IA con ‘datos sintéticos’ de su propio sistema conlleva muchos riesgos

Las empresas del sector de la IA suelen utilizar datos sintéticos para entrenar sus programas debido a su fácil acceso, abundancia y menor costo en comparación con los datos generados por humanos.

Enrique González by Enrique González
5 agosto, 2024
in Ciencia y Tecnología
0
Las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos "artificiales".

Los estudios mostraron que las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos "artificiales".

Los modelos de inteligencia artificial (IA) se abastecen sin parar de datos generados por la propia IA, lo que desemboca en la creación de contenidos cada vez más incoherentes, un problema que ya han señalado varios estudios científicos.

Los modelos en los que se basan las herramientas de IA generativa, como ChatGPT, que permiten crear todo tipo de contenidos con simples preguntas, necesitan ser ejercitados con un nombre colosal de datos.

Estos datos a menudo vienen de internet, que cada vez contiene más imágenes y textos creados por la propia IA. Esta autoalimentación de la IA lleva a un deterioro de los modelos, que producen respuestas que van siendo cada vez menos originales y pertinentes y acaban por no tener ningún sentido, según un artículo publicado a finales de julio por la revista científica Nature.

Con el uso de este tipo de datos, llamados “datos sintéticos” porque están generados artificialmente, la muestra en la que se basan los modelos de IA para dar respuestas va perdiendo calidad.

Investigadores de las Universidades de Rice y de Stanford, en Estados Unidos, llegaron a la misma conclusión analizando los modelos de IA generadores de imágenes Midjourney, Dall-E y Stable Diffusion.

ENFERMEDAD DE LAS VACAS LOCAS

Los estudios mostraron que las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos “artificiales” en el modelo, y compararon este fenómeno con la enfermedad de las vacas locas.

Esta epidemia, surgida en el Reino Unido, empezó con el uso para alimentar a los bovinos de harinas animales, obtenidas a partir de partes no consumidas de restos vacunos o de cadáveres de animales contaminados.

Las empresas del sector de la IA utilizan a menudo “datos sintéticos” para alimentar a sus programas debido a su fácil acceso, su abundancia y el bajo coste, comparado con datos creados por humanos.

Estas “fuentes de datos humanos sin explotar, de alta calidad” son cada vez más minoritarias, explica Jathan Sadowski, investigador especializado en las nuevas tecnologías de la Universidad de Monash, en Australia.

“Sin ningún control durante varias generaciones, la peor hipótesis sería que la degradación de los modelos envenene la calidad y la diversidad de los datos en todo internet”, advierte Richard Baraniuk, uno de los autores del artículo de la Universidad de Rice, en un comunicado.

Así como la crisis de las vacas locas hundió la industria cárnica en la década de 1990, un internet repleto de contenidos hechos con IA y de modelos descontrolados podría amenazar el futuro del sector, en pleno auge, según los científicos.

“La verdadera pregunta para los investigadores y las empresas que construyen los sistemas de IA es: ¿cuándo el uso de los datos sintéticos es demasiado?”, dice Sadowski.

LOS DATOS DE LA IA Y EL LADO ÉTICO DE LA TECNOLOGÍA

No obstante, para otros especialistas el problema es exagerado. Anthropic y Hugging Face, dos líderes del sector que afirman tener en cuenta el lado ético de la tecnología, confirman a AFP utilizar datos generados por la IA.

El artículo de la revista Nature presenta una perspectiva teórica interesante, pero poco realista, según Anton Lozhkov, ingeniero en aprendizaje automático en Hugging Face.

“El entrenamiento [de los modelos] en varias series de datos sintéticos es algo que simplemente no se hace en realidad”, asegura. Sin embargo, Lozhkov admite que los expertos de la IA se sienten frustrados ante la situación en que se encuentra internet.

“Una gran parte de internet es una basura”, dice. En ese sentido, agrega que su empresa ha hecho grandes esfuerzos para limpiar este tipo de datos, suprimiendo a veces hasta un 90 por ciento de contenido.

Con información de AFP
Tags: datosInteligencia artificialInternet
Previous Post

Harris define al compañero de fórmula para las elecciones en EEUU antes de gira clave

Next Post

¿Cómo funciona la alimentación de deportistas y espectadores en los JJ.OO de París 2024?

Next Post
Juegos Olímpicos de París 2024.

¿Cómo funciona la alimentación de deportistas y espectadores en los JJ.OO de París 2024?

Deja un comentario Cancelar respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Entradas recientes

  • Kilmar Abrego García regresó a EEUU para enfrentar cargos criminales: Departamento de Justicia
  • El Salvador en la lista de los 75 “países más pobres del mundo” que le deben dinero a China
  • Trump sufre un cuádruple golpe legal en cuestión de horas, uno de ellos está relacionado con El Salvador
  • Nueva ley obliga a las alcaldías a ceder al Gobierno la administración de los mercados
  • Un guatemalteco, primer migrante deportado que EEUU se ve obligado a llevar de regreso por orden judicial

Comentarios recientes

  1. D en “Somos una nación soberana”: presidente Bukele increpa a congresista de EEUU por opinar sobre pintura de San Oscar Romero
Newsweek El Salvador

Newsweek El Salvador© 2024

Secciones

  • Nacional
  • Internacional
  • Horizontes
  • Nuestro Mundo
  • Salud
  • Ciencia y Tecnología
  • Cultura
  • In-Focus
  • Negocios

Síguenos

No Result
View All Result
  • Inicio

Newsweek El Salvador© 2024