La IA está vinculada a la explosión de artículos de investigación biomédica de baja calidad
El análisis señala cientos de estudios que parecen seguir un modelo, informando correlaciones entre condiciones de salud complejas y variables individuales basadas en conjuntos de datos disponibles públicamente.
Por Miryam Naddaf
![]() |
Los datos de salud de miles de personas están disponibles públicamente y listos para integrarse en sistemas de IA para su análisis. Crédito: BSIP/UIG vía Getty La literatura científica corre el riesgo de verse inundada de artículos que hacen afirmaciones engañosas sobre la salud basadas en datos disponibles abiertamente y fáciles de procesar mediante herramientas de inteligencia artificial (IA), advirtieron los investigadores. En un estudio publicado en PLoS Biology el 8 de mayo , científicos analizaron más de 300 artículos que utilizaban datos de la Encuesta Nacional de Examen de Salud y Nutrición de EE. UU. (NHANES), un conjunto de datos abiertos de historiales médicos. Todos los artículos parecían seguir un patrón similar, asociando una variable —por ejemplo, los niveles de vitamina D o la calidad del sueño— con un trastorno complejo como la depresión o una enfermedad cardíaca, ignorando que estas afecciones tienen muchos factores contribuyentes. ![]() Los detectives científicos señalan cientos de artículos que utilizan IA sin revelarlo “Estamos experimentando una explosión repentina de tasas de publicación [de artículos] que son extremadamente formales y que fácilmente podrían haber sido generadas por grandes modelos lingüísticos ”, afirma el coautor del estudio Matt Spick, científico biomédico de la Universidad de Surrey en Guildford, Reino Unido. Spick y sus colegas descubrieron que las asociaciones en muchos de los artículos no resistían el escrutinio estadístico y que algunos estudios parecían haber seleccionado cuidadosamente los datos. “Imagina que intentas aprobar un examen con una tasa de aprobados específica y añades tantas preguntas como quieras. Ves las que acertaste y eliminas las que fallaste. Eso es básicamente lo que hacen”, explica Charlie Harrison, biólogo computacional de la Universidad de Aberystwyth en Ceredigion, Reino Unido, quien también colaboró en el estudio. Ioana Alina Cristea, psicóloga clínica y metainvestigadora de la Universidad de Padua, Italia, coincide en que los artículos “parecen estar escritos con una receta”. “Necesitamos estas evaluaciones sistemáticas para poder medir de alguna manera la magnitud del problema”, afirma. Aumento de los estudiosNHANES es una encuesta de larga duración que recopila datos de miles de personas en Estados Unidos sobre su salud, alimentación y estilo de vida. El conjunto de datos está disponible públicamente y listo para integrarse en sistemas de codificación o IA para su análisis, lo que ha impulsado un aumento de estudios basados en datos de NHANES en los últimos dos años, afirma Spick. Solo en 2024, se publicaron más de 2200 estudios de asociación con datos de NHANES, y más de 1200 en lo que va de año, según el índice de literatura biomédica de PubMed . Harrison, Spick y sus colegas se centraron en una muestra de 341 estudios publicados entre 2014 y 2024, basados en datos de NHANES. Los artículos aparecieron en 147 revistas de diversas editoriales, como Frontiers Media, Elsevier y Springer Nature ( el equipo de noticias de Nature es editorialmente independiente de su editorial). Referencia Suchak T, Aliu AE, Harrison C, Zwiggelaar R, Geifman N, Spick M. Explosion of formulaic research articles, including inappropriate study designs and false discoveries, based on the NHANES US national health database. PLoS Biol. 2025 May 8;23(5):e3003152. doi: 10.1371/journal.pbio.3003152. PMID: 40338847; PMCID: PMC12061153. |
Comentarios