
La inteligencia artificial volvió a dar un salto que impacta de lleno en el sistema de salud. Un nuevo estudio científico reveló que modelos avanzados de IA ya logran superar a médicos humanos en diagnósticos complejos, incluso en situaciones críticas de urgencia donde el tiempo y la precisión resultan determinantes.
La investigación, publicada en la revista Science, comparó el desempeño de un modelo de lenguaje desarrollado por OpenAI con cientos de profesionales de la salud y concluyó que la IA mostró ventajas claras tanto en precisión como en velocidad de razonamiento clínico.
Uno de los datos más impactantes del trabajo fue el rendimiento del sistema en guardias médicas y primeras consultas de urgencia, momentos en los que los médicos deben tomar decisiones rápidas con información limitada. Allí, el modelo de inteligencia artificial identificó el diagnóstico correcto o uno muy cercano en el 67% de los casos, mientras que los médicos alcanzaron niveles de acierto de entre el 50% y el 55%.
El estudio analizó distintas tareas vinculadas al razonamiento clínico, entre ellas la elaboración de diagnósticos diferenciales, la planificación de tratamientos y la evaluación de posibles evoluciones del paciente.
Según los investigadores, el modelo no solo igualó a los médicos, sino que en muchos escenarios obtuvo resultados claramente superiores. “La diferencia entre el modelo y los humanos fue tan significativa en todas las tareas que temíamos que nadie creyera los resultados”, aseguró Adam Rodman, internista del Beth Israel Deaconess Medical Center y uno de los autores del estudio.
La investigación también evaluó la capacidad de razonamiento clínico paso a paso. En una de las pruebas más exigentes, el sistema de IA alcanzó una puntuación perfecta en el 98% de los casos analizados, mientras que los médicos solo lograron ese nivel en el 35%.
Los especialistas destacaron especialmente el rendimiento de la IA en situaciones de triaje, el proceso inicial de evaluación en las guardias médicas. Allí se define rápidamente la gravedad de cada paciente y un error puede tener consecuencias críticas.
Para simular condiciones reales, los investigadores utilizaron 76 casos clínicos reales y fueron entregando la información al modelo de manera progresiva, tal como ocurre durante una consulta médica.
En la etapa inicial de urgencias, cuando todavía hay pocos datos disponibles, el sistema logró un 67,1% de precisión diagnóstica. Luego, durante la consulta médica, el porcentaje subió al 72,4% y alcanzó el 81,6% en la fase de internación o terapia intensiva.
El trabajo generó fuerte repercusión en el ámbito científico y tecnológico. Eric Strong, especialista de Stanford University, sostuvo que incluso el modelo utilizado en la investigación ya quedó “viejo” frente a las versiones más recientes de inteligencia artificial, lo que abre la puerta a resultados todavía más avanzados en el futuro cercano.
Sin embargo, los propios autores del estudio remarcaron que todavía existen limitaciones importantes. El sistema analizó únicamente información textual y no trabajó con estudios por imágenes, sonidos, análisis físicos ni historiales médicos complejos, elementos fundamentales para muchos diagnósticos reales.
A pesar de eso, el consenso entre los especialistas es cada vez más claro: la inteligencia artificial ya demostró que puede igualar e incluso superar a médicos humanos en múltiples áreas del razonamiento clínico.
Ahora el desafío será determinar cómo incorporar estas herramientas dentro de hospitales y sistemas de salud sin comprometer la seguridad de los pacientes y garantizando controles humanos permanentes.

