Inicio Tecnología Inteligencia artificial GPT-4 supera a médicos en pruebas en Estados Unidos

Inteligencia artificial GPT-4 supera a médicos en pruebas en Estados Unidos

Inteligencia artificial GPT-4 supera a médicos en pruebas en Estados Unidos
https://unsplash.com/es/fotos/_0iV9LmPDn0?utm_source=unsplash&utm_medium=referral&utm_content=creditShareLink

Ha llegado el momento en que la Inteligencia Artificial ha superado a los médicos, al menos en pruebas que evalúan habilidades sociales y cognitivas. Aunque es importante destacar que se trata de “habilidades blandas”, este hito marca un avance significativo en el campo de la tecnología y la atención médica.

Un grupo de investigadores llevó a cabo una evaluación comparativa entre ChatGPT y GPT-4, dos modelos de Inteligencia Artificial desarrollados por OpenAI, utilizando el Examen de Licencia Médica de Estados Unidos (USMLE). Los resultados fueron sorprendentes: GPT-4 superó a los seres humanos con un margen considerable, mientras que ChatGPT no logró hacerlo.

Las “habilidades blandas” evaluadas incluyeron la agudeza cognitiva, el conocimiento médico, la capacidad para manejarse en situaciones complejas, la seguridad del paciente y la capacidad de tomar decisiones éticas y legales.

El estudio, realizado por Dana Brin, Vera Sorin y otros investigadores, se publicó en la revista Nature bajo el título “Comparación del rendimiento de ChatGPT y GPT-4 en evaluaciones de habilidades sociales de USMLE”.

El proceso implicó la selección de 80 preguntas relacionadas con estas habilidades blandas del Examen de Licencia Médica de Estados Unidos y del banco de preguntas AMBOSS, utilizado por estudiantes y profesionales médicos. Los modelos de Inteligencia Artificial de OpenAI se sometieron al mismo examen y se compararon con los resultados de los aspirantes humanos.

Los resultados revelaron que la precisión general de ChatGPT fue del 62.5%, mientras que la de GPT-4 fue del 90%. En comparación, la tasa promedio de aciertos de los seres humanos se situó en el 78%.

Los investigadores señalaron que “ChatGPT tuvo un rendimiento inferior al de los humanos, pero GPT-4 mostró un rendimiento superior”. Además, destacaron que GPT-4 demostró ser más capaz de abordar eficazmente cuestiones que requerían profesionalismo, juicio ético y empatía.

Este avance resalta el potencial de la Inteligencia Artificial en el ámbito médico y sugiere que la tecnología está cada vez más cerca de ser una herramienta valiosa para el diagnóstico y la toma de decisiones clínicas. Sin embargo, es importante recordar que la IA no reemplaza la experiencia y el juicio humano, sino que puede complementar y mejorar la atención médica en determinadas áreas. La evolución de la IA sigue avanzando paso a paso, y su impacto en la medicina continúa siendo un tema de estudio y debate.

Fuente: Fayer Wayer