Cuando la IA comienza a ver lo que los médicos ven

Cuando la IA comienza a ver lo que los médicos ven

Cuando la IA comienza a ver lo que los médicos ven

La simple verdad es que la medicina es siempre multimodal. Y la mente de un médico no viaja directamente. Él desciende de la historia del paciente a la imagen de la tomografía computarizada (TC), para los valores de laboratorio en una pantalla y de regreso a las pistas en un examen físico. El diagnóstico rara vez es el producto de un tipo de evidencia y es más comúnmente la síntesis de muchos que se colocan en capas en algo lo suficientemente coherente como para actuar.

Hasta ahora, la mayoría de la inteligencia artificial (IA) en medicina ha vivido en una estructura más estrecha: texto en, texto. Útil para resumir notas, recordar pautas o responder preguntas al estilo del examen. Pero está lejos de la integración en capas donde los médicos confían.

El estudio que cambia la imagen

Un nuevo estudio realizado por el Instituto Winship de la Universidad de Emory puede ser “revelador al cambiar esta percepción. En evaluaciones controladas, el GPT-5 (el último modelo Operai) recibió casos complejos que combinaban historias de pacientes, resultados de laboratorio e imágenes médicas. Estos no eran escenarios simplificados y vinieron de rigurosos puntos de referencia como el conjunto de datos Medxpertqa, diseñado para reflejar la complejidad del razonamiento clínico real.

El GPT-5 excedió los “expertos humanos pre-licenciosos” en más del 24 % en razonamiento multimodal y casi el 30 % en la comprensión multimodal. En un caso, identificó una perforación esofágica sintetizando los hallazgos de CT, los valores de laboratorio y los principales signos físicos y luego recomendó el siguiente paso de gestión correcto.

Es importante tener en cuenta que estos participantes fueron pasantes médicos avanzados que habían completado la mayor parte de su educación formal, pero aún no han sido con licencia completa. (El artículo no está claro si estos asuntos estaban fuera de la escuela de medicina o si habían completado una residencia). Sin embargo, este grupo ofrece una referencia justa y estándar para casos de pruebas estructuradas. Pero no es lo mismo que los expertos en pruebas y totalmente licenciado en la clínica.

¿Un salto u otro paso?

Para los médicos, la confianza en la IA no se basará en su capacidad para aceptar preguntas de opción múltiple de forma aislada. Él vendrá a ver una IA que involucra el escaneo real, las verdaderas hojas de laboratorio, las confusas notas clínicas.

Cuando AI mira la misma imagen que un médico hace y se basa en una narrativa multimodal, su razonamiento puede ser menos como un algoritmo separado y puede volverse más contextual. Y el extraño cambio a otro participante cognitivo puede estar en el centro de aceptación profesional.

Los reguladores notan la diferencia

También vale la pena señalar que, en general, los organismos reguladores tienden a favorecer los sistemas que se ajustan a los flujos de trabajo clínicos existentes, en lugar de aquellos que requieren cambios de práctica para acomodar la herramienta. La capacidad multimodal lo hace posible. Un TC sigue siendo una CT, un informe de laboratorio sigue siendo un informe de laboratorio, pero AI los ve juntos. Esta alineación del proceso familiar puede acelerar la aprobación para la implementación del mundo real.

De puntos de referencia al lado de la cama

Obviamente, el dominio en los puntos de referencia no es lo mismo que el éxito al lado de la cama. Los pacientes llegan con historias incompletas, hallazgos contradictorios y síntomas que no se ajustan a los estándares de los libros de texto. Los investigadores de Emory enfatizan que estos resultados provienen de condiciones de prueba idealizadas y estandarizadas. Y así es como capturaron esta preocupación en sus propias palabras:

Sin embargo, es importante tener en cuenta que los puntos de referencia utilizados reflejan las condiciones de prueba idealizadas y pueden no capturar completamente la variabilidad, la incertidumbre y las consideraciones éticas de la práctica del mundo real.

La validación del mundo real requerirá más trabajo que incluya los posibles ensayos, la calibración cuidadosa y la disposición para examinar dónde falla la IA. Pero creo que la señal es fuerte, y una vez que una IA comienza a ver a través de varias lentes a la vez, comienza a operar en un “espacio cognitivo” similar como médico.

Ai te verá ahora

Cuando la IA deja de leer sobre un paciente y comienza a “verlos” a través de imágenes, laboratorios y narraciones, pasa de una perspectiva fracturada a un proceso de toma de decisiones clínicas más consolidadas. La comprensión multimodal puede ser el puente que cambia la IA de un diputado interesante a un participante confiable en la atención. Y curiosamente, puede permitir que la tecnología vea además de las habilidades físicas o computacionales del mejor médico para ofrecer no solo ideas adyuvantes sino ampliadas sobre la atención.

En medicina, siempre valoramos la segunda opinión o el segundo conjunto de ojos. El rendimiento de la IA sugiere que estos ojos pronto pueden ser digitales y pueden ser más claros de lo que esperábamos.

Fuente

Artículos Relacionados

Recién agregados

Categorías

Recien Añadido