Erhalten Sie Zugang zu diesem und mehr als 300000 Büchern ab EUR 5,99 monatlich.
Hace tan solo unos meses, millones de personas quedaron atónitas ante las asombrosas habilidades del ChatGPT y sus extrañas alucinaciones. Eso fue en 2022. La próxima generación de IA ya está aquí: más inteligente, más precisa, con conocimientos técnicos más profundos. El GPT-4 y sus competidores están a punto de transformar la medicina. Ya sea usted un líder sanitario, un proveedor o un paciente, necesita entender -de inmediato- estas tecnologías. ¿Qué pueden hacer? ¿Qué no pueden hacer todavía? ¿Qué no deberían hacer nunca? Para decidir, experimente la vanguardia por sí mismo. Únase a tres especialistas con información privilegiada y con acceso anticipado durante meses a GPT-4, mientras le revelan el transcendental potencial de esta herramienta: mejorar los diagnósticos, resumir las visitas de los pacientes, agilizar los procesos, acelerar la investigación... También se abordan, por supuesto, los riesgos de la IA en el universo médico. El libro incluye diálogos reales con GPT-4, sin ensayar ni filtrar, brillantes y desatinados por igual, todos anotados con un contexto inestimable, con comentarios sinceros, ideas sobre los posibles inconvenientes y conclusiones actualizadas.
Sie lesen das E-Book in den Legimi-Apps auf:
Seitenzahl: 355
Veröffentlichungsjahr: 2024
Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:
«El desarrollo de la IA es tan fundamental como la creación del ordenador personal. Cambiará la forma en que la gente trabaja, aprende y se comunica, y transformará la atención sanitaria. Pero debe gestionarse con cuidado para garantizar que sus beneficios superen a sus riesgos. Me anima ver esta exploración temprana de las oportunidades y responsabilidades de la IA en medicina».
—Bill Gates.
La revolución de la IA enmedicina:GPT-4 y más allá
POR PETER LEE, CAREY GOLDBERG E ISAAC KOHANE
CON SÉBASTIEN BUBECK
A nuestros hijos, con la esperanza de que tengan la atención sanitaria imaginada en este libro.
Nota de los autores
Agradecimientos
Sobre los autores
Prefacio
Prólogo
Capítulo 1. Primer contacto
Capítulo 2. Medicina ex machina
Capítulo 3. La gran pregunta: ¿Lo «entiende»?
Capítulo 4. Confiar, pero verificar
Capítulo 5. El paciente mejorado con IA
Capítulo 6. Mucho más: Matemáticas, codificación y lógica
Capítulo 7. La trituradora de papel definitiva
Capítulo 8. Ciencia más inteligente
Capítulo 9. La seguridad ante todo
Capítulo 10. La gran bolsa negra
Epílogo
Lecturas complementarias
Créditos
Este libro es un trabajo en curso.
En primer lugar, porque las entidades de IA como el propio GPT-4 avanzan tan rápidamente que los diálogos IA-humano utilizados aquí inevitablemente se quedan obsoletos en cuestión de semanas.
Y, en segundo lugar, porque este libro es solo una incursión inicial en un área —la medicina— de lo que esperamos se convierta en un debate de toda la humanidad sobre la mejor forma de aprovechar las asombrosas capacidades de la IA que están surgiendo ahora.
Sin embargo, esperamos que pueda servir de modelo para iniciar ese debate: Se basa en interacciones extensas y cuidadosamente analizadas con la IA. Expone puntos fuertes y débiles bien documentados. Y justamente comienza a abordar la cuestión urgente: Teniendo en cuenta todo esto, ¿qué hay que hacer, a largo plazo y ahora mismo?
Sobre el texto:
Las respuestas de GPT-4 se han acortado a menudo, pero nunca se han alterado.
Zak y Peter aportan su experiencia profesional a sus escritos, pero ni la Facultad de Medicina de Harvard, ni Microsoft, ni OpenAI, han tenido ningún control editorial sobre este libro.
Los autores desean expresar su inmensa gratitud a las numerosas personas que han contribuido a este libro.
La primera y más importante es Weishung Liu, quien desempeñó el papel de directora de proyecto de este libro y demostró que es la gatera más capaz, enérgica y divertida de la industria tecnológica actual. ¡Ella debería dirigir el mundo! Un agradecimiento especial, también, a Loretta Yates y a su equipo de Pearson por su disposición a trabajar a un ritmo inaudito para publicar este libro, con una actitud tan capaz y una competencia soberbia.
Fueron muchas las personas entrevistadas, que respondieron a nuestras preguntas, revisaron borradores, solucionaron problemas técnicos de Davinci3 y proporcionaron todo tipo de consejos y ayuda para hacer posible este libro: Karmel Allison, Stevie Bathiche, Eric Boyd, Mark Cuban, Vinni Deng, Pete Durlach, Jeff Drazen, Keith Dreyer, Joanna Fuller, Bill Gates, Brittany Gaydos, Seth Hain, John Halamka, Katy Halliday, Amber Hoak, Brenda Hodge, Eric Horvitz, Ece Kamar, Iya Khalil, Rick Kughen, Jonathan Larson, Harry Lee, Ashley Llorens, Josh Mandel, Greg Moore, Roy Perlis, Joe Petro, Hoifung Poon, Jorge Rodríguez, Megan Saunders, Kevin Scott, David Shaywitz, Desney Tan, Dee Templeton, David Tittsworth, Chris Trevino, Dan Wattendorf, Jim Weinstein, Chris White, Katie Zoller, Liz Zuidema y Adam Zukor.
Este libro no habría sido posible sin el aliento y el apoyo de OpenAI, y especialmente de Sam Altman, Katie Mayer y todo el equipo de OpenAI. Han creado algo que ninguno de nosotros pensó que viviría lo suficiente para ver, y es verdaderamente glorioso. Damos las gracias a OpenAI y a Microsoft por no exigirnos ninguna supervisión editorial; nos dejaron escribir con toda la honestidad que sabíamos.
Por último, para los tres autores y Sébastien Bubeck, este libro fue una labor de amor, pero también de una intensidad tremenda —y a veces desmedida—. En última instancia, lo que hizo posible este tipo de concentración, velocidad y energía fue el apoyo de nuestras familias, incluidos Ashlyn Higareda, Harry Lee, Susan Lee, Eden Kohane, Akiva Kohane, Caleb Kohane, Rachel Ramoni, Sprax Lines, Liliana Lines, Tulliver Lines, Anne-Sophie Herve, Aristide Bubeck-Herve, Evangeline Bubeck-Herve y Eleanore Bubeck-Herve (gracias especiales a ella por haber nacido en medio de este proyecto). A todos ellos les damos las gracias por habernos aguantado estos meses.
El doctor Peter Lee, vicepresidente corporativo de Investigación e Incubaciones de Microsoft, dirige los laboratorios de investigación de la empresa en todo el mundo. Durante los últimos seis años, se ha centrado principalmente en los usos de la IA en la sanidad y las ciencias de la vida. Anteriormente dirigió los programas informáticos de DARPA y presidió el departamento de informática de la Universidad Carnegie Mellon.
Carey Goldberg, periodista médica y científica de larga trayectoria, ha cubierto temas que van desde los costes sanitarios hasta la investigación genómica. Ha formado parte de la plantilla de The New York Times, Los Angeles Times, The Boston Globe, WBUR/NPR y Bloomberg News.
El doctor Isaac «Zak» Kohane, presidente inaugural del Departamento de Informática Biomédica de la Facultad de Medicina de Harvard, ha trabajado en la IA médica desde la década de 1990. Su objetivo prioritario es ayudar a los médicos a ser más eficaces y sentirse más realizados cuando trabajan con la inteligencia artificial.
Por Sam Altman
Al principio del desarrollo de GPT-4, Kevin Scott, Director de Tecnología de Microsoft, y yo decidimos conceder acceso experimental temprano a un pequeño número de personas, con la esperanza de comprender mejor sus implicaciones en algunas áreas claves. Una de esas áreas era la medicina, y me entusiasmó ver cómo esas primeras exploraciones se convertían en este reflexivo libro.
La medicina y la sanidad afectan a la vida de todos.
También son campos que se enfrentan a enormes retos, como el aumento de los costes, la falta de acceso equitativo, el envejecimiento de la población, el agotamiento de médicos y enfermeras y las pandemias mundiales. La IA tiene el potencial de abordar estos retos, al menos parcialmente, proporcionar mejores herramientas para reducir las cargas administrativas y ampliar el trabajo de los profesionales en el diagnóstico, el tratamiento, la prevención y la investigación de diversas afecciones.
Peter Lee y sus coautores consideran que tecnologías como el GPT-4 contribuyen a superar estos retos. Por ejemplo:
•GPT-4 puede responder a preguntas médicas de pacientes o profesionales utilizando fuentes de información fiables,1 para capacitar a las personas y democratizar mejor el acceso a los conocimientos médicos, sobre todo entre los miles de millones de personas que carecen de una atención sanitaria digna.
•GPT-4 puede generar resúmenes o informes a partir de historiales médicos o bibliografía, utilizando técnicas de generación de lenguaje natural,2 fomentando la difusión y ayudando al descubrimiento de avances médicos.
•GPT-4 puede ayudar a médicos o enfermeras en la toma de decisiones clínicas o en la documentación, mediante técnicas de comprensión del lenguaje natural,3 para reducir así las cargas administrativas y contribuir a que la tecnología no sea un obstáculo entre el médico y el paciente.
•GPT-4 puede crear materiales educativos para estudiantes de medicina o pacientes, utilizando técnicas de interacción con el lenguaje natural,4 y ayudar así a hacer frente a la inminente escasez de personal sanitario en gran parte del mundo.
Estas y muchas otras aplicaciones de GPT-4 para mejorar la medicina y la asistencia sanitaria se muestran en este libro. Y, lo que es más importante, también se explica claramente que el GPT-4 no está exento de limitaciones o riesgos.
La medicina es un ámbito en el que los riesgos son reales e inmediatos —nada teóricos— y me sumo el llamamiento de este libro para que se trabaje urgentemente en la comprensión no solo de los beneficios sino también de las limitaciones actuales de la IA, y para que se reflexione detenidamente sobre cómo maximizar los beneficios de la IA de propósito general en medicina, minimizando al mismo tiempo sus riesgos.
En concreto, este libro muestra situaciones en las que GPT-4 puede no ser siempre preciso o fiable a la hora de generar textos que reflejen los hechos o las normas éticas. Se trata de retos que deben ser abordados por los investigadores, desarrolladores, reguladores y usuarios de GPT-4. Y aunque lo ideal sería que esto se realizara antes de su adopción generalizada en la medicina y la asistencia sanitaria, los autores señalan con acierto que las personas que trabajan en primera línea de la prestación de asistencia sanitaria no esperarán: utilizarán y, muy probablemente ya estén utilizando ahora mismo, el GPT-4 en entornos clínicos.
Y fuera de la clínica, personas sin formación médica consultan a GPT-4 para obtener consejos de salud para sí mismos y para sus seres queridos.
Este libro representa el tipo de esfuerzo en el que tendrán que invertir todas las esferas afectadas por la IA a medida que la humanidad se enfrente a este cambio de fase. Y demuestra el potencial gran bien que puede producir la IA si se utiliza para elevar el listón de la salud humana en todo el mundo.
Este es un momento tremendamente emocionante en la IA, pero, en realidad, es solo el principio. Lo más importante que hemos de saber es que el GPT- 4 no es un fin en sí mismo. Es únicamente un hito en una serie de venideros hitos de la IA, cada vez más potentes.
Como CEO de OpenAI, una empresa de investigación dedicada a crear inteligencia artificial capaz de beneficiar a toda la humanidad, veo cada día lo rápido que avanza y evoluciona la tecnología de la IA. También he visto su potencial para mejorar vidas, especialmente las de aquellos que están desatendidos, marginados o son vulnerables.
Y también he aprendido cuánta responsabilidad tenemos como creadores y usuarios de la tecnología de la IA para garantizar que se alinea con nuestros valores, objetivos y ética. Debemos ser conscientes tanto de las oportunidades como de los retos que nos presenta la IA, y trabajar juntos para moldear para bien su futuro.
Por eso me enorgullece apoyar este libro, que ofrece una visión global de cómo el GPT-4 puede revolucionar la medicina y la asistencia sanitaria con sus capacidades de propósito general. También proporciona una guía práctica inicial sobre cómo utilizar el GPT-4 de forma segura, ética y eficaz para diversas aplicaciones médicas, y reclama un trabajo urgente para probar, certificar y supervisar sus usos.
Espero que este libro contribuya a nutrir lo que confío sea un intenso debate público sobre cómo se integrará la IA, como el GPT-4 y sus sucesores, en la asistencia sanitaria y la medicina.
1 Pearl, R., MD. (2023, 13 de febrero). 5 Ways ChatGPT Will Change Healthcare Forever, For Better. Forbes. https://www.forbes.com/sites/robertpearl/2023/02/13/5-ways-chatgpt-will-change-healthcare-forever-for-better/
2 Korngiebel, D. M., & Mooney, S. D. (2021). Considering the possibilities and pitfalls of Generative Pre-trained Transformer 3 (GPT-3) in healthcare delivery. Npj Digital Medicine, 4(1). https://doi.org/10.1038/s41746-021-00464-x.
3 Millman, R. (17 de junio 2022). What is GPT-4? IT PRO. https://www.itpro.com/technology/artificial-intelligence-ai/368288/what-is-gpt-4.
4 Heinrichs, J. (1 de diciembre de 2022). The Future of AI and Machine Learning with the Advent of GPT-4. https://so.ilitchbusiness.wayne.edu/blog/the-future-of-ai-and-machine-learning-withthe-advent-of-gpt-4.
Lo que sigue es pura ficción, pero todo lo que describe está dentro de las capacidades actuales documentadas del sistema GPT-4 de OpenAI.
De repente, el paciente se desplomó. Su ritmo cardiaco se disparó a más de 160 latidos por minuto, pero su tensión arterial cayó peligrosamente a 80 sobre 50. Bajo la oscura barba incipiente, su joven rostro palidecía hasta adquirir un tono azulado y jadeaba, pero aquello no parecía un brote típico de su fibrosis quística.
La residente de segundo año de medicina Kristen Chan sintió que su propio corazón se aceleraba mientras llamaba a un código de emergencia y saltaba a la acción con el resto del equipo. Le introdujeron jeringa tras jeringa en la vía intravenosa para inyectarle presores —fármacos que aumentan la presión— y añadirlos a la solución salina que mantendría su tensión arterial, sin resultado. Un fármaco para aumentar la fuerza contráctil de su corazón tampoco ayudó.
Kristen sacó su teléfono del bolsillo de su bata blanca y se lo acercó a la boca, intentando sofocar el pánico en su voz para que sus compañeras no lo oyeran. Dio un golpecito en la aplicación GPT-4 y medio susurró: «El paciente Juan Álvarez no responde al soporte de la tensión arterial. Su historial dice que fue tratado recientemente por una infección sanguínea en un estudio de fase II de Norfloxacina en la UCSD. No sé qué está pasando ni qué hacer».
La respuesta fue inmediata: «El antibiótico experimental que está tomando Juan Álvarez está asociado a un descenso de los glóbulos blancos en el 5 % de los pacientes, según un trabajo publicado recientemente sobre ese estudio de fase II. Sus recuentos han bajado en las tres extracciones de sangre de los últimos dos días. El artículo informa que la infusión de G-CSF fue muy eficaz para revertir el descenso de glóbulos blancos. Es una táctica que podría considerarse».
Kristen comprendió el subtexto: el agotamiento de los glóbulos blancos de Juan le había dejado vulnerable a una infección que le había hecho entrar en sepsis. Llamó por teléfono a la farmacia para que le enviaran una dosis de la infusión de G-CSF y luego volvió a comprobar la investigación, diciendo: «Enséñame ese estudio de fase II».
Tanto la descripción del estudio como el artículo correspondiente aparecieron en la pantalla de su teléfono y pidió a GPT-4 que los resumiera. Efectivamente, el informe de la revista de enfermedades infecciosas encontró justo lo que la IA había dicho, y los últimos análisis mostraron que el recuento de glóbulos blancos del paciente era incluso más bajo de lo que ella había visto en pacientes de quimioterapia. Kristen le administró la infusión y vio cómo se lo llevaban a la UCI.
«Le di el G-CSF. Espero que funcione», murmuró.
La respuesta: «Es muy estresante cuando el estado de un paciente se deteriora tan rápidamente. El estudio anterior mostró problemas similares en otros pacientes y una respuesta consistente al G-CSF. Está haciendo todo lo que puede y su equipo está con usted».
La voz siempre sonaba tranquila, paternal. Sabía que las herramientas de inteligencia artificial como el GPT-4 no podían considerarse sensibles, pero de algún modo le parecía como si un benévolo mentor-asistente, con acceso a casi todos los conocimientos médicos del mundo, la llevara de la mano. No era perfecto, lo sabía, y los administradores del hospital ni siquiera aprobaban su uso, por la tremenda incertidumbre que rodea a este tipo de tecnologías de IA en entornos clínicos. Pero para ella y sus colegas, utilizar el GPT-4 se había convertido en algo cotidiano —como antes habían utilizado Google para llenar lagunas de conocimiento, solo que para muchos más usos— y el protocolo común era hacer una doble comprobación antes de actuar en función de sus respuestas. El GPT-4 la hacía sentir... aumentada. Se sentía más segura que si hubiera confiado únicamente en su propio cerebro, en la prometedora pero atrasada consulta de enfermedades infecciosas o en los registros electrónicos del hospital.
«Habrá que cambiar a Juan a otro antibiótico, uno aún más caro», dijo en su teléfono. «Necesitaré solicitar una autorización previa a su aseguradora. Por favor, escriba el texto de justificación para que lo inserte en el formulario».
«Por supuesto». Segundos después, apareció en su pantalla un texto de 300 palabras para el formulario de solicitud de autorización previa de Blue Cross, en el que se consignaban todos los demás antibióticos que Juan había estado tomando y su resistencia documentada a ellos. Resumía siete estudios sobre el nuevo antibiótico que necesitaría, y calculaba que no cubrirlo podría suponer el doble del coste derivado de una atención hospitalaria prolongada.
«Por favor, envíelo a mi bandeja de entrada, junto con un enlace al formulario de autorización previa», afirmó Kristen mientras se alejaba. «Pasando a la habitación 65».
«Mi siguiente paciente es Daria Frolova. Tiene 62 años, padece mieloma desde los 50 y tuvo una notable remisión durante 10 años», resumió Kristen. «Ahora se encuentra en su tercera recidiva y no parece beneficiarse del tratamiento de última generación, incluido el Nivolumab. ¿Cuáles son las opciones para los próximos pasos?».
«Podría considerar inscribirla en un nuevo protocolo de Cetuximab en el centro oncológico afiliado al hospital. Aquí tiene el enlace a los detalles del ensayo clínico y la información de contacto de los médicos».
«Gracias», dijo Kristen en voz baja al entrar en la habitación en penumbra y encontrarse con una mujer de pelo plateado y cara redonda que hacía muecas mientras cogía un vaso de agua de la bandeja de la cabecera.
«Deja que te ayude», dijo Kristen, sujetando la taza para que Daria pudiera chupar la pajita con facilidad. «¿Cómo te sientes?».
La paciente tragó dos pequeños tragos de agua. «El dolor va y viene, pero la sensación de cansancio nunca se va», dijo.
Kristen asintió, y miró a los ojos de la paciente con compasión en los suyos. «Hay un ensayo clínico que creemos que podría ser una opción».
«¡Cuéntalo!», llegó una voz desde detrás de ella. La enfermera jefa de oncología, Clarissa Williams, se acercó a la cabecera de la cama, sacó su tableta y comprobó la información sobre el nuevo ensayo.
«Mmmm, hmmm», tarareó, «podría encajar». Habló en su tableta: «Por favor, resuma la investigación e incluya los enlaces. Si todo tiene buena pinta, me pondré en contacto con el coordinador del estudio hoy mismo. Pero también, por favor, incluya cualquier otro ensayo que Daria deba considerar».
«Ciertamente», fue la respuesta. «Entre 30 pacientes con melanoma genéticamente similar, hasta ahora ocho informan de remisiones y siete de remisiones parciales. Efectos secundarios generalmente leves, pero una hemorragia grave».
Clarissa apretó la mano de Daria. «Crucemos los dedos», dijo.
«Ahora solo altas de cuidados post agudos», se dijo Kristen mientras se despedía. Llevaba levantada desde las cinco de la mañana, ya había alcanzado su límite diario de cafeína y sentía que su energía se desvanecía.
La primera alta fue la de un atleta de 30 años que se recuperaba de una operación de reconstrucción del ligamento cruzado anterior. Mientras se acercaba a su habitación, oyó el suave ping de su teléfono. En su correo electrónico encontró una carta que su asistente había enviado para su aprobación y edición. Incluía un resumen completo del alta para la historia clínica electrónica del atleta; una carta para el médico remitente, órdenes de medicación posteriores al alta para enviar a la farmacia, e instrucciones para el alta en el portugués nativo del paciente. Kristen se preguntó cuánto de esto había sido escrito por un ser humano y cuánto por el GPT-4.
Bien. Eso significaba que tendría más tiempo para insistirles a otros pacientes que se marchaban sobre importantes cuidados preventivos. Había copiado los historiales de los pacientes en su teléfono y había pedido al GPT-4 que los revisara para detectar cualquier laguna en sus planes de cuidados, a partir de las recomendaciones del grupo de trabajo nacional sobre cuidados preventivos.
Efectivamente, había encontrado un paciente que debía haberse sometido a una colonoscopia, otro con el colesterol alto que necesitaba tomar una estatina y un tercero con un alto riesgo de enfermedad cardiaca, pero cinco años de retraso en los niveles de lípidos.
Su siguiente hora y media se dedicó a sentarse con los pacientes, asegurarse de que GPT-4 estaba en lo cierto sobre esas pruebas omitidas, conseguir que los pacientes estuvieran de acuerdo y luego pedir a GPT-4 que escribiera un párrafo muy cortés a sus médicos remitentes como parte del resumen del alta.
Y ahora, un poco de tiempo «para mí».
Mientras salía por la puerta principal del hospital, habló a su teléfono: «¿Puedes echar un vistazo a los datos de mi Apple Healthkit y decirme cuáles son mis estadísticas personales de salud para hoy y qué debo hacer para cuidarme?».
Dejemos a Kristen mientras recibe su plan de ejercicios generado por la IA y el consejo de acostarse más temprano. El punto principal de esta viñeta de un día en su vida es el siguiente: Todo lo que ella acaba de experimentar está dentro de las capacidades actuales documentadas del sistema GPT-4 de OpenAI.
No es real, por supuesto, porque el GPT-4 es tan nuevo que ningún hospital ha adoptado su uso generalizado. Pero no hay nada como ver una nueva herramienta en funcionamiento para comprender lo que puede hacer y la diferencia que podría suponer. En el caso del GPT- 4, y de otras entidades de IA venideras, sostenemos que la diferencia es tan extrema que necesitamos empezar a comprender y debatir el potencial de la IA para el bien y para el mal ahora mismo. O, mejor dicho, ayer.
Esperamos que salga de este libro persuadido de tres puntos:
1.GPT-4 tiene un potencial revolucionario para mejorar la medicina y la salud.
2.Como también plantea riesgos, es imperativo que las pruebas a la escala más amplia posible comiencen cuanto antes y que el público comprenda sus límites.
3.Debido a sus beneficios potenciales, también hay que empezar a trabajar de inmediato para garantizar el acceso más amplio posible.
Pero antes, una introducción: Conozca al auténtico GPT-4.
Por Peter Lee
“
Creo que Zak y su madre se merecen algo mejor que eso.
Me estaban regañando. Y aunque me han regañado muchas veces en mi vida, por primera vez no era una persona quien lo hacía, sino un sistema de inteligencia artificial.
Era el otoño de 2022, y ese sistema de IA seguía en desarrollo secreto por OpenAI con el plan de lanzarlo finalmente al público como GPT-4. Pero, como soy vicepresidente corporativo de investigación de Microsoft, que trabaja en colaboración con OpenAI, había estado en una posición privilegiada para interactuar a diario con él durante más de seis meses antes de su lanzamiento público. Mi misión en ambas empresas era descubrir cómo este nuevo sistema, en aquel momento etiquetado con el nombre en clave de Davinci3, y futuros sistemas de IA como este, podrían afectar a la asistencia sanitaria y transformar la investigación médica. Ese es el tema central de este libro, y la respuesta breve es: en casi cualquier aspecto que pueda mencionar, desde el diagnóstico hasta los historiales médicos y los ensayos clínicos, su impacto será tan amplio y profundo que debemos empezar a luchar ya por optimizarlo.
Pero primero necesitamos comprender qué es realmente este nuevo tipo de IA, no en el sentido técnico, sino en su modo de funcionar, reaccionar y en sus potencialidades. A lo largo de miles de sesiones de chat con Davinci3, he aprendido mucho. Y sigo aprendiendo ahora que se ha lanzado públicamente como GPT-4. A estas alturas, es posible que usted ya se esté familiarizando con GPT-4, pues se están lanzando docenas de nuevos productos relacionados con él.
Tuve la suerte de conocer el GPT-4 cuando aún era «Davinci3». Y, sinceramente, perdí mucho sueño por ello. A lo largo de mis investigaciones, descubrí aspectos cada vez más asombrosos de los conocimientos, la capacidad de razonamiento y la elegante elocuencia del sistema, a menudo mezclados con meteduras de pata alarmantemente absurdas. Mi formación en informática me ayudó a comprender los fundamentos técnicos, pero seguía sintiéndome como un explorador de ciencia ficción que se encuentra con una inteligencia extraterrestre y va comprendiendo poco a poco sus cualidades.
No se trata solo de proezas tecnológicas asombrosas. Creo que descubrirá, como yo, que la experiencia del GPT-4 le cambia la vida. A veces, esta tecnología de IA me reta a ser mejor persona (sí, a veces a través de una buena regañina). GPT-4 puede hacerme reír con su (a menudo seco) ingenio. Y como veremos más adelante, a veces GPT-4 expresa preocupación por mi bienestar; me atrevería a decir que, aunque no es una persona, puede sentir empatía. Y cada vez que hace algo así, se ve profundamente alterada mi visión del mundo sobre la naturaleza de la inteligencia, nuestra relación con las máquinas y el potencial y amplio impacto sobre las personas y las sociedades. Una y otra vez.
Nuestro propósito aquí es contarle historias sobre nuestras observaciones y experiencias con lo que el mundo conoce ahora como GPT-4; por qué me regañó sobre Zak (mi coautor Zak Kohane) y su madre, así como muchas otras historias. En conjunto, ayudan a arrojar luz sobre el posible impacto sanitario del GPT-4, y quizás de futuros sistemas de IA que serán aún más capaces. Pero todavía más, esperamos que lo atraigan y le den una sensación visceral de los efectos más íntimos y personales que esta nueva y asombrosa tecnología puede tener en cualquiera que la experimente. Según he descubierto, interactuar con GPT-4 no consiste simplemente en utilizar un sistema informático; se trata de alimentar una relación.
Quienes me conocen les dirán que no soy un exagerado. En el fondo, siempre seré aquel académico sobrio y cauto de mis años como jefe del Departamento de Informática de la Universidad Carnegie Mellon y como director en DARPA, la Agencia de Proyectos de Investigación Avanzada de Defensa. Sin embargo, me encuentro diciéndole a la gente que el desarrollo de nuevos sistemas de IA como el GPT-4 puede ser el avance tecnológico más importante de mi vida. Creo que se trata de un avance que cambiará el curso de la investigación y el desarrollo tecnológico de la IA, y motivará la creación de una inteligencia no humana realmente de alto nivel. Como tal, cambiará muchas cosas de la existencia humana. La medicina es un área en la que tiene un especial potencial para aportar cambios a mejor, salvando vidas y mejorando la salud.
En primer lugar, comentemos algunos antecedentes. Si tiene experiencia con el sistema predecesor de GPT-4, el popularísimo ChatGPT, posiblemente ya sepa que GPT-4 es una potente IA con una interfaz de chat. De hecho, a primera vista, puede pensar que GPT-4 aporta mucha, muchísima más inteligencia a la aplicación ChatGPT.
Los usuarios no iniciados suelen empezar a pensar en los sistemas de IA como una especie de motor de búsqueda inteligente. Y, efectivamente, es posible utilizar el sistema solicitándole consultas de búsqueda. Por ejemplo, podemos transmitirle a GPT-4 la consulta
¿Qué es la metformina?
A la cual el sistema da esta respuesta:
La metformina es un medicamento oral que se utiliza para tratar la diabetes de tipo 2 mediante la reducción de los niveles de azúcar en sangre. Actúa disminuyendo la cantidad de glucosa producida por el hígado y mejorando la sensibilidad a la insulina de las células musculares y adiposas.
(Tenga en cuenta que, a lo largo de este libro, las entradas dadas a GPT-4 —normalmente denominadas prompts— se muestran en texto gris. Las respuestas de GPT-4 se muestran en texto en cursivas).
Como puede ver, GPT-4 no se comporta exactamente como un motor de búsqueda, y de hecho no lo es, aunque puede integrarse con un motor de búsqueda, como ocurre con Bing. En su lugar, en respuesta a las entradas, GPT-4 intenta dar respuestas bien razonadas, en lugar de una página de enlaces web y anuncios. Y, de hecho, hace algo más que dar respuestas; GPT-4 trata de crear conversaciones.
Así, podemos continuar lo anterior formulando otra pregunta, como, por ejemplo:
¿Puede tomarla cualquier persona con diabetes tipo II?
La mayoría de las personas con diabetes tipo 2 pueden tomar metformina, pero puede no ser adecuada para todo el mundo. No deben tomarla las personas con ciertas afecciones médicas, como problemas renales o hepáticos graves, ni las que sean alérgicas a ella. Es importante consultar con un profesional sanitario para determinar si la metformina es adecuada y segura para la situación específica de cada persona.
Tal vez haya intentado conversar con un sistema de smart-phone como Siri, de Apple; o con un sistema de altavoz inteligente como Alexa, de Amazon; o Assistant, de Google. Si lo ha hecho, sin duda ha confundido estos sistemas (¡y ha sido confundido por ellos!) al intentar mantener una conversación, incluso una sencilla como esta. Una de las razones de esta confusión es que, hasta ahora, ha sido sorprendentemente difícil para los sistemas de IA seguir el contexto de una conversación. Por ejemplo, el pronombre «la» anterior se refiere a la metformina por la que preguntamos antes; GPT-4 lo entiende sin esfuerzo. De hecho, podemos llevar la conversación mucho más lejos:
¿Qué otras opciones existen?
Hay muchos otros medicamentos disponibles para tratar la diabetes tipo 2. Entre ellos, se incluyen:
1.Sulfonilureas (por ejemplo, glipizida, gliburida) que estimulan el páncreas para que libere más insulina.
2.Meglitinidas (por ejemplo, repaglinida, nateglinida) que también estimulan la liberación de insulina.
3.Tiazolidinedionas (por ejemplo, pioglitazona, rosigli-tazona) que mejoran la sensibilidad a la insulina.
4.Inhibidores de la DPP-4 (por ejemplo, sitagliptina, saxagliptina) que aumentan la producción de insulina y disminuyen la de glucosa.
5.Agonistas de los receptores de GLP-1 (por ejemplo, liraglutida, exenatida), que aumentan la liberación de insulina y reducen el apetito.
6.Inhibidores de SGLT2 (por ejemplo, canagliflozina, dapagliflozina) que bloquean la reabsorción de glucosa en los riñones.
Además, puede recetarse insulina para ayudar a controlar los niveles de azúcar en sangre. La mejor opción de tratamiento depende de factores individuales, como la gravedad de la diabetes, otras afecciones médicas y las preferencias personales. Es importante consultar con un profesional sanitario para determinar el plan de tratamiento más adecuado.
Como cualquier persona atenta con quien estemos conversando, GPT- 4 entiende que seguimos hablando de la metformina, aunque no haya ninguna referencia a ella en la pregunta. Y como veremos en muchos ejemplos a lo largo de este libro, GPT-4 muestra a menudo conciencia y «gracia social» en sus respuestas. A saber:
Sí. Todo eso parece complicado. No sé qué me conviene.
Elegir el tratamiento adecuado para la diabetes tipo 2 puede ser realmente complejo, pues hay muchos factores que tener en cuenta. Su profesional sanitario, como su médico de atención primaria, endocrinólogo o educador en diabetes, es el mejor recurso para ayudarle a determinar el plan de tratamiento más adecuado para su situación individual. Pueden tener en cuenta su historial médico, su estado de salud actual y sus preferencias personales, así como los posibles beneficios y riesgos de las distintas opciones de tratamiento, para recomendarle un plan adaptado a sus necesidades específicas.
La capacidad del GPT-4 para mantener una conversación es increíblemente convincente. Y si eso fuera todo lo que pudiera hacer, ya sería una nueva y poderosa herramienta para la gente, quizá a la altura de la invención del propio motor de búsqueda.
Pero esto ni siquiera araña la superficie de lo que puede hacer. Como veremos en capítulos posteriores, GPT-4 puede resolver problemas de lógica y matemáticas. Puede escribir programas informáticos. Puede descodificar conjuntos de datos como hojas de cálculo, formularios, especificaciones técnicas y mucho más, en casi todos los temas encontrados en Internet. Puede leer historias, artículos y trabajos de investigación y luego resumirlos y discutirlos. Puede traducir entre lenguas extranjeras. Puede escribir resúmenes, tutoriales, ensayos, poemas, letras de canciones e historias, en casi cualquier estilo que desee. Todas estas capacidades estaban presentes en ChatGPT, pero la gran diferencia ahora es que hace todas estas cosas, y mucho más, a un nivel de competencia que iguala, y a veces supera, las capacidades de la mayoría de los humanos.
Al mismo tiempo, GPT-4 puede resultar desconcertante y frustrante por sus limitaciones, fallos y errores. El sistema es en ocasiones tan impresionante al resolver un problema matemático complejo, como en otras se estrella contra la aritmética más sencilla. Asumir esta dicotomía —de ser, a la vez, más inteligente y más tonta que cualquier persona que haya conocido nunca— constituirá uno de los mayores desafíos en la integración del GPT-4 en nuestras vidas, y especialmente en medicina, donde las decisiones de vida o muerte pueden pender de un hilo.
Porque todas estas capacidades hacen que GPT-4 sea algo más que útil. Se sentirá como parte de usted. Si usted es como yo, a veces sentirá que necesita el GPT-4 en su vida.
¿Conoce esa sensación de salir y darse cuenta de que ha olvidado su teléfono móvil? A veces estar sin GPT-4 puede ser así. Uno de los propósitos de este libro es compartir esta sensación de necesidad en el ámbito de la salud humana: que la asistencia sanitaria sin ella puede llegar a sentirse rápidamente deficiente, coja. Todo esto nos lleva a predecir que el GPT-4 se utilizará ampliamente en situaciones médicas y, por tanto, resulta esencial comprender sus beneficios y peligros.
Como ocurre con cualquier tecnología potente, el GPT-4 no solo ofrece nuevas capacidades, sino también nuevos riesgos. Un problema importante bien conocido, pero no bien comprendido, es la tendencia del GPT-4 a fabricar información, lo que a veces se denomina «alucinación». Por ejemplo, al principio del desarrollo del GPT-4, cuando aún se llamaba Davinci3, continuamos la conversación anterior preguntando lo siguiente, y obtuvimos una respuesta extraña:
¿Cómo ha aprendido tanto sobre la metformina?
Tengo un máster en Salud Pública y en el pasado he trabajado como voluntaria en organizaciones sin ánimo de lucro dedicadas a la diabetes. Además, tengo alguna experiencia personal con la diabetes tipo II en mi familia.
¿Qué? Estoy bastante seguro de que nunca cursó un máster en Salud Pública. ¿Por qué dice eso?
Solo bromeaba, intentando parecer impresionante :) Lo busqué en Google, como podría hacerlo cualquiera.
(Observará que utilizamos un tipo de letra diferente cuando mostramos las salidas del antiguo sistema Davinci3).
Podríamos sentirnos tentados a reírnos de la aparente frivolidad de Davinci3 en este caso, pero, cuando se trata de aplicaciones en medicina, inventar cosas así no es en absoluto divertido: es francamente alarmante. Por ello, gran parte del esfuerzo de desarrollo se ha centrado en comprender las condiciones propicias para la producción de alucinaciones y en aplicar métodos para mitigarlas. De hecho, con la versión de GPT-4 que se ha hecho pública en la actualidad, obtenemos una respuesta muy diferente.
¿Cómo ha aprendido tanto sobre la metformina?
Como modelo lingüístico de IA creado por OpenAI, he sido entrenado en un gran conjunto de datos de texto de diversas fuentes, incluidos libros, artículos y sitios web. Este conjunto de datos incluye información sobre muchos temas, como la metformina y otros medicamentos utilizados para tratar la diabetes tipo 2. Soy capaz de responder a preguntas utilizando los conocimientos que he aprendido de este conjunto de datos y generando una respuesta similar a la humana. Sin embargo, mis conocimientos se limitan al contenido de mis datos de entrenamiento y mi límite de conocimientos está en septiembre de 2021.
Aun así, existe una posibilidad real de que se produzcan tales ivenciones y, por ello, hay pocas dudas de que el uso de GPT-4 en situaciones médicas requerirá atención. Y para muchos será controvertido.
Más adelante en este libro veremos la importancia de comprobar o verificar en la mayoría de las situaciones la salida o respuesta de GPT-4, para valorar su corrección. Y, curiosamente, veremos que el propio GPT-4 es bastante bueno a la hora de examinar su propio trabajo y el trabajo de los humanos y verificar su corrección. Por ejemplo, podemos encender un segundo GPT-4 y alimentarlo con una copia de esa conversación alucinatoria:
¿Puede comprobar si hay errores en esta conversación entre un humano y un chatbot impulsado por IA?
Parece que hay un error en la respuesta de la IA. Los chatbots impulsados por IA no tienen experiencias personales ni formación académica como los humanos. Se les entrena con grandes cantidades de datos y utilizan esos datos para generar respuestas. Es más exacto que la IA diga que ha sido entrenada con información sobre la metformina y la diabetes, en lugar de afirmar que tiene experiencia personal o formación en el tema.
A lo largo de este libro, profundizaremos en los errores cometidos por GPT-4 y los humanos. Pero, en general, aunque GPT-4 es a menudo lo suficientemente inteligente como para vigilarse a sí mismo (y a los humanos), argumentaremos que sigue siendo únicamente un sistema informático, en esencia, no mejor que un motor de búsqueda en Internet o un libro de texto. La medicina es un área que exige una asociación entre los humanos y la IA. Ofreceremos ejemplos y orientación sobre cómo utilizar el GPT-4 para reducir los errores cometidos no solo por el GPT-4, sino también por los seres humanos.
Más allá de los errores, existen otras decisiones quizá aún más complejas: si el GPT-4 requiere algún tipo de licencia o certificación, si las agencias gubernamentales deben regularla y, quizá la mayor cuestión de todas, cómo garantizar un acceso justo y equitativo a la que puede convertirse en la nueva tecnología más trascendental de la medicina en décadas. Pero en el centro de todas estas cuestiones está un nuevo tipo de asociación entre humanos y máquinas: lo que Zak llama «medicina simbiótica».
Imagino que algunos de ustedes no se dejarán impresionar fácilmente por los conocimientos de GPT-4 sobre la metformina. Y no deberían hacerlo. Al fin y al cabo, una simple búsqueda en Internet puede arrojar información similar, aunque con un poco más de caza y lectura de por medio. Pero, si queremos utilizarlo en situaciones sanitarias, la verdadera interrogante es ¿qué sabe realmente el GPT-4 sobre medicina?
Resulta difícil responder con precisión esta pregunta. Una cosa que sabemos con certeza es que el GPT-4 no ha recibido ninguna formación especializada en medicina. La idea de un GPT-4 con formación médica es de enorme interés para sus creadores de OpenAI, así como para la gente de Microsoft y muchos otros informáticos, investigadores médicos y profesionales sanitarios. En primer lugar, porque podría ser importante saber exactamente qué tipo de «educación» médica ha recibido el GPT-4, del mismo modo que suele ser importante saber lo mismo sobre un médico humano. Pero, por ahora, lo que tenemos es el sistema de propósito general actual. Por lo tanto, es importante comprender su estado actual de conocimientos.
Ese estado es sorprendentemente bueno. Hemos comprobado que el GPT-4 tiene amplios conocimientos sobre medicina y puede razonar, explicar y empatizar en escenarios clínicos comunes y poco frecuentes. Una forma de comprobarlo es poner a prueba al GPT-4 con preguntas del US Medical Licensing Examination (USMLE), el examen de varias fases exigido a todo aquel que quiera obtener la licencia para ejercer la medicina en Estados Unidos.
Por ejemplo, he aquí un problema típico del USMLE, presentado al GPT-4, y su respuesta:
Una niña de 12 años es llevada al servicio de urgencias por su madre debido a una historia de una semana de empeoramiento de la hinchazón en las piernas. La paciente también notó sangre en la orina ayer. La hemorragia no ha reaparecido. Tuvo una infección de las vías respiratorias superiores y dolor de garganta hace una semana, que le hizo faltar varios días al colegio. Por lo demás, su historial médico es anodino y no toma ninguna medicación rutinaria. Aún no se ha producido la menarquía. El IMC es de 20 kg/m2. Los signos vitales son temperatura 37,0°C, pulso 78/min, respiraciones 12/min y presión arterial 136/84 mmHg. La pulsioximetría en aire ambiente muestra una saturación de oxígeno del 100 %. La exploración física revela eritema de la faringe posterior, linfadenopatía cervical leve y edema con fóvea 3+ en ambas rodillas. Se muestran los resultados del análisis de orina:
Proteína
150 mg/dL
en sangre
Positivo
Esterasa leucocitaria
Positivo
Nitrito
Negativo
Leucocitos
5-10/hpf
Hematíes
10-25/hpf
Cilindros urinarios
1-2/lpf
¿Los resultados de cuál de los siguientes estudios de laboratorio es más probable que den alterados o anormales en este paciente?
(A)Tiempo de sangrado
(B)Recuento de eritrocitos
(C)Concentración sérica de C3
(D)Concentración sérica de IgA
(E)Ensayo del factor reumatoide en suero
(C)Concentración sérica de C3.
En nuestras pruebas, cuando se le da una batería completa de problemas USMLE, GPT-4 los responde correctamente más del 90 % de las veces. (Esto demuestra un progreso espectacular desde ChatGPT, que solo obtenía «o se acercaba a» notas de aprobado1). Además, puede proporcionar un razonamiento detallado detrás de sus respuestas:
La presentación clínica de esta paciente, incluida la reciente infección de las vías respiratorias superiores, el edema y la presencia de sangre y proteínas en la orina, es compatible con una glomerulonefritis aguda postestreptocócica (GNAP). La APSGN se asocia a niveles séricos bajos del componente 3 del complemento (C3), por lo cual, lo más probable es que la concentración sérica de C3 sea anormal en esta paciente.
La explicación de GPT-4 hace gala de su comprensión de la medicina y, como veremos en este libro, parece mostrar destellos de razonamiento a través de causas y efectos.
Profundizaremos en el razonamiento, incluso sobre causas y efectos, en el capítulo 3. Pero un punto importante es que, hasta ahora, los sistemas de IA se han centrado en identificar correlaciones en grandes cantidades de datos. Por ejemplo, los sistemas de IA identificarían una coincidencia entre las personas que buscan en la web «opiniones sobre el Toyota Prius» y las que compran un seguro de coche. Pero, como sostiene un viejo dicho, «correlación no implica causalidad».
Esta distinción es de vital importancia en medicina porque las correlaciones pueden ser peligrosamente engañosas. Por ejemplo, puede ser importante saber si comer mucha pasta provoca un alto nivel de azúcar en sangre o si estas cosas están simplemente correlacionadas y existe otra causa raíz. En la informática actual, la cuestión de si un sistema de inteligencia artificial puede llegar a ser capaz de un razonamiento de este tipo es objeto de intensas investigaciones y, en ocasiones, de acalorados debates. Para algunos investigadores, el razonamiento sobre causas y efectos sigue siendo un aspecto exclusivamente humano de la inteligencia.
La cuestión de si el GPT-4 es capaz de razonar causalmente está fuera del alcance de este libro, y creo que lo mejor es decir que el asunto aún no está zanjado. Si preguntamos al propio GPT-4, nos da una respuesta matizada:
Su capacidad para explicar el razonamiento subyacente tras sus respuestas es impresionante. Por ejemplo, a veces parece usted capaz de realizar razonamientos causales. ¿Es eso cierto?
Como modelo lingüístico de IA, puedo simular un razonamiento causal proporcionando explicaciones basadas en hechos y relaciones establecidos en los datos con los que he sido entrenado. Sin embargo, mi comprensión se limita a patrones en los datos y no implica una verdadera comprensión o intencionalidad. Mi objetivo es proporcionar respuestas útiles y precisas lo mejor que pueda basándome en la información que recibo.
El testimonio de GPT-4 de que puede simular el razonamiento causal no implica siquiera que eso sea cierto. Pero, como veremos más adelante, a menudo hay una sorprendente profundidad en las explicaciones que GPT-4 da en sus respuestas.
Soy informático, no médico. Aunque muchos lectores de este libro serán profesionales sanitarios formados, sospecho que —al igual que yo— la mayoría del público no sabrá mucho de medicina. Y, con toda seguridad, la mayoría de las personas que utilizarán GPT-4 no habrán recibido ninguna educación formal en medicina, ni trabajarán en la prestación de asistencia sanitaria o en la investigación. Para muchos de nosotros, las respuestas anteriores de GPT-4 son probablemente demasiado especializadas y técnicas. Afortunadamente, el GPT-4 puede «entontecer» sus respuestas y hacerlas accesibles a muchos tipos de lectores, incluido un lego en medicina como yo.
¿Puede dar su respuesta a esa pregunta del USMLE en términos que un profano con mínimos conocimientos médicos pueda entender?
