Erhalten Sie Zugang zu diesem und mehr als 300000 Büchern ab EUR 5,99 monatlich.
La mejor herramienta es la más difícil de utilizar. El machine learning es la tecnología de uso general más importante del mundo, pero es muy complicada de lanzar. Fuera de los gigantes tecnológicos y algunas otras empresas líderes, las iniciativas de machine learning suelen fallar a la hora de implementarse y nunca llegan a aportar valor. ¿Qué falta? Una práctica empresarial especializada apta para una adopción amplia. En la Guía práctica de la IA, el autor superventas Eric Siegel presenta el estándar de referencia, un modelo práctico en seis pasos para llevar los proyectos de machine learning desde su concepción hasta su implementación. Ilustra la práctica con historias de éxito y fracaso, incluyendo casos prácticos reveladores de UPS, FICO y empresas puntocom destacadas. Este enfoque disciplinado sirve para ambas partes: da poder a los profesionales empresariales y establece un marco de trabajo estratégico muy necesario para los profesionales de los datos. Además de detallar la práctica, este libro también mejora las cualificaciones de los profesionales empresariales de forma indolora. Ofrece una dosis vital pero amable de conocimiento contextual semitécnico que todas las partes interesadas necesitan para dirigir o participar en proyectos de machine learning de principio a fin. Esto pone a los profesionales empresariales y los de datos en igualdad de condiciones para que puedan colaborar de manera conjunta y profunda para establecer con precisión lo que debe predecir el machine learning, cómo de bien predice y cómo se actuará en función de sus predicciones para mejorar las operaciones. Estas cuestiones esenciales determinan el éxito o el fracaso de cada iniciativa; si se hacen bien, allanan el camino para la implementación dirigida al valor del machine learning.
Sie lesen das E-Book in den Legimi-Apps auf:
Seitenzahl: 414
Veröffentlichungsjahr: 2025
Das E-Book (TTS) können Sie hören im Abo „Legimi Premium” in Legimi-Apps auf:
Dedico este libro con todo mi corazón a mi madre, Lisa Schamberg, y mi padre, Andrew Siegel.
Mi esposa, Luba Gloukhova, contribuyó muchísimo a este libro. Aunque a la pareja de cualquier autor se le encomienda la tarea de cultivar la paciencia y, quizá, hacerse cargo de responsabilidades parentales adicionales, Luba tuvo que soportar la carga extra de ser ella misma una experta en la materia tratada: es científica de datos, y además una muy perspicaz y experimentada (puedes ver su consultoría en www.datagie.com). Como tal, busqué sus consejos sin parar durante las comidas, los paseos en los parques infantiles. Actuó como caja de resonancia 24/7 y además fue una revisora exhaustiva. La asociación más formal de Luba conmigo también proporcionó valor a este libro, incluyendo su trabajo como presidenta fundadora de la serie de conferencias Deep Learning World, jefa de redacción del Machine Learning Times y editora de contenidos de mi curso online. No podría haber escrito este libro sin el entusiasmo y el apoyo de Luba. ¡Sin embargo, debo añadir que su desempeño virtuoso como amante esposa y madre trasciende todo eso!
Mis padres y mis suegros también se esforzaron al máximo por apoyarme en este proyecto. Lisa Schamberg (madre), Andrew Siegel (padre), Anna Gloukhov (suegra) y Maya Kanyuka (abuela de mi mujer) ofrecieron unos ánimos que no tienen precio, además de opiniones sobre mi escritura.
Mi agente literario, el incomparable Jim Levine de Levine Greenberg Rostan, propuso correcciones críticas para mi curso durante las primeras etapas formativas de este proyecto y siguió hasta las últimas etapas para ayudarme a llevar la visión del libro a una realidad elaborada con más cuidado. Si no hubiese sido por su sabiduría entusiasta y su perspicacia empresarial, este libro tendría mucho menos sentido.
Mi editora Catherine Woods, de MIT Press, sabe qué hace que un libro sea legible y relevante y que podamos identificarnos con él. Sus comentarios fueron cruciales mientras me ocupaba de los muchos actos de equilibrio en la estructuración de este libro. Y Abbie Lundberg, pese a sus responsabilidades como jefa de redacción de MIT Sloan Management Review, dedicó un tiempo a revisar con atención y ofrecer opiniones muy necesarias que mejoraron mucho el libro. Al principio, Emily Taber creyó en este proyecto y me adoptó como autor. Pese a estar a punto de marcharse para cuando acabé el primer borrador (a otra editorial después de trece años en MIT Press), hizo un esfuerzo adicional por ofrecerme feedback en profundidad.
Laurie Harper, Alison Jones, David Lamb, Barbara Monteiro, Barbara Oakley y Myles Thompson actuaron como mentores con gran experiencia en la industria editorial. Me aconsejaron desde la concepción inicial de este libro sobre cómo navegar por el proceso de publicación, además de ofrecer sugerencias sustanciales acerca de la formulación del proyecto.
Una carrera en el campo de la tecnología no está completa sin un grupo de compinches con los que no solo colabores, sino con los que hables de trabajo con regularidad, que es más importante. Dean Abbott, John Elder, Karl Rexer y James Taylor, todos ellos asesores séniores y emprendedores, han mejorado mis conocimientos y mi disfrute a lo largo de los años y, más recientemente, me han proporcionado revisiones exhaustivas de un primer borrador de este libro.
También he aprendido mucho de un sector más amplio de profesionales del machine learning: los 18.000 asistentes y oradores que han participado en la serie de conferencias que fundé en 2009, Machine Learning Week (www.machinelearningweek.com), anteriormente conocida como Predictive Analytics World. Gracias a la comunidad productiva y vibrante que ha asistido a nuestras docenas de eventos a nivel internacional, he disfrutado de una vista de 360 grados de la industria que ha influido enormemente en este libro. Me gustaría dar las gracias a mi socio en su producción, Matthew Finlay, y a su excelente equipo en Rising Media, que sabe cómo hacer eventos que entusiasmen y unan.
Muchas personas de la escuela de negocios Darden de la Universidad de Virginia, donde ocupé durante un año la plaza de profesor Bodily del Bicentenario de Analítica, contribuyeron de forma significativa a la formulación de las ideas a medida que yo pulía la metodología aquí descrita. Estoy agradecido a Samuel Bodily, el profesor emérito que daba nombre a mi plaza, quien me aportó en persona una enorme cantidad de sugerencias y orientación en mi trabajo, gran parte de las cuales han llegado al libro. Varios miembros del cuerpo docente de Darden y otros departamentos de la Universidad de Virginia también aportaron opiniones así, incluyendo a Michael Albert, Alexander Cowan, Renée Cummings, Rupert Freeman, Yael Grushka-Cockayne, Marc Ruggiano, Bill Scherer, Eric Tassone y Sasa Zorc.
Me gustaría dar las gracias a Jack Levis, Scott Zoldi y Gerhard Pilcher, todos ellos innovadores en la implementación del machine learning, que aguantaron mis entrevistas exhaustivas llenas de preguntas exploratorias.
La cooperación es necesaria. Tuve mucha suerte de que las siguientes personas dedicasen tiempo y atención a revisar los primeros borradores de estos capítulos: Rich Heimann, Eugene Kirpichov, Sam Koslowsky, Barry Lyons, Matthew Mayo, Glenn McMahan, Gregory Piatetsky-Shapiro, Steven Ramirez, Jonathan Sloan, Graham Southorn, David Stephenson, Martin Szugat, Morgan Vawter (además de escribir el inspirador prólogo de este libro) y Evan Wimpey.
Gracias a Sean O’Brien y Catherine Truxillo del SAS por su apoyo a la hora de producir y alojar mi serie de cursos online, “Machine Learning Leadership and Practice: End-to-End Mastery” (www.machinelearning.courses), cuyo contenido sirvió como base para este libro. Gracias también a William Goodrum por su ayuda con el contenido de los cursos.
Muchas gracias a Harvard Data Science Review por publicar originalmente mi texto sobre la historia de la implementación de UPS en un artículo titulado “To Deploy Machine Learning, You Must Manage Operational Change—Here Is How UPS Got It Right” (vol. 5, n.º 2, primavera 2023). El artículo habla de la parte de la historia de UPS que se trata sobre todo en el sexto capítulo de este libro, así como algunos aspectos abordados en la introducción.
Gracias a Scientific American, que publicó originalmente mi artículo sobre la falsa precisión, una primera versión de la apertura del capítulo 3.
Gracias al diseñador talentosísimo Matt Kornhaas por las figuras que aparecen en los capítulos y a la extraordinaria artista Daneen Wilkerson por la imagen del tirachinas de la cubierta del libro en su edición original en lengua inglesa.
Por último, quiero hacer un reconocimiento especial a los educadores extraespeciales, de los cuales he conocido a muchos: Thomas McKean (preescolar), Chip Porter (de 4.º a 6.º de primaria), Margaret O’Brien (Instituto Burlington, Vermont), Harry Mairson (Universidad de Brandeis), Richard Alterman (Universidad de Brandeis), James Pustejovsky (Universidad de Brandeis) y Kathleen McKeown (Universidad de Columbia).
Todas las personas anteriores me han moldeado y reforzado este libro. Sin embargo, la responsabilidad sobre cualquier error o defecto de cualquier tipo en su contenido es solo mía.
El doctor Eric Siegel es un consultor líder y antiguo profesor de la Universidad de Columbia que ayuda a empresas a implementar el machine learning. Es el fundador de la longeva serie de conferencias Machine Learning Week, instructor del aclamado curso online “Machine Learning Leadership and Practice—End-to-End Mastery”, editor ejecutivo de Machine Learning Times y primer orador habitual. Ha escrito el libro superventas Analítica predictiva. Predecir el futuro utilizando Big Data, que se utiliza en cursos de cientos de universidades. El trabajo interdisciplinar de Eric cierra la brecha testaruda entre la tecnología y los negocios. En Columbia, obtuvo el premio Distinguished Faculty cuando impartía los cursos de informática de postgrado sobre machine learning e IA. Más tarde, trabajó como profesor en la escuela de negocios Darden de la Universidad de Virginia. Eric también publica artículos de opinión sobre analítica y justicia social.
Eric ha aparecido en Bloomberg TV y Radio, BNN (Canadá), Israel National Radio, National Geographic Breakthrough, NPR Marketplace, Radio National (Australia) y TheStreet. Eric y su anterior libro han aparecido en Big Think, Businessweek, CBS MoneyWatch, Contagious Magazine, el European Business Review, el Financial Times, Forbes, Fortune, GQ, Harvard Business Review, Huffington Post, el New York Review of Books, el New York Times, Newsweek, Quartz, Salon, el San Francisco Chronicle, Scientific American, el Seattle Post-Intelligencer, el Wall Street Journal, el Washington Post y WSJ MarketWatch.
•Eric Siegel está disponible para dar conferencias selectas. Para informarte, www.MachineLearningKeynote.com.
•Asiste a la conferencia fundada por el autor: www.MachineLearningWeek.com.
•Accede al curso online del autor: www.MachineLearning.courses.
•Sigue al autor: @predictanalytic o www.linkedin.com/in/predictiveanalytics.
Agradecimientos
Sobre el autor
Prólogo de la serie
Prólogo
Prefacio: Breve historia de por qué los proyectos de machine learning se estancan
Fallo en el lanzamiento
Abrirse camino entre el caos del ML
Preguntas frecuentes: De qué trata este libro y para quién es
Introducción
Cuidado, pioneros: Causad disrupción por vuestra cuenta y riesgo
Cuando la grandeza es demasiado grande para verla de cerca
Sexy pero vaga: inteligencia artificial
La logística está recuperando lo sexy
Planificar para mañana con información completa
Predecir las entregas de mañana
Las predicciones dirigen el mundo
Ir con todo
Demuestra, no cuentes
Ponte en marcha, Jack
ML bien hecho y mal hecho
Historia de dos tecnologías
¿Cómo hacerlo bien?
Capítulo 0. BizML. Seis pasos para la implementación del machine learning
El potencial de la predicción
Los dos pasos técnicos principales del machine learning
El fracaso del machine learning suele ser un fracaso humano
Muchos modelos nunca se implementan: un problema generalizado de la industria
¿No pueden implementar... o simplemente no lo van a hacer?
La solución: BizML
Los seis pasos de bizML
Por qué la industria converge en estos seis pasos
BizML: un requisito fundamental que no tenía nombre
El origen y el coste del bombo publicitario
Replantear el ML
Los vendedores de ML ayudan, pero las empresas lideran la industria
El conocimiento contextual semitécnico que necesitas
¿Quién está al mando?
Aprender por las malas
Aprender por las buenas
Capítulo 1. Valor. Establecer el objetivo de la implementación
La práctica bizML
La proposición de valor: definirá una aplicación de ML
Planificación hacia atrás: crear un camino a la implementación del ML
Por qué la implementación requiere un salto mental
Decisiones, decisiones: elegir tu primer proyecto de ML
La elección depende, en parte, del sector
Detectar una situación en vez de predecir un resultado
Obtener la aprobación
Siguientes pasos
Capítulo 2. Objetivo. Establecer el objetivo de la predicción
La práctica bizML
El plan de implementación conforma el objetivo de la predicción
La diferencia entre el éxito y el fracaso del ML
Prevenir malos resultados de manera proactiva
Predecir demasiado tarde
Predecir los pasos intermedios
Decidir “cuál” en vez de “si”
Colaborar en el objetivo de la predicción
Detección frente a predicción: unas veces es más fácil y otras es más difícil
Rendimiento del modelo: ¿cómo de bien podemos lograr el objetivo de predicción?
Capítulo 3. Rendimiento. Establecer las métricas de evaluación
La práctica bizML
El “gaydar” de Stanford no funciona por la cara
Exactitud: una palabra que a menudo se usa de forma inexacta
La cháchara sobre predicciones imperfectas
Obligarse a actuar
El valor de la predicción imperfecta
Lift: una medida significativa del rendimiento
Incluso un lift pequeño ayuda mucho
Un ejemplo ilustrativo: ¿cómo de grande es tu televisión?
Implementar ML es triar y priorizar
Trazar la curva de beneficios
Implementar de forma agresiva o defensiva: tu límite marca la diferencia
Métricas empresariales frente a métricas del modelo
Métricas empresariales: indicadores clave del rendimiento
Distinguir falsos positivos de falsos negativos
Calcular el ahorro basado en los costes de clasificación errónea
Costes subjetivos: diagnóstico erróneo frente a diagnóstico no realizado
Los retos de traducir las métricas de rendimiento predictivo a KPIs
Lanzar es dar el salto
Capítulo 4. Combustible. Preparar los datos
La práctica bizML
La savia de la optimización
Qué aspecto tienen los datos de entrenamiento: filas y columnas
Los datos dictan lo que hace el modelo
Grandes datos de entrenamiento para anuncios dirigidos
¿Cómo de grande es lo bastante grande?
¿Están infrarrepresentados los casos positivos?
Es cuestión de tiempo: las variables de entrada
La mayoría de la gente no está preparada para la preparación de datos
Hay ruido que mata el ML, pero hay otro que es excelente
FICO cultiva datos sin fronteras
Diseñar entradas mejores para Falcon
Todavía no hemos terminado: etiquetar los datos
El Falcon de FICO es un luchador fantástico contra el fraude
Capítulo 5. Algoritmo. Entrenar el modelo
La práctica bizML
Curiosear un modelo
¿Tiene sentido el modelo?
Inspeccionar modelos para buscar fallos
Aprender de los datos: el reto tecnológico definitivo
Árboles de decisión: modelos hechos de reglas
Más métodos de modelado; regresión lineal y logística
Todo lo que necesitas saber sobre los métodos de modelado
Por qué hay métodos de modelado que compiten
Un resumen de los métodos de modelado
Elegir un método de modelado
¡Son los datos, estúpido!
¿Cómo de profundo es tu aprendizaje?
Para muchos problemas empresariales, el deep learning es excesivo
Generar numerosos modelos para los anuncios dirigidos
Capítulo 6. Lanzamiento. Implementar el modelo
La práctica bizML
Se produce el cambio: cuando un proceso heredado se digitaliza
Para gestionar el cambio, cambia la gestión
La importancia de la formación
Cuando no necesitamos humanos en el proceso
Traducir predicciones en acciones
Cómo exportar un modelo
La desconexión de los datos: llevar las entradas a un modelo implementado
El firme enfoque de una firma respecto a la desconexión de datos
La necesidad de la velocidad: guiar decisiones en tiempo real
Entrega veloz: los modelos trabajan rápido
Las mejores oportunidades son las más difíciles de aprovechar
Mitigar los riesgos de la implementación con un grupo de control
Atribuir el mérito a quien lo merece: un grupo de control en UPS
El final es un nuevo principio
Chuleta de BizML. El manual de estrategia para la implementación del machine learning
Conclusión. Discurso del ascensor del machine learning, personal, plazos, mantenimiento y ética
El discurso del ascensor
Ejercita la paciencia y solicita opiniones
Reúne a tu equipo: asignar personal al proyecto de ML
Conseguir el equipo del proyecto de ML
Proyectar el proyecto: cuánto tiempo llevará
Retroceder: pasar en bucle por los pasos repetidamente
La vida después del lanzamiento: mantener el modelo
La moral importa
Créditos
Al mundo no le faltan ideas sobre gestión. Miles de investigadores, profesionales y otros expertos producen decenas de miles de artículos, libros, papers, publicaciones y podcasts cada año, pero solo unos poco prometen hacer progresos medibles en la práctica, y menos aún se atreven a adentrarse en lo que será el futuro de la gestión. Esta clase de idea poco frecuente (significativa para la práctica, basada en evidencias y creada para el futuro) es la que queremos presentar en esta serie.
—Abbie Lundberg
Directora
MIT Sloan Management Review
No hay casi ningún resultado empresarial que el machine learning no pueda ayudar a mejorar hoy en día. Desde proporcionar la mejor experiencia a clientes y consumidores a alimentar la productividad, aumentar la seguridad, optimizar las operaciones y mejorar la experiencia de los empleados, el machine learning puede subir el listón de las métricas que más importan. Su implementación práctica representa la vanguardia del progreso humano: mejorar las operaciones con la ciencia. Pero ¿por dónde empezamos y cómo nos aseguramos de que lo que comenzamos no acaba en la basura? A lo largo de mi carrera, he asesorado a más de treinta empresas del Fortune Global 500 sobre datos y análisis, y he dirigido organizaciones internacionales de datos y análisis en Caterpillar y Unilever. He visto lo mejor y lo peor, incluyendo programas analíticos que generan un valor tremendo y una ventaja competitiva, y otros que nunca llegan a arrancar del todo. Según mi experiencia, esas empresas o equipos a los que les cuesta integrar analíticas a gran escala no suelen sufrir debido a una ejecución imperfecta de las analíticas o los modelos de machine learning, sino debido a una grieta en los otros factores requeridos para el éxito.
Por ejemplo, durante un asesoramiento, trabajé con un equipo de análisis de uno de los minoristas más grandes del mundo en un programa para mejorar el retorno de la inversión en marketing. El equipo interno ya había desarrollado un modelo de análisis de medios avanzado. Contaban con un montón de datos y aprovechaban cientos de millones de puntos de datos sobre el gasto en marketing, la respuesta, los productos, las tiendas y otros factores que contribuían. El equipo dedicó horas y horas a perfeccionar el modelo y ajustarlo a los niveles más altos posibles de precisión para, después, resumir la salida en una lista de ideas sobre las acciones a realizar. Llegó el día de la gran presentación ante la directiva de marketing y el equipo presentó las recomendaciones para mejorar el retorno de la inversión haciendo cambios clave en la inversión en marketing offline. Miraron a los directivos más importantes de marketing para ver su reacción, esperando sonrisas, gratitud, halagos y apreciación. En vez de eso, se encontraron con una mezcla de apatía e incredulidad. El problema era que el equipo había ignorado pasos cruciales necesarios para entender e incorporar completamente las prioridades de los interesados, factores relativos a la toma de decisiones y procesos.
Compáralo con una experiencia que tuve mientras dirigía un programa de optimización de la cartera basado en IA en Unilever. Unilever es una organización global. Sus productos se venden en más de 25 millones de tiendas en 190 países, y más de 2.500 millones de personas utilizan sus productos cada día. Las marcas de Unilever incluyen Dove, Knorr, Sunsilk, Hellmann’s, Axe, Ben & Jerry’s, Domestos, Suave, TRESemmé y Magnum.
Vimos una oportunidad para tomar decisiones más inteligentes y rápidas al adoptar un enfoque global guiado por los datos para optimizar nuestra cartera de productos y reducir la complejidad mediante un programa al que más tarde bautizamos Polaris. Una cartera más cuidada de productos beneficia a los clientes y a los minoristas, optimiza nuestras operaciones e impulsa un crecimiento rentable para las partes interesadas de Unilever. Nuestro equipo creó una capacidad y un proceso empresarial basados en IA para analizar la cartera de productos completa a nivel global, recomendar productos para quitar de la lista, desarrollar más, arreglar y proteger. El sistema saca provecho de las analíticas para hacer un seguimiento de la ejecución de estas acciones e impulsar la responsabilidad entre miles de personas en la organización. Creamos y escalamos Polaris de manera global en dos años, aproximadamente, uniendo lo mejor de la inteligencia humana y la de la máquina, lo cual nos dio capacidad para tomar decisiones más eficientes y efectivas y crecer a través de la simplificación.
El camino para llegar hasta ahí no fue fácil y no había una guía disponible para ayudarnos en aquel momento. Por suerte para el lector, los pasos esbozados en este libro dan vida a las mejores prácticas cruciales que seguimos a la hora de ofrecer una iniciativa escalada a nivel global con un impacto empresarial duradero. Estas prácticas incluyen:
1.Empieza teniendo en mente los resultados y céntrate en proporcionar valor de manera gradual.
Nosotros empezamos con una pregunta simple: ¿podríamos incrementar la velocidad de la toma de decisiones y la ejecución para simplificar la cartera de productos (ofrecer ahorro mientras impulsábamos el crecimiento de nuestros clientes)? Hasta que no habíamos cumplido ese objetivo y habíamos establecido el valor, no ampliamos a la optimización de la cartera de productos, incluyendo la simplificación no orientada al consumidor, como el marcado de especificaciones e ingredientes para armonizar todos los productos.
2.Aprovecha la empatía para superar las barreras a las que se enfrenta el cambio.
De forma consciente o inconsciente, todos estamos preprogramados para resistirnos al cambio. Para superar esto, el equipo de análisis pasó cientos de horas con otros equipos de la empresa para entender cómo estaban tomándose en ese momento las decisiones sobre la cartera de productos, incluyendo marketing, ventas, cadena de suministro, finanzas, investigación y desarrollo y minoristas. Al entender los puntos débiles de los procesos actuales, fuimos capaces de trasladar una proposición de valor convincente para las partes interesadas en diferentes niveles y funciones.
3.Prepara los datos para que se ajusten a las necesidades empresariales.
Solo al anticipar las diferencias tempranas en la disponibilidad de los datos, debidas a la naturaleza global del negocio, logró el equipo escalar la capacidad en diferentes espacios geográficos. Reconocimos que teníamos que adaptar las variaciones de los datos entre los distintos mercados; algunos de ellos eran ricos en datos de minoristas y terceros y sacaban a la luz patrones de conducta de los compradores, mientras que otros ofrecían información incoherente sobre puntos de venta y compradores basada en la ruta al mercado. Una infraestructura de datos versátil y un proceso de validación de datos riguroso fueron claves para el éxito.
Estas experiencias han hecho que sea muy consciente de los muchos obstáculos que hay que superar para proporcionar una realización del valor escalada con el machine learning. Innovar en las empresas con machine learning es revolucionario, y las revoluciones no son fáciles.
Muchos líderes de datos sénior llegan a aprender la misma lección, pero solo después de años de experiencia y proyectos fracasados. Luego, después de entenderlo por sí mismos, siguen teniendo dificultades para defender esos factores de éxito frente a sus homólogos empresariales. Sin un entendimiento común entre interesados empresariales y líderes de datos sobre cuáles son las mejores prácticas para proporcionar transformaciones de datos y análisis, muchos proyectos no logran despegar, tienen problemas para escalar o, en última instancia, no consiguen los resultados empresariales.
La industria necesita un marco de trabajo para aprovechar mejor el machine learning para lograr resultados empresariales. Este libro presenta bizML, que recoge las mejores prácticas de una manera sucinta y factible. No solo es una aportación oportuna y muy necesaria a la industria, sino que también es potente a la hora de lograr que la IA vuelva a tener los pies en la tierra, alejándose del bombo publicitario y haciendo que sea tangible para todos los lectores. Este libro es la guía del conductor para el machine learning; todos los profesionales empresariales y del análisis deberían leerlo.
—Morgan Vawter
Vicepresidenta global de Datos y análisis en Unilever, antigua directora de Análisis en Caterpillar, antigua directora de Práctica de gestión de datos en Accenture y elegida en la lista “40 under 40” de la revista Fortune
Breve historia de por qué los proyectos de machine learning se estancan
Cuando promociones un avance tecnológico, ten cuidado con lo que deseas. En tiempos oscuros, antes de que los datos fuesen guays y los teléfonos fuesen inteligentes, llegué, a través de contactos, a la oficina pija de un poderoso directivo. Con la esperanza de que me presentase a (o se convirtiese en) mi primer cliente, expliqué que estaba empezando a trabajar por mi cuenta como consultor de machine learning (ML). Él, que no estaba familiarizado con el ML ni tenía interés, me miró con cara de “no me hagas perder el tiempo” y enseguida estuve de vuelta en las calles de San Francisco.
Esto sucedió en 2003, justo después de que me mudase desde la Costa Este y hubiese encargado tarjetas de visita nuevas, todo ello para perseguir mi pasión. Me había enamorado del ML docenas de años antes, primero en el laboratorio de investigación y, después, como profesor de la Universidad de Columbia impartiendo cursos de posgrado de ML e IA. Era el tipo de tecnología más apasionante, potente y aplicable. Al mudarme al oeste, prometí introducirlo en el mundo no académico. Quería ver el ML implementado.
En ese momento, había un rincón del mundo industrial que ya estaba utilizando el ML, pero lo llamaban de otra manera: minería de datos. Me parecía que el término era engañoso para las personas no familiarizadas con los datos, pero “machine learning” seguía haciendo que me echasen de las oficinas. Así que me aferré a una palabra nueva de moda que había empezado a ganar terreno: analítica predictiva. Una rosa con otro nombre.
Por desgracia, mi vocabulario mejorado no me consiguió clientes de inmediato. “Deberías conseguir un trabajo a jornada completa”, me dijo a la cara financieramente insegura sin miramientos un comerciante de analítica consolidado. En vez de eso, redoblé mis esfuerzos. Los tripliqué. Organicé seminarios de formación corporativa. Publiqué artículos. Establecí contactos como loco.
Al final, los clientes empezaron a llegar, pero solo los justos para mantenerme ocupado. La demanda me llegaba hasta la rodilla, pero necesitaba que me llegase hasta el ombligo. El mundo aún no lo entendía. Tenía que evangelizar con más ahínco. Adopté un enfoque con tres frentes:
1.Conferencia: Lancé Machine Learning Week (antes Predictive Analytics World), la primera serie de conferencias sobre ML fuera del ámbito académico o de las ventas. Respaldada por su publicación hermana, el Machine Learning Times, la serie de conferencias ha crecido hasta alcanzar los 18.000 asistentes a nivel internacional.
2.Libro: A continuación, escribí Analítica predictiva, el primer libro popular que mostraba a lectores de todos los niveles cómo funcionan los algoritmos entre bastidores. Escrito para atraer el interés y el entusiasmo, acabó convirtiéndose en un best seller, obtuvo varios premios, hizo que me llamasen para dar 100 charlas inaugurales en conferencias que no eran las mías y se adoptó como material para cursos en cientos de universidades.
3.Vídeo musical: Lancé incluso un vídeo musical de rap educativo llamado Predict This!, que se hizo un poco viral (puedes verlo en www.PredictThis.org). Sin duda, esto demuestra que haría, literalmente, cualquier cosa por difundir el evangelio del ML.
Al margen de si estos esfuerzos contribuyeron o no a encender la mecha, una cosa es segura: la popularidad del ML explotó. Pasó de ser una industria emergente a ser un movimiento comercial en toda regla. Se hizo mayor de edad como una práctica empresarial necesaria para mantener la ventaja competitiva. Las hipérboles reinaron cuando científico de datos destronó a bombero como “el trabajo más sexy”.
Ver al ML volverse tan popular resultaba tanto gratificante como surrealista. La experiencia reforzaba una lección ancestral: mantén la fe. Cuando crees en una buena idea (como la noción de que aprender a partir de los datos no solo es guay, sino también valioso) y te mantienes firme en tus convicciones, al final la gente te dará la razón.
Por desgracia, el gran auge del ML también me ha enseñado otra lección: ten cuidado con lo que deseas. El alboroto ha llegado demasiado lejos. En cierto modo, ahora el ML es demasiado popular para su propio bien. El problema es que la arremetida del entusiasmo ha alimentado una idea equivocada común que hace descarrilar muchos proyectos de ML:
La falacia del ML: Puesto que los algoritmos de ML funcionan (asombroso y cierto), los modelos que generan son intrínsecamente valiosos (no es cierto).
El valor del ML solo llega cuando se lanza para realizar un cambio organizativo. Después de generar un modelo con ML, capturas su valor potencial solo cuando lo implementas de manera que mejore de forma activa las operaciones. Hasta que un modelo no se usa para remodelar activamente el modo en que funciona una organización, es inútil (literalmente). Un modelo no resuelve ningún problema empresarial por sí mismo y no va a implementarse por sí solo. El ML puede ser la tecnología disruptiva de la que se habla, pero solo si se utiliza para la disrupción.
La mayoría de proyectos de ML no logran implementarse. Creo que esto se debe, sobre todo, a que la mayoría de los líderes del ML no se molestan en planificar de forma adecuada el cambio operativo que sería el fruto de la implementación. Esa planificación conlleva más sermones, socialización, colaboración interdisciplinar y estilo en la gestión del cambio de lo que muchos, incluido yo, nos dábamos cuenta al principio.
Con demasiada frecuencia, los científicos de datos ofrecen un modelo viable, pero el equipo operativo no está listo para recibir el pase y se le cae la pelota. Hay excepciones maravillosas y éxitos brillantes, pero el historial bastante pobre en general que vemos hoy en día nos advierte de un desencanto amplio con el ML, e incluso un temido invierno para la IA. Es hora de pisar el freno y corregir la trayectoria para que el ML pueda cumplir su promesa.
Así pues, he pasado de ser un animador del ML a un estricto receloso (aunque optimista) con una nueva misión: estandarizar y transmitir la disciplina empresarial tan particular necesaria para lanzar el ML con éxito. Mientras que mi primer libro trataba acerca de cómo funciona el ML desde el punto de vista técnico, este libro habla sobre cómo llevar a cabo proyectos de ML de manera que los modelos no solo funcionen en el laboratorio, sino que también se implementen con éxito.
Lo primero es lo primero: los profesionales de los negocios, que son parte del público principal de este libro, necesitan cierta instrucción. Antes de que los que están al mando puedan dar luz verde con confianza a la implementación de un modelo, deben conseguir un entendimiento concreto de cómo funciona un proyecto de ML de principio a fin: ¿qué predecirá el modelo? ¿Cómo afectarán esas predicciones exactamente a las operaciones? ¿Qué métrica hace un seguimiento significativo de lo bien que predice? ¿Qué tipo de datos se necesitan?
Cuando los líderes empresariales (incluyendo a ejecutivos, directores y responsables de la toma de decisiones) se pongan al día sobre este conocimiento semitécnico pero claro, podremos salvar la brecha entre la parte tecnológica y la empresarial y hacer que la implementación de los modelos sea una posibilidad real.
Estos días, todo lo que hago es unir esos dos mundos: la tecnología y los negocios. Además de este libro, he adoptado otro enfoque con tres frentes:
1.Conferencias centradas en la implementación: Nuevas filiales de mi serie de eventos, Machine Learning Week, que amplían los aspectos básicos de la analítica para abarcar también la implementación específica de la industria, incluyendo aplicaciones en el marketing, los servicios financieros, la industria 4.0, la asistencia sanitaria y la tecnología climática. La primera vía está dedicada a la parte empresarial; la llamamos vía de la operacionalización y el liderazgo.
2.Profesorado en la escuela de negocios: Después de una interrupción de 22 años, volví al mundo académico para perfeccionar la metodología descrita en este libro, trabajando durante un año como profesor Bodily de Analítica en la escuela de negocios Darden de la Universidad de Virginia. El cambio de departamento, del de informática hace unos años al de negocios más recientemente, refleja el cambio en mi centro de interés: para que el ML tenga éxito, necesitamos un punto de observación en la parte empresarial.
3.Una formación más amplia: Por último, he lanzado un curso online, “Machine Learning Leadership and Practice: End-to-End Mastery”, para expandir el enfoque estrecho casi universal de cursos de ML actuales, que suelen pasar directamente a los cálculos saltándose la extensa planificación empresarial que debería hacerse primero.
Si no tienes tiempo para hacer un curso de tres meses, puedes leer este libro. Abarca el enfoque disciplinado requerido para implementar iniciativas de ML, formulado en una guía en seis pasos a la que llamo bizML. Por el camino, ayuda a que lectores de todos los niveles se pongan al día con el conocimiento semitécnico que necesitan.
Si tenemos en cuenta la cantidad incontable de dólares y recursos que se invierten en el ML, ¿cuánto valor potencial más podríamos capturar si adoptamos un procedimiento universal que facilite la colaboración y la planificación necesarias para llegar a la implementación?
Vamos a averiguarlo.
De qué trata este libro y para quién es
Puedes saltarte estas preguntas frecuentes opcionales, pero te recomiendo que eches un vistazo a la lista para ver si hay alguna pertinente para ti o que te interese. Los lectores de este libro provienen de entornos diferentes y tienen distintas ideas preconcebidas acerca del problema que el libro aspira a resolver: conseguir implementar el machine learning. Estas preguntas frecuentes te orientarán y aclararán por qué deberías leer este libro y ajustar tus expectativas.
Este libro presenta una guía estratégica y táctica para lanzar el machine learning, una disciplina en seis pasos para realizar un proyecto de ML de forma que se implemente con éxito. Llamo a esta práctica bizML.
Por el camino, el libro también ofrece la información contextual semitécnica que necesitan todos los participantes en el proyecto de una forma clara y accesible que cualquiera puede entender. Debido a esa cobertura, el libro también sirve como introducción no técnica a este campo para los recién llegados.
Aquí está el problema. El ML es la tecnología de aplicación general más potente del mundo, pero solo puede mejorar las operaciones a gran escala cambiándolas. Por esa razón, un proyecto de ML no debería verse como “un proyecto de tecnología”, sino que, para tener impacto, debe replantearse como un proyecto empresarial pensado para mejorar el rendimiento operativo, donde el ML es solo un componente, uno que es necesario, pero no es suficiente.
Al centrar la atención de forma abrumadora en la parte técnica y su ejecución, la industria no ha logrado establecer una práctica empresarial adoptada a nivel general para llevar a cabo la otra mitad de un proyecto de ML con éxito. Como resultado, las nuevas iniciativas de ML fracasan de modo habitual en su implementación.
En absoluto. Munchos proyectos de ML tienen éxito, aunque sea solo una minoría; incluso una fracción de los múltiples proyectos de este campo tan popular sigue siendo mucho. Además, en determinadas circunstancias, un proyecto de ML está destinado a triunfar, como en los proyectos de alta prioridad de una empresa de los gigantes tecnológicos o proyectos pensados para actualizar un modelo existente que ya se ha implementado. El mundo industrial sigue siendo optimista respecto al ML porque su gran potencial permanece intacto.
No. Cuando un proyecto de ML sigue bizML, la práctica organizativa presentada en este libro, todas las personas implicadas en el proyecto participan en esa práctica de algún modo. El equipo solo puede colaborar de la manera más efectiva si todos están familiarizados con esta práctica de principio a fin y con el conocimiento semitécnico que la rige.
Este libro es para cualquiera que desee obtener valor con el ML mediante la participación en su implementación empresarial, al margen de si desempeña su papel en el lado empresarial o en el técnico.
Ante todo, escribí este libro para los profesionales de los negocios, las personas que ejecutan el proyecto de ML, tienen interés en él, toman decisiones sobre él o gestionan las operaciones que cambiarán (y mejorarán) con él. Esto incluye a ejecutivos, directores, jefes, consultores y líderes de todo tipo. Pero este libro también es para los expertos en tecnología. Si eres científico de datos, ingeniero de ML o cualquier clase de profesional técnico relacionado con el ML, este libro te invita a alejarte un poco de la ejecución práctica y obtener una nueva perspectiva del paradigma holístico al cual vas a contribuir.
Este libro es una guía práctica empresarial, pero no una técnica. A diferencia de la mayoría de los libros sobre ML, aborda la práctica empresarial en vez de la práctica técnica. Presenta una práctica empresarial en seis pasos, bizML, para ejecutar un proyecto de ML.
Este libro no ahonda lo bastante para servir a los profesionales de los datos como guía práctica. Para eso está la gran mayoría del resto de los libros sobre ML. Los métodos de ML que cubren son solo un ingrediente. Constituyen un componente técnico clave del proyecto, pero ese componente solo supone uno de los seis pasos del proyecto explicados en este libro. Por consiguiente, solo un capítulo de este libro, el capítulo 5, incide en los principales métodos de ML; ofrece un “curso acelerado” accesible.
Este libro también se diferencia de la mayoría de los libros de negocios sobre ML, que presentan una visión general estratégica de la industria. Esos libros suelen abordar el tema desde un nivel superior, sin proporcionar una orientación práctica y sin detallar de manera concreta cómo se integra el ML para ofrecer mejoras operativas.
No se necesita ninguno. Este libro es accesible para todos los lectores y sirve como introducción completa a nivel conceptual al campo del ML para recién llegados. Mientras describe los pasos de principio a fin para ejecutar un proyecto de ML, abarca los conceptos básicos por el camino. Desde luego, obtener cierto conocimiento conceptual sobre métodos de ML antes de leer este libro no te perjudicaría, pero, teniendo en cuenta el tema de este libro (la perspectiva empresarial de un proyecto de ML debería preceder a la perspectiva técnica), puedes leer este libro primero y determinar después cuánto quieres ahondar en la tecnología central.
Establecer el objetivo de la implementación es solo el primer paso, literalmente. Es el primer paso de la práctica bizML de seis pasos que se recoge en este libro. El resto sirve para cumplir ese objetivo. Perseguirlo exige un procedimiento profundo de principio a fin. El mantra útil “empezar por el objetivo empresarial” por sí solo no supera los desafíos de la implementación. Hace falta un libro.
“La adquisición de nuevas habilidades y el aprendizaje continuos y rápidos... empiezan por arriba. La IA requiere un nuevo tipo de directivos principales, con un entendimiento profundo de la IA y sus implicaciones...”.
—Julie Sweet, presidenta y directora ejecutiva de Accenture
Sí, debes obtener un tipo concreto de alfabetización de datos para poder participar en la implementación del ML, ayudando a dirigir cada proyecto y asegurándote de que funciona dentro de las operaciones empresariales (y de que produce valor para ellas).
Puede que no te convenza. Al fin y al cabo, para conducir un coche no te hace falta saber cómo funciona el motor. Eso es cierto, pero necesitas experiencia: la sensación precisa de cómo se mueve el coche, cierto sentido de la física, incluyendo el impulso del vehículo y la fricción de los neumáticos. Como conductor, también has internalizado las normas de tráfico y sabes qué movimientos esperar de otros conductores y lo que ellos esperan de ti.
Conducir un proyecto de ML es lo mismo. Para alcanzar el objetivo de mejorar el rendimiento operativo, necesitas saber qué, por qué y cuánto. Necesitas entender el modo preciso en que esta tecnología aplicará cambios a los procesos empresariales, la base de esos cambios y una valoración cuantitativa de lo bien que está funcionando.
No te preocupes; no te hace falta tener un título en la parte “científica” y lo que necesitas aprender es fácil de entender. Es conceptual, no práctico, y no requiere muchas matemáticas. Este libro ahonda en los principios ágiles de la combustión externa, no en cómo cambiar una bujía. Este nivel de alfabetización de datos es útil para casi todo el mundo, como la formación de los conductores, no la escuela de mecánica.
Este libro establece un marco de trabajo estratégico muy necesario al proporcionar una guía complementaria para el lado de los negocios que todos los profesionales de los datos necesitan dominar. El verdadero “unicornio de la ciencia de datos” no es la persona que conoce todas las tecnologías y técnicas analíticas, sino la que ha ampliado el conjunto de sus habilidades para participar también en un esfuerzo orientado al negocio que implica a toda la empresa para conseguir que sus modelos se implementen. Después de todo, las habilidades blandas son a menudo las duras.
Al hacerlo así, este libro abarca pasos técnicos específicos que suelen omitirse en los cursos y libros pensados para profesionales de los datos, incluyendo cómo establecer por completo la variable dependiente (denominada “variable de salida” en este libro), cómo preparar los datos y cómo establecer la métrica de rendimiento (incluyendo por qué la exactitud y una métrica técnica popular llamada AUC suelen ser la opción equivocada), de manera que todas estas opciones estén en línea con los objetivos empresariales y las consideraciones operativas.
Por otra parte, debes saber que este libro tan accesible no es el material técnico al que es probable que estés acostumbrado. Para algunos profesionales de los datos experimentados, el mejor uso de este libro puede ser ojearlo por encima (pero leyendo con más detenimiento el capítulo 0 sobre la necesidad de una práctica especializada centrada en la parte empresarial y el capítulo 3 sobre las métricas de evaluación) y, después, pasárselo a tu jefe o a un compañero clave.
La palabra de moda “IA” puede significar muchas cosas, pero este libro habla sobre el ML, que es una base central de la IA (y a lo que muchos se refieren cuando hablan de ella). Este libro no cubre otras áreas a las que también se llama a veces IA, incluyendo la inteligencia artificial general (sistemas hipotéticos que serían capaces de realizar cualquier tarea intelectual que los humanos puedan hacer), el procesamiento del lenguaje natural, los sistemas basados en reglas y la visión por ordenador.
Sí. La IA generativa asombra al mundo al escribir texto y producir imágenes, pero, a la hora de mejorar la eficiencia operativa, el ML clásico (también conocido como IA predictiva) domina desde hace mucho. Sin embargo, la IA generativa también es adecuada y podría superar al ML clásico en algunos ámbitos. La práctica bizML que se presenta en este libro también sirve para la IA generativa, para proyectos que aplican la IA generativa para mejorar de forma medible grandes cantidades de decisiones operativas. Para cualquiera de los dos tipos de tecnología, bizML puede ayudarte a llevar el proyecto a una implementación exitosa.
Sí. Aunque el deep learning es más complejo a nivel técnico que muchos métodos de ML clásico y tiende a aplicarse para diferentes clases de problemas (más en el procesamiento de imágenes, por ejemplo, y menos para predicciones sobre clientes), la disciplina para proyectos de ML presentada en este libro se aplica y es igual de necesaria. Los desafíos organizativos de la implementación son en gran parte los mismos, al margen de cómo funcione por dentro el modelo que está implementándose.
Sí; la analítica predictiva es un subconjunto importante del ML. Es la aplicación de métodos de ML a determinados problemas empresariales. Como alternativa, en muchos contextos, la analítica predictiva es solo un sinónimo de machine learning.
Este libro y mi anterior libro (Analítica predictiva. Predecir el futuro utilizando Big Data) son complementarios, pero independientes. No hace falta leer uno para entender el otro, así que puedes leer solo uno o los dos, en cualquier orden. Ambos hacen que el ML sea accesible para profesionales de los negocios, los recién llegados y otros profesionales no relacionados con los datos, pero tienen propósitos diferentes: Analítica predictiva habla sobre cómo funciona el ML y este libro habla sobre cómo sacarle partido.
Guía práctica de la IA(este libro)
Analítica predictiva(mi libro anterior)
Una guía práctica empresarial
Sí
–
Implementación del ML
Sí
La idea general
Métricas de rendimiento
Sí
La idea general
Preparación de datos
Sí
–
Métodos de modelado técnico
Visión general de un capítulo
Árboles de decisión, ensambles, modelos uplift; un capítulo cada uno
Trampas técnicas
Informar mal sobre el rendimiento
Dragado de datos, sobreajuste, presumir que la correlación implica causalidad
Ética del ML
Visión general breve pero amplia
Un capítulo sobre cómo el ML revela información sensible y vigilancia policial predictiva
Casos prácticos
UPS, FICO, dos puntocoms
HP, Chase, Agencia de Seguridad Nacional, 183 minicasos prácticos
Este libro atañe a todo el software de ML. Es neutral respecto a los comerciantes y no está vinculado a ninguna herramienta específica. Los contenidos se aplican a nivel universal, sin importar cuáles de las muchas herramientas de software de ML acabéis utilizando tú o tus profesionales de los datos.
Este libro solo cubre el machine learning supervisado, que entrena modelos con datos supervisados, es decir, datos que constan de ejemplos para los cuales la predicción objetivo ya se conoce, bien debido a la acumulación de resultados históricos, bien mediante el etiquetado manual de los datos (en concreto, el libro se centra sobre todo en la clasificación binaria, es decir, ML para predecir resultados de sí/no). El ML supervisado es el tipo de ML que se aplica más comúnmente para optimizar las operaciones empresariales. Sin embargo, la práctica bizML presentada en este libro también es apta en gran medida para proyectos de aprendizaje no supervisado.
El método presentado por este libro, bizML, es una práctica empresarial para ejecutar proyectos de ML con éxito a través de la implementación, mientras que MLOps es un conjunto de métodos y prácticas técnicos para gestionar y mantener modelos. Aunque ambos están relacionados con la operacionalización de los modelos, MLOps aborda la ejecución técnica de proyectos de ML y bizML aborda la ejecución organizativa, incluyendo la dirección del proyecto y la colaboración interfuncional. Los dos trabajan juntos: un proyecto que siga bizML puede emplear MLOps. Pero ninguna solución técnica puede, por sí sola, ocuparse de los retos relativos a la parte empresarial a los que se enfrentan los proyectos de ML. Para eso hace falta un paradigma empresarial como bizML.
La introducción de bizML en este libro representa un esfuerzo renovado por establecer una guía actualizada estándar para la industria para llevar a cabo con éxito proyectos de ML que sea pertinente y convincente tanto para los profesionales de los negocios como los de los datos. CRISP-DM, un estándar anterior establecido hace casi treinta años, allanó el camino al exponer muchos de los conceptos fundamentales, pero nunca ganó mucha popularidad entre los profesionales empresariales. Para ver más detalles, consulta el capítulo 0.
Las notas de este libro (referencias y recursos adicionales para profundizar en el aprendizaje) están disponibles, en inglés, en www.bizML.com. Para acceder a un glosario tutorial en inglés que incluye los términos introducidos en este libro y más, consulta www.MachineLearningGlossary.com.
Nunca vendas IA. En su lugar, presenta mejoras operativas, y menciona el machine learning solo por encima como parte de la solución.
La mayoría de los líderes del ML se centran más en la tecnología que en su implementación, así que la mayoría de las nuevas iniciativas de ML fallan.
No te equivoques; los cambios operativos son difíciles de vender, sobre todo en comparación con una tecnología de moda, que se vende con tan poco esfuerzo que la llamamos “sexy”. Es menos glamuroso proponer una renovación de los procesos. La gente responde como si estuvieses sugiriendo una endodoncia. Pero así es la vida; las grandes ganancias solo llegan si se imponen grandes cambios.
Vamos a empezar por la historia de un ambicioso pionero decidido a llegar alto con el ML en una empresa de la lista Fortune 500 de un siglo de antigüedad. ¿Su campo? La logística. Pero no pierdas detalle y verás por qué los proyectos de ML aburridos en realidad son, irónicamente, los más sexys. También verás cómo la paradoja de la innovación puede superarse y por qué es algo bueno que, al final, la mayoría de los proyectos de ML prácticos estén destinados a desprenderse de la marca “IA”.
Intentaron advertirle. Mientras Jack Levis perseguía un deseo arraigado de innovar, sus colegas pensaban que estaba cometiendo un suicidio profesional. “Me encanta tu pasión”, le dijo un compañero, “pero debes saberlo: todo el mundo cree que estás loco”.
Jack no estaba intentando cambiar el mundo. Solo estaba ocupándose de la pequeña cuestión de optimizar cómo entregaba los paquetes el United Parcel Service (UPS); 16 millones de paquetes al día. No estaba satisfecho con el statu quo. Había casi 300 millones de kilómetros de conducción anual que podían reducirse.
Jack había abordado esa idea loca de forma voluntaria. Nadie de arriba le había encargado el proyecto, ni era parte de sus responsabilidades en UPS, sino que él mismo había creado de manera proactiva un pequeño equipo para desarrollar un prototipo de prueba de concepto. Como grupo, se dedicaban a ello a tiempo parcial, no de forma prioritaria.
