Los secretos de los datos pequeños: cómo el aprendizaje automático finalmente llegó a la empresa


Durante la última década, “big data” se ha convertido en la palabra de moda más importante de Silicon Valley. Cuando están capacitados en conjuntos de datos increíblemente grandes, los modelos de aprendizaje automático (ML) pueden desarrollar una comprensión profunda de un dominio determinado, lo que lleva a avances para las principales empresas de tecnología. Google, por ejemplo, afina sus algoritmos de clasificación al rastrear y analizar más de un billón de consultas de búsqueda cada año. Resulta que el poder salomónico para responder a todas las preguntas de todos los interesados ​​puede ser brutalmente forzado con suficientes datos.

Pero hay una trampa: la mayoría de las empresas se limitan a datos “pequeños”; en muchos casos, solo poseen unas pocas docenas de ejemplos de los procesos que desean automatizar mediante ML. Si está tratando de crear un sistema de aprendizaje automático sólido para clientes empresariales, debe desarrollar nuevas técnicas para superar esa escasez de datos.

Dos técnicas en particular: transferencia de aprendizaje y aprendizaje colectivo – han demostrado ser fundamentales para transformar los datos pequeños en grandes datos, lo que permite a las empresas de tamaño medio beneficiarse de los casos de uso de ML que antes estaban reservados solo para las grandes tecnologías. Y porque solo 15% de empresas Ya han implementado AI o ML, existe una gran oportunidad para que estas técnicas transformen el mundo empresarial.

ML de datos pequeños

Arriba: Con los datos de una sola empresa, incluso los modelos modernos de aprendizaje automático tienen solo un 30% de precisión. Pero gracias al aprendizaje colectivo y al aprendizaje por transferencia, Moveworks puede determinar la intención de las solicitudes de soporte de TI de los empleados con más del 90% de precisión.

Crédito de la imagen: Moveworks

Del bricolaje al código abierto

Por supuesto, los datos no son el único requisito previo para un modelo de aprendizaje automático de clase mundial; también existe la pequeña cuestión de construir ese modelo en primer lugar. Dado que escasez de ingenieros de aprendizaje automático, contratar un equipo de expertos para diseñar un sistema de aprendizaje automático desde cero simplemente no es una opción para la mayoría de las organizaciones. Esta disparidad ayuda a explicar por qué una empresa de tecnología con buenos recursos como Google se beneficia de manera desproporcionada del ML.

Pero en los últimos años, varios modelos de aprendizaje automático de código abierto, incluido el famoso Modelo BERT para comprender el lenguaje, que Google lanzó en 2018, han comenzado a cambiar el juego. La complejidad de crear un modelo del calibre de BERT, cuya versión “grande”, acertadamente denominada, tiene alrededor de 340 millones de parámetros, significa que pocas organizaciones pueden siquiera considerar la posibilidad de ser mariscales de campo como una iniciativa. Sin embargo, debido a que es de código abierto, las empresas ahora pueden modificar ese manual de estrategias disponible públicamente para abordar sus casos de uso específicos.

Para comprender cómo podrían ser estos casos de uso, considere una empresa como Medallia, un cliente de Moveworks. Por sí solo, Medallia no posee suficientes datos para construir y entrenar un sistema ML eficaz para un caso de uso interno, como el soporte de TI. Sin embargo, sus pequeños datos contienen un tesoro de conocimientos que esperan que ML los desbloquee. Y al aprovechar las nuevas técnicas para obtener estos conocimientos, Medallia se ha vuelto más eficiente, al reconocer qué flujos de trabajo internos necesitan atención comprender el idioma específico de la empresa sus empleados usan cuando solicitan soporte técnico.

Progreso masivo con datos pequeños

Entonces, aquí está la pregunta del billón de dólares: ¿Cómo se toma un modelo de aprendizaje automático de código abierto diseñado para resolver un problema particular y se aplica ese modelo a un problema dispar en la empresa? La respuesta comienza con transferencia de aprendizaje, que, como era de esperar, implica transferir el conocimiento adquirido de un dominio a un dominio diferente que tiene menos datos.

Por ejemplo, al tomar un modelo de aprendizaje automático de código abierto como BERT, diseñado para comprender el lenguaje genérico, y refinarlo en los márgenes, ahora el aprendizaje automático puede comprender el lenguaje único que usan los empleados para describir los problemas de TI. Y el lenguaje es solo el comienzo, ya que apenas comenzamos a darnos cuenta del enorme potencial de los datos pequeños.

transferencia de aprendizaje

Arriba: La transferencia de aprendizaje aprovecha el conocimiento de un dominio relacionado, generalmente uno con un mayor suministro de datos de entrenamiento, para aumentar los pequeños datos de un caso de uso de ML determinado.

Crédito de la imagen: Moveworks

De manera más general, esta práctica de alimentar un modelo de AA con una selección muy pequeña y muy específica de datos de entrenamiento se denomina “aprendizaje de pocas oportunidades, ”Un término que se ha convertido rápidamente en una de las nuevas palabras de moda en la comunidad de AA. Algunos de los modelos ML más potentes jamás creados, como el modelo histórico GPT-3 y su 175 mil millones de parámetros, que es órdenes de magnitud más que BERT, han demostrado una habilidad sin precedentes para aprender nuevas tareas con solo un puñado de ejemplos como capacitación.

Tomando esencialmente todo Internet como su “dominio tangencial”, GPT-3 rápidamente se vuelve competente en estas nuevas tareas al construir sobre una base poderosa de conocimiento, de la misma manera que Albert Einstein no necesitaría mucha práctica para convertirse en un maestro en las damas. Y aunque GPT-3 no es de código abierto, la aplicación de técnicas similares de aprendizaje de pocas oportunidades permitirá nuevos casos de uso de ML en la empresa, aquellos para los que los datos de capacitación son casi inexistentes.

El poder del colectivo

Con el aprendizaje por transferencia y el aprendizaje en pocas oportunidades además de los potentes modelos de código abierto, las empresas normales pueden finalmente comprar entradas para el campo del aprendizaje automático. Pero mientras que entrenar ML con aprendizaje de transferencia requiere varios órdenes de magnitud menos de datos, lograr un rendimiento sólido requiere ir un paso más allá.

Ese paso es aprendizaje colectivo, que entra en juego cuando muchas empresas individuales quieren automatizar el mismo caso de uso. Mientras que cada empresa está limitada a datos pequeños, las soluciones de inteligencia artificial de terceros pueden utilizar el aprendizaje colectivo para consolidar esos pequeños conjuntos de datos, creando un corpus lo suficientemente grande para un aprendizaje automático sofisticado. En el caso de la comprensión del lenguaje, esto significa abstraer oraciones que son específicas de una empresa para descubrir estructuras subyacentes:

aprendizaje colectivo

Arriba: El aprendizaje colectivo implica abstraer datos, en este caso, oraciones, con ML para descubrir patrones y estructuras universales.

Crédito de la imagen: Moveworks

La combinación de aprendizaje por transferencia y aprendizaje colectivo, entre otras técnicas, está redibujando rápidamente los límites del aprendizaje automático empresarial. Por ejemplo, agrupar los datos de varios clientes puede mejorar significativamente la precisión de los modelos diseñados para comprender la forma en que se comunican sus empleados. Mucho más allá de la comprensión del lenguaje, por supuesto, estamos presenciando el surgimiento de un nuevo tipo de lugar de trabajo, uno impulsado por el aprendizaje automático en datos pequeños.

Latest articles

Thailand stock exchange to open digital asset trading… without crypto?

La Bolsa de Valores de Tailandia, o SET, planea lanzar una plataforma de comercio de activos digitales en la segunda mitad de 2021,...

Resultados de la prueba COVID-19 del 19 de enero

por Riesgo calculado en 19/1/2021 06:44:00 p.m. Nota: Bloomberg tiene excelentes datos sobre vacunas. "Estados Unidos ha administrado 15,6 millones de dosis"Los datos...

McAllister del PPE dice que la UE debería ‘reevaluar’ las relaciones con Rusia después del arresto de Navalny

Al dirigirse a los eurodiputados el martes, el jefe de la Comisión de Asuntos Exteriores del Parlamento Europeo, David McAllister, dijo que la...
31.5k Followers
Follow

Related articles

Leave a reply

Please enter your comment!
Please enter your name here

Translate »