: Informática; 23 Noviembre 2021

Tutel de Microsoft : mejora el entrenamiento del modelo de IA

Microsoft anunció esta semana Tutel , una biblioteca para respaldar el desarrollo de modelos mixtos de expertos (MoE) , un tipo particular de modelo de IA a gran escala

Tutel, que es de código abierto y se ha integrado en fairseq, uno de los kits de herramientas de Facebook en PyTorch, está diseñado para permitir a los desarrolladores de todas las disciplinas de IA "ejecutar MoE de manera más fácil y eficiente", explicó una declaración de Microsoft.

Los MoE están formados por pequeños grupos de "neuronas" que solo están activas en circunstancias especiales y específicas. Las “capas” inferiores del modelo de MoE extraen las características y se solicita a los expertos que evalúen esas características. Por ejemplo, los MoE se pueden utilizar para crear un sistema de traducción, con cada grupo de expertos aprendiendo a manejar una parte separada del discurso o una regla gramatical especial.

En comparación con otras arquitecturas de modelos, los MoE tienen distintas ventajas. Pueden responder a las circunstancias con especialización, lo que permite que el modelo muestre una mayor variedad de comportamientos. Los expertos pueden recibir una combinación de datos y, cuando el modelo está en funcionamiento, solo unos pocos expertos están activos; incluso un modelo enorme necesita solo una pequeña cantidad de potencia de procesamiento.

De hecho, MoE es uno de los pocos enfoques demostrados para escalar a más de un billón de parámetros, allanando el camino para modelos capaces de impulsar la visión por computadora, el reconocimiento de voz, el procesamiento del lenguaje natural y los sistemas de traducción automática, entre otros. En el aprendizaje automático, los parámetros son la parte del modelo que se aprende a partir de los datos de entrenamiento históricos. En términos generales, especialmente en el dominio del lenguaje, la correlación entre el número de parámetros y la sofisticación se ha mantenido bien.

Tutel se centra principalmente en las optimizaciones de la computación específica de MoE. En particular, la biblioteca está optimizada para las nuevas instancias de la serie Azure NDm A100 v4 de Microsoft, que proporcionan una escala móvil de GPU Nvidia A100. Tutel tiene una interfaz "concisa" destinada a facilitar la integración en otras soluciones de MoE, dice Microsoft. Alternativamente, los desarrolladores pueden usar la interfaz de Tutel para incorporar capas independientes de MoE en sus propios modelos DNN desde cero.

“Debido a la falta de implementaciones eficientes, los modelos basados en MoE se basan en una combinación ingenua de múltiples operadores estándar proporcionados por marcos de aprendizaje profundo como PyTorch y TensorFlow para componer el cálculo del MoE. Esta práctica genera importantes gastos generales de rendimiento gracias a la computación redundante ”, escribió Microsoft en una publicación de blog. (Los operadores proporcionan un modelo con un conjunto de datos conocido que incluye las entradas y salidas deseadas). "Tutel diseña e implementa múltiples núcleos de GPU altamente optimizados para proporcionar operadores para el cálculo específico de MoE".

Tutel está disponible en código abierto en GitHub. Microsoft dice que el equipo de desarrollo de Tutel “integrará activamente” varios algoritmos emergentes de MoE de la comunidad en versiones futuras.

“MoE es una tecnología prometedora. Permite un entrenamiento holístico basado en técnicas de muchas áreas, como el enrutamiento sistemático y el equilibrio de la red con nodos masivos, e incluso puede beneficiarse de la aceleración basada en GPU. Demostramos una implementación eficiente de MoE, Tutel, que resultó en una ganancia significativa sobre el marco de fairseq. Tutel también se ha integrado [con nuestro] marco DeepSpeed , y creemos que Tutel y las integraciones relacionadas beneficiarán a los servicios de Azure, especialmente para aquellos que desean escalar sus grandes modelos de manera eficiente ”, agregó Microsoft.

[Fuente]: venturebeat.com

Rezaie, M.( 23 de Noviembre de 2021).A homeless in front of the Microsoft Vancouver.. [Fotografía]. Modificado por Carlos Zambrado Recuperado de unsplash.com

Anónimo.( 23 de Noviembre de 2021).Arriba: Para una sola capa de MoE, Tutel logra una aceleración de 8.49 veces en un nodo NDm A100 v4 con 8 GPU y una aceleración de 2.75 veces en nodos de 64 NDm A100 v4 con 512 GPU A100, afirma Microsoft. [Fotografía]. Modificado por Carlos Zambrado Recuperado de venturebeat.com

23 Noviembre 2021

Visto: 1955

Recomendamos

Curso Mascotas Sanas

Hoy 50% de Descuento

Últimas Noticias

El Cuidado del Adulto Mayor: Claves para una Vida Digna y Saludable 25 Marzo 2025

Los Primeros Dispositivos Móviles: El Inicio de una Revolución Tecnológica 25 Marzo 2025

El Consumo de Agua para la Salud: Clave para un Bienestar Integral 25 Marzo 2025

El Primer Reloj del Mundo: Un Viaje a los Orígenes de la Medición del Tiempo 25 Marzo 2025

La Maldición del Dibujante: El Túnel Carpiano y su Impacto en la Creatividad 25 Marzo 2025

Efeméride del 25 de marzo: Día Internacional de Recuerdo de las Víctimas de la Esclavitud y la Trata Transatlántica de Esclavos 24 Marzo 2025

Bienestar Familiar: La Clave para una Vida Equilibrada y Armoniosa en el Hogar 24 Marzo 2025

Ilusiones Ópticas: El Fascinante Mundo de la Percepción Visual y sus Misterios 24 Marzo 2025

Semiótica: La Ciencia del Significado y la Comunicación Humana 24 Marzo 2025

Juegos en Línea: Evolución, Cultura y el Fenómeno Global del Entretenimiento Digital 24 Marzo 2025

Noticias actuales

El Cuidado del Adulto Mayor: Claves para una Vida Digna y Saludable

CUIDADO DEL ADULTO 11zon

El cuidado del adulto mayor es un aspecto fundamental en la sociedad actual, enfocado en garantizar la calidad de vida, la salud y el bienestar emocional de las personas en su tercera edad. Este artículo aborda la importancia de un cuidado integral, que incluya atención médica especializada, apoyo emocional, estimulación cognitiva y la promoción de la autonomía. Se exploran estrategias, desafíos y recomendaciones para brindar un entorno seguro, respetuoso y lleno de dignidad para nuestros mayores, resaltando el papel esencial de la familia, profesionales de la salud y la comunidad en general.

Los Primeros Dispositivos Móviles: El Inicio de una Revolución Tecnológica

PRIMEROS CELULARES 11zon

El surgimiento de los primeros dispositivos móviles marcó el comienzo de una transformación radical en la forma en que nos comunicamos y accedemos a la información. Este artículo explora el origen y la evolución de los primeros teléfonos móviles, desde los dispositivos de gran tamaño y autonomía limitada hasta los innovadores modelos que pusieron las bases para la era digital. Se analizan los desafíos tecnológicos, el impacto social y las innovaciones que hicieron posible el desarrollo de la telefonía móvil, abriendo el camino a la conectividad global.

El Consumo de Agua para la Salud: Clave para un Bienestar Integral

AGUA 11zon

El agua es vital para la vida y desempeña un papel esencial en el mantenimiento de la salud y el bienestar integral. El consumo adecuado de agua influye en funciones corporales fundamentales, ayuda a regular la temperatura, facilita la digestión y elimina toxinas. Este artículo explora en profundidad la importancia del agua para la salud, los beneficios de mantener una hidratación óptima, las consecuencias de la deshidratación y recomendaciones prácticas para incorporar hábitos saludables relacionados con el consumo de agua en la vida diaria.

Tutel de Microsoft : mejora el entrenamiento del modelo de IA

Recomendamos

Últimas Noticias

Noticias actuales

El Cuidado del Adulto Mayor: Claves para una Vida Digna y Saludable

Los Primeros Dispositivos Móviles: El Inicio de una Revolución Tecnológica

El Consumo de Agua para la Salud: Clave para un Bienestar Integral

Search