Este año 2022, sin duda fue el año de la inteligencia artificial, cada vez más herramientas mejores tecnologías y es necesario realizar predicciones sobre su uso y desarrollo para el 2023.
GPT-4
Esta nueva tecnología de ChatBot, saldrá a la venta en los próximos meses, y sí, será un gran acontecimiento, se trata de la próxima generación del potente modelo de lenguaje generativo de OpenAI.
La mayoría de los principales modelos lingüísticos actuales se entrenaron con corpus de datos de unos 300.000 millones de tokens, como el GPT-3 de OpenAI (175.000 millones de parámetros), el Jurassic de AI21 Labs (178.000 millones de parámetros) y el Megatron-Turing de Microsoft/Nvidia (570.000 millones de parámetros).
Puede leer también | OpenAI entrenó con éxito un bot de Minecraft utilizando 70.000 horas de vídeos de juego
Predecimos que GPT-4 se entrenará con un conjunto de datos al menos un orden de magnitud mayor que éste, quizá hasta 10 billones de fichas. Mientras tanto, será más pequeño (es decir, con menos parámetros) que Megatron-Turing.
Entrenamiento a grandes modelos lingüísticos.
Se ha convertido en un tópico decir que los datos son el nuevo petróleo. Esta analogía es acertada en un aspecto poco apreciado: ambos recursos son finitos y corren el riesgo de agotarse. El ámbito de la IA en el que esta preocupación es más acuciante es el de los modelos lingüísticos.
Como hemos visto en la sección anterior, los esfuerzos de investigación como el trabajo Chinchilla de DeepMind han puesto de relieve que la forma más eficaz de construir modelos lingüísticos más potentes no es hacerlos más grandes, sino entrenarlos con más datos.
Puede leer también | La Inteligencia Artificial ya puede escribir código informático gracias a DeepMind
El modelo Chinchilla de DeepMind se entrenó con 1,4 billones de tokens.
En otras palabras, puede que estemos a un orden de magnitud de agotar todo el suministro mundial de datos útiles para el entrenamiento lingüístico. Esto podría suponer un impedimento importante para seguir avanzando en la IA lingüística. En privado, muchos de los principales investigadores y empresarios de IA están preocupados por esta situación.
Coches sin conductor como medio de transporte cotidiano.
Tras años de exageraciones prematuras y promesas incumplidas en el campo de los vehículos autónomos, recientemente ha ocurrido algo de lo que sorprendentemente poca gente parece haberse dado cuenta: han llegado los coches verdaderamente sin conductor.
Puede leer también | DeepMind de Google : ha anunciado sobre el caso de inteligencia artificial de 'nivel humano'
Hoy, los ciudadanos pueden descargarse la aplicación Cruise (parecida a las aplicaciones Uber o Lyft) y llamar a un vehículo sin conductor -sin nadie al volante- para que les lleve del punto A al punto B en las calles de San Francisco.
Actualmente, Cruise sólo ofrece estos viajes sin conductor por la noche (entre las 22.00 y las 5.30), pero la empresa está a punto de ofrecer el servicio las 24 horas del día en todo San Francisco. Se espera que esto ocurra en cuestión de semanas. Waymo, el rival de Cruise, le sigue de cerca.
Midjourney
Las tres plataformas de IA de texto a imagen más destacadas en la actualidad son DALL-E de OpenAI, Stable Diffusion de Stability AI (y otros colaboradores) y Midjourney.
Puede leer también | El generador de imágenes en Inteligencia Artificial Discord bot predice la última selfie jamás tomada
OpenAI recaudó mil millones de dólares de Microsoft en 2019 y actualmente está en conversaciones para recaudar miles de millones más. Stability AI recaudó 100 millones de dólares hace unos meses y ya está buscando recaudar más.
Midjourney, por el contrario, ha desdeñado toda financiación externa. El uso y el crecimiento de la empresa han sido asombrosos: en el momento de escribir estas líneas, cuenta con casi 6 millones de usuarios y unos ingresos considerables. Sin embargo, según su sitio web, Midjourney sigue siendo una "pequeña organización autofinanciada" con sólo 11 miembros a tiempo completo.
Puede leer también | Microsoft presenta AI Artist Image Creator para el motor de búsqueda Bing y el navegador Edge
El fundador y consejero delegado de Midjourney, David Holz, fue anteriormente cofundador y director técnico de Leap Motion, una startup de realidad virtual de altos vuelos que recaudó cerca de 100 millones de dólares en financiación de riesgo durante la década de 2010 antes de estrellarse contra el suelo y ser adquirida en una venta forzosa. Las experiencias negativas de Holz con sus inversores de capital riesgo durante la saga de Leap Motion le habrían convencido de no aceptar capital externo esta vez. Todos los pretendientes que han intentado invertir en Midjourney han sido rechazados.
Desarrollar robots humanoides
Este tipo de robot permitirán atraer considerable atención, financiación y talento. Se pondrán en marcha varias iniciativas nuevas de robots humanoides.
Pues bien, los robots humanoides se están convirtiendo rápidamente en una realidad.
Puede leer también | La inteligencia artificial se muestra prometedora en la detección de trastornos de ansiedad y depresión
Tesla ha catalizado el campo de la robótica humanoide este año con el lanzamiento de su robot Optimus, que debutó en el Día de la Inteligencia Artificial de la empresa en septiembre. Elon Musk ha dicho que cree que el robot Optimus acabará valiendo más para Tesla que todo su negocio automovilístico. Al robot de Tesla aún le queda un largo camino por recorrer antes de estar listo para el prime time, pero no hay que subestimar el rápido progreso del que es capaz la empresa cuando dedica todos sus recursos a la tarea.
Asimismo, una serie de prometedoras empresas emergentes están haciendo avanzar el campo de la robótica humanoide, como Agility Robotics, Halodi Robotics, Sanctuary AI y Collaborative Robotics.
LLMOps la nueva versión de moda de MLOps
Cuando surge una nueva plataforma tecnológica importante, surge la necesidad -y la oportunidad- de crear herramientas e infraestructuras que la hagan posible. A los capitalistas de riesgo les gusta pensar en estas herramientas de apoyo como "picos y palas" (para la próxima fiebre del oro).
Puede leer también | Presentan superordenador optimizado para la inteligencia artificial puede realizar un quintillón de cálculos por segundo
En los últimos años, las herramientas de aprendizaje automático, también conocidas como MLOps, han sido una de las categorías más candentes del mundo de las startups. Una oleada de empresas emergentes de MLOps ha reunido grandes sumas de capital a valoraciones exorbitantes: Weights & Biases (200 millones de dólares con una valoración de 1.000 millones), Tecton (160 millones), Snorkel (138 millones con una valoración de 1.000 millones), OctoML (133 millones con una valoración de 850 millones), por nombrar algunas.
AlphaFold
La plataforma AlphaFold de DeepMind, anunciada por primera vez a finales de 2020, resolvió uno de los grandes misterios de la vida: el problema del plegamiento de las proteínas. AlphaFold es capaz de predecir con precisión la forma tridimensional de una proteína basándose únicamente en su secuencia unidimensional de aminoácidos, un logro histórico que había eludido a los investigadores humanos durante décadas.
Puede leer también | El futuro de la creatividad, presentado por la inteligencia artificial
Dado que las proteínas sustentan casi todas las actividades importantes que tienen lugar en el interior de cada ser vivo de la Tierra, un conocimiento más profundo de sus estructuras y funciones abre nuevas y profundas posibilidades en biología y salud humana: desde el desarrollo de terapias que salvan vidas hasta la mejora de la agricultura, desde la lucha contra las enfermedades hasta la investigación de los orígenes de la vida.
En julio de 2021, DeepMind abrió AlphaFold y publicó una base de datos de 350.000 estructuras tridimensionales de proteínas. (Como punto de referencia, el número total de estructuras de proteínas conocidas por la humanidad antes de AlphaFold era de unas 180.000). Hace unos meses, DeepMind hizo públicas las estructuras de otros 200 millones de proteínas, casi todas las proteínas catalogadas conocidas por la ciencia.
DeepMind, Google Brain y OpenAI
El término "modelo básico", introducido el año pasado por un equipo de investigadores de Stanford, se refiere a un modelo de IA masivo entrenado en amplias franjas de datos que, en lugar de estar construido para una tarea específica, puede realizar eficazmente una amplia gama de actividades diferentes.
Puede leer también | Los asesores científicos de la Casa Blanca piden una "Declaración de derechos de Inteligencia Artificial"
Los modelos básicos han sido uno de los principales impulsores de los recientes avances en IA. Los modelos básicos actuales son asombrosamente potentes. Pero, ya se trate de modelos de generación de texto como GPT-3, de modelos de conversión de texto en imágenes como Stable Diffusion o de modelos de acciones informáticas como Adept, operan exclusivamente en el ámbito digital.
Los sistemas de inteligencia artificial que actúan en el mundo real -vehículos autónomos, robots de almacén, drones, robots humanoides, etc.- han permanecido hasta ahora prácticamente al margen del nuevo paradigma del modelo fundacional.
Puede leer también | DeepMind de Google : ha anunciado sobre el caso de inteligencia artificial de 'nivel humano'
Esto cambiará en 2023. Es de esperar que los primeros trabajos pioneros sobre este concepto de modelos básicos para la robótica provengan de las principales organizaciones de investigación de IA del mundo: DeepMind, Google Brain u OpenAI.