IA bot

Cuando la inteligencia artificial encontró a la computación cuántica.- Hacia una inteligencia artificial generativa buena, precisa, barata y verde

IA + QC= IAG más económica, verde potente y variada. Parece que esta ecuación funciona, o al menos así lo demuestra el último informe de Zapata AI (Zapata Computing, Inc.). Esta compañía tecnológica dedicada a desarrollar Inteligencia Artificial Generativa para usos industriales acaba de publicar un artículo en el Nature Communications journal en el cual demuestra cómo los circuitos quánticos son capaces de extender y complementar las capacidades de la inteligencia artificial generativa (IAG) clásica.

El mencionado artículo desgrana los resultados de una investigación previamente compartida online por la empresa el pasado 15 de diciembre.

Ventajas de las técnicas cuánticas para la IA generativa

De acuerdo con Zapata IA la aplicación de matemáticas cuánticas para la IA generativa produce:

1.- Resultados de mayor calidad y mayor diversidad: Específicamente, las estadísticas cuánticas pueden mejorar la capacidad de los modelos generativos para generalizar o extrapolar información faltante y generar información nueva y de alta calidad. Generar datos genuinamente nuevos y de alta calidad es muy importante para los casos de uso industrial, particularmente cuando el objetivo es generar nuevos datos realistas o escenarios plausibles.

El uso de matemáticas cuánticas para la IA generativa da produce resultados de mayor calidad y mayor diversidad.
Por ejemplo, en un modelo entrenado para generar nuevas moléculas para tratamientos médicos. Con una generación deficiente, el modelo simplemente recrearía los medicamentos con los que fue entrenado, sin comprender las reglas sobre cómo funcionan estos productos. Un modelo con una capacidad de generación fuerte sería capaz de aprender estas reglas y crear nuevos fármacos de acuerdo con ellas.

La estadística cuántica también se puede utilizar para generar una gama más amplia de soluciones, una propiedad conocida como «expresibilidad» (o capacidad de expresión). En el contexto de las aplicaciones de IA generativa industrial, esto se puede utilizar para producir conjuntos de datos sintéticos más diversos o soluciones nuevas, previamente no consideradas, a problemas de optimización. Por ejemplo, la investigación de Zapata AI encontró que los modelos generativos mejorados cuánticamente diseñaban carteras financieras con menor riesgo (para el mismo rendimiento) que las carteras creadas mediante algoritmos de optimización convencionales.

2.- Reducción de costes (ahorros en GPUs, energía y cantidad de tokens para entrenar el modelo): Estas técnicas cuánticas también se pueden utilizar para comprimir modelos generativos de IA, lo que puede reducir significativamente sus costes, además de mejorar la precisión de sus resultados.

Los modelos de lenguaje grandes (LLM), como el GPT-4 en la base de ChatGPT, consumen mucha energía y exigen la potencia de procesamiento que sólo pueden proporcionar chips de unidades de procesamiento de gráficos (GPU) especializados.

Las GPUs son caras de ejecutar y consumen mucha energía, lo que deja una gran huella de carbono. También son más difíciles de encontrar, ya que la creciente demanda de IA generativa ha provocado escasez de estas GPUs.
Los modelos comprimidos con técnicas cuánticas pueden entrenarse además a un coste menor. la investigación de Zapata AI demuestra que los modelos comprimidos presentaron un rendimiento más estable durante el entrenamiento, lo que significa que lograron una precisión más consistente con menos pasos de entrenamiento en comparación con los modelos no comprimidos.

Entrenar el modelo más rápido se traduce en menores costos de computación y en que son necesarios menos tokens para entrenar el modelo.
Esto significa que la compresión también podría desbloquear nuevos casos de uso en escenarios donde no hay muchos datos disponibles para entrenar el modelo.
De acuerdo con la investigación llevada a cabo por Zapata IA los modelos comprimidos se pueden entrenar para lograr el mismo rendimiento que sus homólogos no comprimidos utilizando una cantidad de datos 300 veces menor, algo que podría ser particularmente valioso a la hora de desarrollar aplicaciones de simulación de escenarios y datos sintéticos con precedentes limitados disponibles para entrenar los modelos.

3.- IAG más verde: Los modelos comprimidos con técnicas cuánticas utilizan menos parámetros que sus homólogos no comprimidos, lo que significa menos consumo de energía, menores costes de computación y una menor huella de carbono.
Zapata IA presume de haber establecido el récord del modelo de lenguaje más grande comprimido hasta ahora mediante técnicas cuánticas (GPT2-XL) y trabaja para comprimir modelos más grandes con las mismas técnicas.

Bienvenidos a la era de la combinación de computación cuántica y clásica

«Estamos muy orgullosos de los talentosos investigadores que contribuyeron a este trabajo innovador», dijo Christopher Savoie, CEO y cofundador de Zapata AI. “Las técnicas cuánticas pueden aportar enormes ventajas a las aplicaciones empresariales de IA generativa, y esta investigación muestra cómo podemos aprovechar al máximo los recursos que tenemos hoy para lograr esas ventajas. Ya no se trata de una cuestión de cuántica o clásica, sino de cómo se pueden utilizar ambas de forma sinérgica para obtener mejores resultados y más rápido. Esperamos aplicar esta investigación en nuestro trabajo con clientes empresariales”.

«Nuestro trabajo combina las fortalezas complementarias de las computadoras cuánticas y clásicas para alcanzar mejores resultados que cualquier tipo de hardware por sí solo», dijo Jacob Miller, científico investigador cuántico de Zapata AI. “La gente suele pensar que las tecnologías cuánticas y clásicas compiten entre sí, pero demostramos que los métodos clásicos en realidad pueden ayudar a superar una limitación importante en la optimización de los dispositivos cuánticos. Esperamos que nuestro enfoque «sinérgico» pueda comenzar a desbloquear el verdadero potencial de las tecnologías cuánticas actuales para resolver problemas computacionales intratables».

«En nuestro artículo de Nature Communications, mostramos cómo las redes tensoriales, tradicionalmente utilizadas en algoritmos clásicos, forman un puente crítico hacia los algoritmos cuánticos, ofreciendo una sinergia única», dijo Jing Chen, científico cuántico senior de Zapata AI, autor del artículo junto con Manuel Rudolph, Jacob Miller, Daniel Motlagh, Atithi Acharya y Alejandro Perdomo-Ortiz. “Esta integración no sólo mejora ambos campos, sino que también alivia notablemente los desafíos de los estancamientos estériles en la computación cuántica. Nuestro enfoque fomenta la colaboración, aprovechando las fortalezas de los métodos clásicos y cuánticos para abordar problemas complejos de manera más efectiva”.

Imagen sobre el titular.- IA bot. Imagen de mikemacmarketing, via Wikimedia Commons. Para ver la imagen original clic aquí y para leer los términos de la licencia clic aquí

Links externos relacionados:

Para leer el artículo publicado en el Nature Communications journal clic aquí

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Últimas noticias