La URV crea CoCoGraph, una IA capaz de generar millones de moléculas químicas

El nuevo modelo de inteligencia artificial utiliza técnicas avanzadas para crear compuestos químicos realistas y abre la puerta al descubrimiento de fármacos y materiales innovadores

04 de mayo de 2026 a las 17:55h

Investigadores de la Universitat Rovira i Virgili (URV) han creado una herramienta basada en inteligencia artificial, llamada CoCoGraph, que permite generar millones de moléculas nuevas siguiendo estrictamente las leyes fundamentales de la química. Este sistema se inspira en modelos generativos de IA utilizados habitualmente para texto o imágenes, como ChatGPT o DALL·E, aunque todavía no responde a instrucciones específicas.

Tecnología y metodología empleada

Los resultados de este desarrollo se han publicado recientemente en la revista Nature Machine Intelligence. CoCoGraph hace uso de una técnica conocida como modelo de difusión, común en la creación de imágenes, que consiste en "desordenar" progresivamente una molécula real para después entrenar el sistema a reconstruirla con precisión.

El espacio químico: un reto colosal

Según los responsables del proyecto, cuando se proporciona al sistema una fórmula molecular determinada —como la del paracetamol— este genera una cantidad enorme de combinaciones atómicas. No obstante, solo un pequeño porcentaje de estas configuraciones resulta viable en condiciones reales. El espacio potencial de moléculas diferentes puede llegar hasta 1060, cifra muy superior al número de aguas oceánicas existentes, mientras que las moléculas conocidas representan solo una fracción minúscula de este universo. Esto sitúa el descubrimiento de nuevas moléculas útiles en un contexto comparable a "buscar una aguja dentro de un pajar gigantesco", explican los investigadores.

Molecularmente válido: una ventaja clave del modelo

Una característica destacada del modelo CoCoGraph es la incorporación directa de los principios básicos de química durante el proceso generativo. Cada átomo mantiene el número correcto de enlaces químicos, hecho que asegura que el 100% de las moléculas producidas sean químicas válidas, aspecto donde otros modelos presentan limitaciones importantes. Además, se trata de un sistema altamente eficiente: utiliza menos parámetros computacionales y necesita menos capacidad de cálculo para generar compuestos con mayor rapidez.

Evaluación experimental con expertos en química

El equipo investigador llevó a cabo un estudio con 121 expertos en química vinculados a la URV para validar la plausibilidad de los compuestos generados. Se presentaron veinte parejas de moléculas a los participantes —una real y una creada por el modelo— y estos se confundieron aproximadamente en el 40% de los casos sobre cuál era la auténtica. Este dato refuerza la calidad y convincente apariencia molecular de los compuestos producidos por CoCoGraph.

Avances hacia el diseño molecular personalizado

Desgraciadamente, el modelo actual todavía no permite especificar propiedades concretas durante la generación; sin embargo, se han identificado moléculas similares al paracetamol entre los millones creadas automáticamente. También se ha experimentado con técnicas para modificar parcialmente estructuras existentes con el objetivo de obtener variantes con características similares.

Perspectivas futuras y aplicaciones potenciales

A medio o largo plazo, el objetivo principal es desarrollar herramientas que permitan solicitar directamente composiciones moleculares con propiedades determinadas —como solubilidad específica o toxicidad mínima— adaptadas a aplicaciones farmacológicas o materiales innovadores. Esta tecnología podría revolucionar disciplinas como la química sintética, farmacología o ciencia de los materiales acelerando notablemente el descubrimiento científico dentro de un espacio químico prácticamente inexplorado hasta ahora.