La start-up espagnole ambitionne d’accélérer le développement de sa technologie CompactifAI, capable de compresser les modèles de langage (LLM) jusqu’à 95 %.
Basée à Saint-Sébastien, en Espagne, Multiverse Computing se présente comme un leader de la compression de modèles d’intelligence artificielle. Depuis 2024, l’entreprise développe CompactifAI, une technologie de compression dédiée aux LLM. Déjà utilisée par certains clients, cette solution permettrait, selon ses concepteurs, de réduire la taille des modèles jusqu’à 95 %, de diminuer les coûts d’inférence, et ce sans perte de performance.
Une promesse qui séduit, puisque Multiverse Computing vient d’annoncer une levée de fonds de 215 millions de dollars (environ 189 millions d’euros) dans le cadre d’un tour de série B. L’opération, menée par Bullhound Capital, a réuni plusieurs investisseurs dont HP Tech Ventures, SETT, Forgepoint Capital International, CDP Venture Capital, Santander Climate VC, Quantonation, Toshiba et Capital Riesgo de Euskadi – Grupo SPRI. Grâce à ces fonds, l’entreprise compte accélérer le déploiement et l’adoption de sa solution.
Une technologie pour démocratiser les LLM, même sur smartphone
L’enjeu est de taille : la taille des modèles est aujourd’hui l’un des principaux freins à leur adoption large, notamment en dehors des infrastructures cloud. Les LLM nécessitent généralement des ressources importantes en calcul et en énergie, ce qui limite leur exécution aux centres de données.
S’il existe déjà des techniques de compression comme la quantification ou le pruning (élagage), celles-ci ont tendance à dégrader les performances. À l’inverse, CompactifAI permettrait de créer des modèles 4 à 12 fois plus rapides, tout en réduisant les coûts d’inférence de 50 à 80 %. Ces modèles compressés peuvent être déployés dans le cloud, sur PC, smartphone, drones ou même Raspberry Pi.
La technologie repose sur les réseaux de tenseurs (Tensor Networks), une approche issue de la physique quantique. Cette méthode permet de simplifier les réseaux neuronaux en éliminant des corrélations parasites, optimisant ainsi les performances des modèles tout en réduisant leur complexité.

