bytevyte
bytevyte
Language
ai-beats-fr

Nebius renforce son infrastructure IA avec l'acquisition d'Eigen AI pour 643 millions de dollars

optimisation de l'inférence IA

Nebius a conclu un accord définitif pour l'acquisition d'Eigen AI pour environ 643 millions de dollars, une initiative visant à renforcer ses capacités de AI inference optimization full-stack. La transaction comprend une combinaison de 98 millions de dollars en espèces et 3,8 millions d'actions Nebius. Cette acquisition, annoncée cette semaine, marque une expansion significative pour l'entreprise technologique basée aux Pays-Bas, qui cherche à intensifier ses services d'inférence gérés pour les modèles open-source.

L'accord intègre la pile d'optimisation spécialisée d'Eigen AI dans la plateforme Token Factory, lancée par Nebius plus tôt cette année. En combinant ces technologies, l'entreprise vise à maximiser le débit de jetons par GPU, répondant ainsi à la demande croissante pour un déploiement efficace de modèles à grande échelle. L'intégration se concentre sur plusieurs techniques avancées, notamment l'Activation-aware Weight Quantization (AWQ), la sparse attention et les kernels CUDA personnalisés.

Intégration stratégique et gains de performance

La synergie technique entre les deux entités a déjà démontré des résultats mesurables en matière de AI inference optimization. Les efforts de collaboration ont produit des versions optimisées de modèles open-source de premier plan tels que Llama, DeepSeek et Qwen. Ces versions ont atteint des vitesses de sortie allant jusqu'à 911 jetons par seconde, les plaçant au sommet des références de performance de l'industrie. Ce niveau d'efficacité est crucial pour les entreprises qui cherchent à réduire la latence et le coût d'exploitation des applications d'IA haute performance.

Au-delà de l'intégration logicielle, l'acquisition apporte des talents de recherche d'élite à l'équipe de Nebius. Les fondateurs d'Eigen AI sont des anciens du HAN Lab du MIT et sont reconnus pour leurs contributions à l'efficacité des modèles. Ryan Hanrui Wang est un spécialiste de la sparse attention, tandis que Wei-Chen Wang est le développeur de la méthode AWQ. De plus, Di Jin possède une vaste expérience dans les processus de post-entraînement pour les modèles Llama 3 et Llama 4 de Meta.

Expansion de la présence mondiale en ingénierie

Dans le cadre de l'accord, l'équipe de direction d'Eigen AI établira un nouveau centre d'ingénierie pour Nebius dans la région de la baie de San Francisco. Cette expansion offre à l'entreprise une présence directe dans un centre mondial majeur du développement de l'IA, facilitant une collaboration plus étroite avec la communauté de recherche au sens large. Le nouveau bureau se concentrera sur le perfectionnement de la plateforme d'inférence gérée Token Factory et sur le développement de nouvelles méthodes de quantification post-entraînement.

L'acquisition devrait être finalisée dans les prochaines semaines, sous réserve des approbations réglementaires habituelles. Pour Nebius, issue des actifs internationaux de Yandex, cet investissement représente un engagement clair à devenir un acteur dominant sur le marché des infrastructures d'IA. En sécurisant des techniques d'optimisation propriétaires et des talents de premier plan, l'entreprise se positionne pour concurrencer directement les fournisseurs de cloud établis dans le domaine spécialisé du service de modèles d'IA.

Bien que nous nous efforcions d'être précis, bytevyte peut commettre des erreurs. Il est conseillé aux utilisateurs de vérifier toutes les informations de manière indépendante. Nous déclinons toute responsabilité pour les erreurs ou omissions.

✔Human Verified

Share