Alibaba dévoile Qwen 2.5-Max : une riposte à DeepSeek-V3 et GPT-4o ?

0
247

Le secteur de l’intelligence artificielle est en pleine effervescence. Alors que l’entreprise chinoise DeepSeek secoue l’industrie avec des modèles performants et à bas coût, Alibaba réplique en dévoilant, ce mercredi 29 janvier, Qwen 2.5-Max. Ce nouveau modèle, selon Alibaba Cloud, surpasse non seulement DeepSeek-V3, mais également GPT-4o d’OpenAI et Llama-3.1-405B de Meta. Cette annonce, faite en plein premier jour du Nouvel An lunaire, révèle la féroce compétition qui oppose les géants chinois de l’IA, mais aussi la pression que DeepSeek exerce sur l’ensemble du marché mondial.

Lancé le 10 janvier, le modèle DeepSeek-V3 a immédiatement attiré l’attention par sa puissance et son coût extrêmement réduit. Dix jours plus tard, le laboratoire chinois a dévoilé un autre modèle révolutionnaire, DeepSeek-R1, renforçant encore davantage sa position de leader potentiel. L’impact a été immédiat : les géants de la Silicon Valley ont vu leurs actions chuter, et leurs plans de financement massifs sont désormais remis en question.

Face à cette avancée fulgurante, la réaction ne s’est pas fait attendre. Alibaba, tout comme ByteDance (maison mère de TikTok), a accéléré ses mises à jour. ByteDance a récemment affirmé que son modèle amélioré surpassait même o1, le dernier modèle d’OpenAI, dans le test AIME, un benchmark mesurant la capacité des IA à répondre à des instructions complexes.

DeepSeek n’a pas seulement impressionné par la qualité de ses modèles, mais aussi par sa politique tarifaire agressive. L’an dernier, la sortie de DeepSeek-V2 avait déclenché une véritable guerre des prix en Chine. Son modèle open-source ne coûtait que 1 yuan (0,14 $) pour 1 million de tokens, forçant Alibaba à appliquer des réductions allant jusqu’à 97 % sur certains de ses propres modèles IA.

D’autres grands noms chinois, comme Baidu et Tencent, se sont également adaptés à cette nouvelle donne en ajustant leurs stratégies. Baidu, qui avait lancé le premier modèle chinois équivalent à ChatGPT en mars 2023, voit désormais son hégémonie menacée par les nouveaux acteurs du marché.

L’une des grandes forces de DeepSeek réside dans son approche organisationnelle. Son fondateur, Liang Wenfeng, a déclaré en juillet dernier que DeepSeek fonctionne davantage comme un laboratoire de recherche que comme une grande entreprise. Avec une équipe composée majoritairement de jeunes diplômés et de doctorants issus des meilleures universités chinoises, la startup mise sur l’innovation rapide et l’agilité, à l’opposé des géants comme Alibaba et Tencent, dont les structures lourdes et les coûts élevés pourraient freiner l’évolution des modèles d’IA.

« Les modèles fondamentaux nécessitent une innovation continue. Les capacités des géants technologiques ont leurs limites », a affirmé Liang. Il insiste sur un objectif clair : atteindre l’intelligence artificielle générale (AGI), cette IA capable de surpasser les humains dans la plupart des tâches économiques.

Alors que les États-Unis et l’Europe peinent à réguler et structurer leur marché de l’IA, la Chine semble avoir trouvé une dynamique propre, où les startups comme DeepSeek rivalisent avec les géants établis. La montée en puissance de DeepSeek-V3, la réponse immédiate d’Alibaba avec Qwen 2.5-Max, et l’implication de ByteDance, Baidu et Tencent montrent que la Chine ne se contente plus d’être un suiveur en intelligence artificielle, mais aspire à dominer l’industrie mondiale.

L’issue de cette bataille dépendra non seulement des performances technologiques, mais aussi des stratégies économiques et politiques. Si DeepSeek continue de proposer des modèles plus performants à des prix imbattables, il est fort probable que les équilibres actuels du marché de l’IA soient

Partager

Comments are closed.