Les Chinois mettent à jour DeepSeek. Lancer une nouvelle version n'est pas si simple.

Comme l'a rapporté Bloomberg, selon une publication de DeepSeek sur le groupe officiel WeChat, la version V3.1 dispose d'une fenêtre contextuelle plus longue, ce qui signifie qu'elle peut inclure davantage d'informations pour une requête donnée. Cela pourrait, par exemple, permettre des conversations plus longues avec une meilleure mémorisation . La startup basée à Hangzhou n'a pas fourni beaucoup de détails sur la mise à jour et n'a pas publié de documentation sur les principales plateformes, notamment Hugging Face.
La vitesse et la popularité des modèles DeepSeek ont mis au défi les leaders américains comme OpenAI et ont montré comment les entreprises chinoises peuvent réaliser des progrès dans l'IA à une fraction du coût.
La R1, qui a surpassé plusieurs concurrents occidentaux en termes de mesures standard, a surpris le monde lorsqu'elle a été dévoilée plus tôt cette année .
Quand DeepSeek R2 sortira-t-il ? Nous ne connaissons pas encore la date.Les fans de DeepSeek attendent toujours la sortie de R2, le successeur de R1, les médias locaux accusant le perfectionnisme et les erreurs du PDG Liang Wenfeng d'être à l'origine du retard.
Selon Reuters, les ingénieurs de DeepSeek ont travaillé à l'amélioration du R2 au cours des derniers mois jusqu'à ce que Liang donne le feu vert pour le lancement.
Cependant, un déploiement rapide de R2 pourrait s'avérer difficile en raison d'une pénurie de processeurs de serveur Nvidia en Chine due aux réglementations américaines en matière d'exportation.
Les Chinois ont besoin de circuits intégrés américainsL'augmentation potentielle de la demande pour R2 submergerait les fournisseurs de cloud chinois , qui ont besoin de puces Nvidia avancées pour exécuter des modèles d'IA.
DeepSeek a contacté plusieurs entreprises chinoises de cloud computing avec des spécifications techniques pour les aider à planifier l'hébergement et la distribution du modèle depuis leurs serveurs. Parmi les clients R1 actuels de l'entreprise, la plupart utilisent les puces H20 de Nvidia .
De nouvelles restrictions à l'exportation introduites par l'administration Trump en avril ont empêché Nvidia de vendre des puces H2O – les seuls processeurs d'IA que l'entreprise pouvait alors légalement exporter vers la Chine – sur le marché chinois. Cependant, en août, le président américain est revenu sur sa décision , acceptant d'exporter des puces d'IA « obsolètes » de NVIDIA et AMD vers la Chine en échange d'une contribution de 15 % des ventes au Trésor américain.
wnp.pl