L’analyste d’Investment Bank of America Securities, Andrew Obin, a donné son point de vue sur l’implication de DeepSeek sur les actions multinationales et a réitéré une note d’achat sur les actions de Vertiv Holdings Co (NYSE:VRT), GE Vernova Inc (NYSE:GEV) et Eaton Corporation PLC (NYSE:ETN) avec un prix prévisionnel de 165, 485 et 410 chacun.
En décembre, la start-up chinoise DeepSeek a introduit son dernier modèle AI, DeepSeek-V3, qui a montré des performances comparables à celles du GPT-4 d’OpenAI dans divers tests de référence, a noté l’analyste.
Les investisseurs sont méfiants à l’idée que cette percée technologique pourrait entraîner une baisse des dépenses en infrastructure et en production d’IA énergétique, selon l’analyste.
A lire aussi : Jensen Huang perd 20 milliards de dollars : comment DeepSeek a frappé le titre Nvidia et les plus grandes fortunes du monde
Les coûts d’inférence de DeepSeek (par million de jetons) sont d’environ 70 à 90 % inférieurs à ceux d’autres modèles d’IA. Le facteur critique à surveiller sera les plans de dépenses en capital des fournisseurs de services cloud pour les années 2025-2026, a noté l’analyste.
Le rapport technique indique que le modèle V3 n’a utilisé que 2,8 millions d’heures de GPU. Au taux de location de 2 dollars de l’heure, cela coûterait 5,6 millions de dollars, selon l’analyste.
Cependant, l’analyste a opiné que DeepSeek-V3 était « distillé » en utilisant le modèle DeepSeek-R1 précédemment lancé. Certains rapports suggèrent que DeepSeek pourrait également avoir utilisé d’autres modèles open source, tels que Llama de Meta Platforms, ce qui implique que le coût réel de formation pourrait être beaucoup plus élevé que le chiffre avancé.
L’investisseur en capital-risque Marc Andreessen a qualifié DeepSeek-R1 de « moment Spoutnik » pour les progrès de l’IA. Cependant, l’analyste interprète cette comparaison de manière favorable pour les entreprises d’infrastructure d’IA.
Suite au lancement de Spoutnik (4 octobre 1957), le budget fédéral américain de R&D spatiale a augmenté de manière significative, passant de 0,5 milliard de dollars par an à plus de 10,5 milliards de dollars en 1958.
Quand une nouvelle technologie augmente l’efficacité, elle réduit généralement la demande. Cependant, elle entraîne souvent une augmentation de la consommation, un phénomène appelé paradoxe de Jevons.
Une situation similaire s’est produite dans la production d’acier aux États-Unis après l’introduction du processus Bessemer : entre 1875 et 1900, les prix de l’acier ont chuté d’environ 90 %, tandis que la production est passée de 0,4 million de tonnes par an à 60 millions de tonnes par an.
L’analyste note que cela s’appliquera également au secteur de l’IA. Des coûts de formation réduits accélèrent les améliorations des modèles, et des modèles améliorés créent davantage de cas d’utilisation, ce qui entraîne une demande d’inférence plus élevée.
Par exemple, le coût des jetons de sortie de GPT-4 a chuté d’environ 80 % en moins d’un an depuis son lancement.
Les fournisseurs de services cloud connaissent toujours une croissance des revenus non liés à l’IA, les revenus non liés à l’IA d’Microsoft Corp (NASDAQ:MSFT) ayant augmenté de 22 % d’une année sur l’autre au cours du trimestre clos en septembre.
Les entreprises de colocation, qui représentent environ 50 % des data centers mondiaux, continuent de bénéficier de conditions de marché favorables, a conclu l’analyste.
Lire la suite :
Photo via Shutterstock : KhunkornStudio.