Huawei inaugure une nouvelle ère d’intelligence avec l’IA révolutionnaire : le basculement vers l’IA agentique qui change la donne 🚀
Le moment est particulièrement électrisant : l’IA ne se contente plus de répondre à une requête, elle raisonne, enchaîne des actions et maintient un contexte comme si elle suivait un dossier de bout en bout. Cette évolution vers l’IA dite « agentique » bouleverse déjà la façon dont les entreprises envisagent l’organisation du travail, les responsabilités et… la facture d’infrastructure, souvent invisible au départ. Pourquoi invisible ? Parce qu’un agent ne produit pas seulement un résultat final : il explore, teste, itère, appelle des outils, conserve des mémoires, et crée une traîne de données qui gonfle à grande vitesse.
Lors de prises de parole récentes dans l’écosystème européen, Huawei a posé un diagnostic très concret : l’IA agentique entraîne une explosion des données et une imprévisibilité des charges qui mettent en difficulté les architectures historiques. À l’échelle des marchés, les projections présentées par des analystes de référence décrivent un mouvement massif : l’investissement des entreprises dans l’IA, estimé à environ 16 milliards de dollars en 2023, pourrait atteindre près de 90 milliards de dollars en 2029. L’effet domino est immense, avec des investissements cumulés en équipements et data centers qui se chiffrent à l’horizon en centaines de milliards, jusqu’à approcher le seuil symbolique du trillion selon certaines modélisations. Cette dynamique s’inscrit dans une « quatrième ère informatique » après le mainframe, le client-serveur et le cloud : celle de la générative puis de l’agentique.
La différence décisive ne se limite pas au volume de calcul. L’ancienne logique « prompt → réponse » laissait l’humain piloter l’action, choisir la prochaine étape, relancer. L’agentique fonctionne plutôt comme un moteur « reasoning & action » : il interprète un objectif, découpe en tâches, exécute, vérifie, ajuste. Une simple demande métier peut déclencher une séquence longue, comparable à une mini-mission. Dans ce contexte, la phrase qui frappe les esprits est celle-ci : une seule personne épaulée par plusieurs agents pourrait constituer une entreprise. L’image est volontairement provocante, mais elle reflète une tendance de fond : la multiplication des agents actifs, aujourd’hui déjà comptés en dizaines de millions, pourrait atteindre des milliards dans les années à venir.
Pour rendre ce basculement tangible, imaginons une entreprise fictive, « Atelier Lumière », un distributeur spécialisé dans l’équipement de maison. Jusqu’ici, son IA se limitait à générer des textes de fiches produits. Désormais, un agent marketing peut analyser les ventes, identifier une baisse sur une catégorie, proposer une campagne, réserver des budgets, demander des visuels, créer des variantes, puis déclencher une validation interne. Chaque étape produit des journaux d’exécution, des brouillons, des comparatifs, des embeddings, des caches. À la fin, l’organisation obtient une campagne performante… mais aussi une nouvelle réalité : les workloads deviennent éphémères, avec des pics brusques et des creux inattendus.
Ce point est crucial : les méthodes classiques de planification de capacité reposaient sur des tendances relativement stables. Dans l’agentique, les directions métiers peuvent déployer une application reposant sur un service IA en quelques minutes, parfois sans coordination avec l’équipe infrastructure. Résultat : la consommation devient difficile à anticiper, et l’architecture IT se retrouve à « courir derrière » l’usage réel. La promesse est enthousiasmante, mais la discipline technique doit suivre, sinon l’agilité se transforme en chaos contrôlé.
Huawei et l’IA révolutionnaire : la nouvelle physique des workloads et le défi du stockage hybride ⚙️
Le cœur du changement, c’est cette « nouvelle physique » des charges IA : elles sont imprévisibles, souvent courtes, mais capables de provoquer des pics extrêmes lorsque plusieurs agents se mettent à raisonner en parallèle. Dans un environnement traditionnel, un applicatif ERP ou une base de données avait des cycles relativement connus. Désormais, une simple expérimentation d’équipe produit peut déclencher un afflux d’inférences, de recherches sémantiques et de consultations de connaissances internes. Et lorsque l’expérimentation devient un service, l’afflux se stabilise… mais à un niveau bien supérieur à l’ancien monde.
Le stockage est l’un des premiers domaines où cette mutation se voit. Pendant des années, le flash s’est imposé comme référence pour la performance, mais l’IA agentique remet sur la table un dilemme : le coût par giga face à l’explosion de la donnée. Les organisations réclament des architectures hybrides capables d’amortir la croissance, tout en évitant le retour des contraintes « à l’ancienne » (latence, complexité, mécanique). Cette tension pousse vers des designs plus intelligents : hiérarchisation fine, caches adaptés à l’inférence, conservation d’historiques, et surtout capacité à passer d’un usage à l’autre sans réarchitecture constante.
Un autre piège, très actuel, est l’effet « poches isolées ». Beaucoup d’organisations déploient l’IA par à-coups : un cluster ici, un stockage là, une base documentaire ailleurs. Sur le papier, tout fonctionne. Dans la durée, les silos empêchent la consolidation, multiplient les copies, et font grimper le coût total. Les analystes estiment même qu’en 2026, les entreprises sans données réellement prêtes pour l’IA pourraient subir jusqu’à 15 % de perte de productivité. Ce n’est pas un détail : 15 % représente parfois des mois de projets gaspillés, des équipes qui « bricolent » au lieu d’industrialiser, et des directions qui perdent confiance.
Dans ce contexte, le discours de Huawei se veut très opérationnel : l’infrastructure doit être pensée pour absorber l’imprévu. Prenons « Atelier Lumière » : l’équipe e-commerce lance un agent chargé d’optimiser les prix en temps réel, en combinant stocks, concurrence, météo et événements locaux. À 18h, un influenceur mentionne un produit ; le trafic explose ; l’agent déclenche des recalculs ; les caches saturent ; la recherche sémantique se met à scanner davantage de données. Si l’architecture n’a pas été conçue pour encaisser, les ralentissements se propagent jusqu’aux applications critiques.
La question devient alors : comment garder une infrastructure stable dans un monde instable ? Une partie de la réponse consiste à mieux mutualiser. La virtualisation GPU, notamment, apparaît comme un levier logique lorsque les cartes très haut de gamme coûtent si cher qu’elles ne peuvent pas être « réservées » à un seul usage. Le principe est simple : plutôt que de laisser une ressource sous-utilisée, on la partage entre modèles, équipes et horaires, comme un réseau électrique répartit la charge. Pour éclairer les enjeux matériels côté poste et accélération, un détour utile est l’analyse des configurations et tendances autour des GPU IA, notamment via un dossier sur les PC RTX orientés IA, qui aide à comprendre le rapport coût/usage quand on rapproche poste, lab et production.
À mesure que les organisations se structurent, un autre sujet monte : l’automatisation des tâches répétitives entourant l’IA (collecte, classement, validation, déclenchement). Là encore, l’agentique rejoint parfois la RPA, et les équipes hybrident les approches. Pour suivre ce croisement, un éclairage sur l’automatisation RPA permet de mieux situer où s’arrête le script et où commence le raisonnement agentique.
Ce qui se dessine, c’est une règle simple : l’IA agentique promet des gains spectaculaires, mais seulement si l’infrastructure cesse d’être un arrière-plan et devient un produit à part entière. Le thème suivant s’impose naturellement : la résilience, devenue le langage commun des DSI face à l’imprévisibilité.
Huawei inaugure une nouvelle ère d’intelligence : la résilience comme priorité absolue et la méthode 0.1.3.5 🛡️
Le vocabulaire des décideurs IT évolue vite. Pendant longtemps, l’objectif dominant se résumait à la fiabilité : disponibilité élevée, objectifs RPO/RTO stricts, performances soutenues. Dans un univers agentique, cette promesse devient plus difficile à tenir de manière « linéaire », parce que les charges s’emballent et que les dépendances se multiplient (modèles, bases de connaissances, caches, pipelines de données, agents). Le centre de gravité se déplace : ce qui compte le plus, c’est la résilience, c’est-à-dire la capacité à encaisser l’incident, à isoler, à récupérer, à continuer.
Cette vision met en avant un principe très concret : planifier « le pire scénario ». Au lieu d’imaginer un monde idéal où la panne est rare, l’infrastructure doit être pensée comme si l’incident allait arriver, et qu’il faudra garantir la récupérabilité totale des données. Ce renversement est presque culturel : il ne s’agit plus d’affirmer « ça ne tombera pas », mais de démontrer « si ça tombe, on sait quoi faire, vite, et sans perte ». Ce réalisme est d’autant plus important que les agents manipulent parfois des données très sensibles : informations clients, savoir-faire, documents internes, secrets industriels.
Dans la vision défendue par Huawei, la résilience se construit couche par couche. D’abord, on passe d’un gros volume monolithique à des petits blocs distribués. En cas d’incident, on évite ainsi le blocage d’un ensemble entier. Ensuite, on vise des performances stables même en défaillance : un composant, un contrôleur, voire un site peut faiblir, mais l’expérience applicative doit rester acceptable. Enfin, on automatise la détection et la remédiation, parce que l’humain seul ne peut pas suivre la cadence d’un système où les événements se produisent en chaîne.
Une formule retient l’attention : la méthode 0.1.3.5, un découpage des temps de réaction. L’idée est de ritualiser la vitesse : détection proactive le plus tôt possible, 1 minute pour identifier un problème de premier niveau, 3 minutes pour qualifier si l’origine se situe côté réseau, VM ou stockage, 5 minutes pour analyser les workloads impactés. Ce n’est pas un slogan marketing, c’est une manière de faire entrer l’urgence dans l’organisation, avec des seuils compréhensibles par tous, y compris les métiers. À l’heure des agents, la minute redevient une unité de valeur.
Pour « Atelier Lumière », la différence est immédiate. Un lundi matin, l’agent supply chain déclenche une série d’optimisations de réassort. Une latence anormale apparaît. Avec un modèle classique, on ouvrirait des tickets, on attendrait des logs, on réunirait des équipes. Avec une approche résiliente, l’infrastructure isole automatiquement la portion de données suspecte, bascule le flux, et conserve un service dégradé mais fonctionnel. Les équipes traitent ensuite la cause racine sans arrêter l’activité. Le retail, la santé, la banque ou l’industrie partagent le même impératif : l’arrêt total n’est plus acceptable.
Cette logique rencontre une réalité inquiétante : les attaquants ont eux aussi changé d’ère. Un pirate peut aujourd’hui cartographier une cible, repérer des vulnérabilités et générer un code malveillant sur mesure très rapidement. Les risques spécifiques à l’IA s’ajoutent : empoisonnement de modèles, manipulation de données d’entraînement, contamination de bases de connaissances. Sur ce terrain, un exemple frappant de l’actualité de la cybersécurité aide à mesurer la brutalité des attaques modernes, comme le relate cet article sur une attaque hacker marquante. Le message est clair : la défense doit être multicouche, et la résilience devient une compétence stratégique.
Ce cadre prépare naturellement la brique suivante, longtemps sous-estimée mais redevenue centrale : la sauvegarde, dernier rempart face au rançongiciel et aux corruptions silencieuses.
Huawei et l’IA révolutionnaire : OceanProtect, sauvegarde anti-rançongiciel et clean room isolée 🔐
La sauvegarde a longtemps été traitée comme une obligation administrative : nécessaire, mais pas glamour. L’ère de l’IA agentique la propulse au premier plan, car une entreprise peut survivre à une panne ; elle survit beaucoup moins facilement à une corruption massive de données, à une attaque par rançongiciel, ou à l’empoisonnement progressif d’un référentiel utilisé par des agents. En clair, quand l’IA devient un moteur d’action, la donnée devient l’organe vital. Et si l’organe est touché, l’entreprise entière suffoque.
Huawei met en avant une nouvelle génération de solutions de protection, avec une promesse compréhensible par tout le monde : sauvegarder vite, stocker efficacement, et restaurer proprement. Sur le terrain technique, la gamme OceanProtect (notamment via des appliances dédiées) insiste sur des mécanismes de compression optimisés et sur une intégration serrée entre matériel et logiciel. Un point marquant : des algorithmes spécialisés par type de données et une carte de compression maison pour améliorer l’efficacité. Dit autrement : au lieu d’appliquer une compression générique, le système adapte la méthode à ce qu’il voit, ce qui permet de limiter l’empreinte de stockage, un enjeu majeur lorsque la volumétrie IA explose.
Mais le véritable sujet, ce n’est pas seulement la compression. C’est la protection multicouche contre les rançongiciels :
- 🧱 Sauvegarde de base : des copies régulières, cohérentes et vérifiables, pour éviter les « faux sentiments de sécurité ».
- 🧠 Analyse par IA des données stockées : détection d’anomalies, de patterns de chiffrement, de corruptions atypiques.
- 🏥 Réplication vers une clean room isolée : un espace séparé où une copie est contrôlée avant toute remise en production.
La clean room est une idée particulièrement séduisante : au lieu de restaurer aveuglément, on restaure « en quarantaine », on vérifie, puis on remet en service sur un autre site. Dans une attaque moderne, c’est déterminant, car les ransomwares ne se contentent plus de chiffrer : ils attendent, se propagent, cherchent les sauvegardes, tentent de les contaminer. Avoir un mécanisme de validation hors du périmètre principal réduit drastiquement le risque de réinfection.
Pour « Atelier Lumière », imaginons un scénario plausible : un utilisateur télécharge un fichier piégé, l’attaquant prend pied, puis s’intéresse à la base de connaissances utilisée par les agents (procédures, contrats, pricing, informations fournisseurs). L’objectif n’est pas seulement de voler, mais aussi de manipuler : introduire des données biaisées pour que l’agent prenne de mauvaises décisions. Dans ce cas, la capacité à restaurer une copie saine est autant une question de cybersécurité que de continuité de l’activité.
Le sujet de la confiance documentaire est d’ailleurs devenu brûlant avec la montée des falsifications. Lorsqu’une pièce semble authentique mais a été générée ou modifiée, la chaîne de décision peut être contaminée. Pour comprendre l’ampleur de ce risque, un point sur les documents falsifiés par l’IA illustre pourquoi les entreprises renforcent les contrôles, surtout lorsque des agents automatisent des validations.
Enfin, il faut parler économie, car c’est souvent là que se joue l’adoption. Huawei insiste sur des modèles de licensing plus simples, qui évitent la multiplication de coûts « par VM », « par agent », « par capacité logique ». Dans un monde agentique où le nombre d’exécutions peut grimper sans prévenir, la lisibilité contractuelle devient un facteur de sérénité. L’insight final est net : la sauvegarde n’est plus un accessoire, c’est une assurance-vie opérationnelle, et l’IA ne fait que rendre cette évidence plus tranchante.
Cette protection des données mène naturellement à la question suivante : où héberger et comment structurer la pile IA pour préserver confidentialité, conformité et performance ?
Les démonstrations vidéo autour des « clean rooms » et de la détection d’anomalies aident à visualiser ce qui, autrement, resterait un concept abstrait : un pipeline complet de sauvegarde, d’analyse, d’isolement et de restauration contrôlée.
Huawei inaugure une nouvelle ère d’intelligence : la stack IA privée on-premise, du data lake au framework d’agents 🧩
Le message devient particulièrement enthousiasmant pour les organisations soumises à de fortes contraintes : si l’IA est réellement stratégique, il devient logique de bâtir une stack privée, hébergée en local ou dans un cloud privé, afin de protéger les informations sensibles et de respecter les réglementations. Le point est sensible : les services publics d’IA sont formidables pour prototyper, mais ils ne suffisent pas toujours quand il faut garantir la souveraineté, la confidentialité, ou la maîtrise de la propriété intellectuelle. Cette préférence pour des infrastructures d’IA privées se renforce dans la santé, la banque, la défense, l’industrie, mais aussi dans le retail dès lors que les données clients et les négociations fournisseurs deviennent un avantage compétitif.
Huawei décrit une pile structurée en cinq couches, pensée pour industrialiser l’IA agentique :
| Couche 🧱 | Rôle clé 🎯 | Exemple concret 🧪 |
|---|---|---|
| Data lake 🗃️ | Centraliser la donnée pour alimenter inférence et agents | Regrouper ventes, stocks, SAV, docs internes pour un agent pricing |
| Plateforme de données 🧠 | Orchestrer base de connaissances, mémoire, cache d’inférence | Maintenir un contexte client sans dupliquer partout |
| Computing ⚡ | Assurer l’inférence, devenue le centre de gravité | Servir 1 000 requêtes d’agents/minute lors d’un pic |
| Couche modèles 🧬 | Entraîner, affiner, évaluer, aligner sur les règles locales | Adapter un modèle à la terminologie juridique interne |
| Framework d’agents 🤖 | Développer, faire évoluer et exécuter des agents de façon sécurisée | Agent finance qui prépare clôture, contrôles, alertes |
Cette structuration est intéressante parce qu’elle clarifie la conversation entre IT et métiers. Au lieu de parler « de l’IA » comme d’un bloc, on parle de fondations (data lake), d’outillage (plateforme), de puissance (compute), de gouvernance (modèles) et de passage à l’action (agents). C’est aussi un moyen de mieux gérer les coûts : chaque couche se dimensionne, se mutualise, se sécurise.
Les cas d’usage concrets illustrent l’intérêt du data lake centralisé. En santé, un hôpital a spectaculairement réduit le temps de production d’un rapport de pathologie sur lame, passant de dizaines de minutes à quelques secondes, grâce à un ensemble de GPU et un modèle nourri par une grande quantité d’ouvrages médicaux et de dossiers. L’enjeu n’est pas seulement la performance : c’est la réplicabilité du modèle vers d’autres établissements, afin d’augmenter le niveau moyen de soin. Cette logique de duplication maîtrisée est exactement ce que recherchent les organisations européennes : un modèle utile, validé, déployable, mais sous contrôle.
Dans l’automobile, la problématique devient presque vertigineuse : un véhicule autonome avancé peut générer et nécessiter l’analyse de plus de 100 pétaoctets de données (capteurs, radars, météo, situations rares). Le défi n’est pas uniquement de stocker, mais de retrouver vite une séquence précise avec un sens métier : par exemple, des occurrences très rares à utiliser pour l’entraînement. Cette recherche « sémantique » est un pivot : retrouver « un chien traversant un feu rouge sous la pluie » n’est pas une requête classique, c’est une requête qui exige des index multimodaux et une architecture pensée pour cela.
À ce stade, la question que beaucoup se posent est simple : comment comparer les modèles et mesurer leurs performances dans des scénarios réalistes ? Sur ce point, une analyse des performances d’un modèle avancé offre un repère utile pour comprendre ce que signifie « mieux » selon les tâches (raisonnement, génération, cohérence, coût). L’insight final est enthousiasmant : la pile IA privée transforme l’agentique en capacité industrielle, pas en simple expérimentation.
Les conférences technologiques récentes montrent une tendance nette : l’inférence devient le vrai moteur des workflows, et la maîtrise du périmètre de données devient l’avantage compétitif le plus durable, surtout lorsque les agents exécutent des actions à la place des humains.
Huawei inaugure une nouvelle ère d’intelligence avec l’IA révolutionnaire : Dorado, DPU et virtualisation DCS, le passage à l’échelle illustré par Auchan 🏗️
Pour industrialiser cette nouvelle ère, Huawei met en avant des briques produits qui visent un objectif commun : réduire les goulets d’étranglement et simplifier l’exploitation dans un monde de charges fluctuantes. Sur la couche data lake, certaines solutions revendiquent une densité énergétique optimisée et des fonctions de recherche sémantique multimodale capables de croiser image, son et texte. C’est loin d’être cosmétique : les entreprises accumulent des contenus non structurés (vidéos, captations, images, enregistrements), et l’agentique a besoin d’y accéder comme à une bibliothèque vivante.
Sur le stockage primaire, la logique est tout aussi intéressante : la nouvelle génération de baies introduit des DPU développées en interne pour séparer le plan de données et le plan de contrôle. Concrètement, quand une requête arrive, les métadonnées passent par le CPU, tandis que le flux de données est routé plus directement vers les supports. Pourquoi est-ce important ? Parce que, désormais, le goulot d’étranglement n’est plus seulement le disque : c’est souvent le CPU des baies, saturé par des opérations de gestion, d’index, de multiples petits accès, typiques des workloads IA. La DPU agit comme un accélérateur d’autoroute : elle libère le CPU pour la logique, et fluidifie le trafic.
La question de la virtualisation est un autre champ décisif. Beaucoup d’organisations cherchent à réduire l’incertitude liée à certains changements de licences sur le marché. Huawei pousse une alternative avec DCS, héritée d’une offre déjà déployée chez de grands comptes, avec des arguments clairs : licence perpétuelle, attachement au socket physique pour l’hyperviseur, interface retravaillée pour limiter la rupture d’habitudes. Ici, l’enthousiasme vient d’un point très concret : la modernisation ne doit pas signifier réapprendre tout en même temps, surtout quand l’IA impose déjà une transformation rapide des méthodes.
Le cas d’Auchan, présenté publiquement, illustre ce passage à l’acte. L’entreprise, créée en 1961, est présente dans une douzaine de pays, avec environ 3 000 magasins, un chiffre d’affaires autour de 32 milliards d’euros et près de 160 000 collaborateurs. Avant la migration, le groupe faisait face à une complexité impressionnante : beaucoup plus d’applications et de fournisseurs que la moyenne du secteur, et un TCO bien supérieur à l’attendu. À partir de septembre (sur une période récente), un projet de migration a été engagé : bascule d’un data center historique vers une architecture distribuée sur trois data centers. Deux sites fonctionnent en haute disponibilité comme un data center virtuel ; le troisième assure la reprise d’activité.
Les chiffres donnés sont parlants : plus de 5 000 machines virtuelles exploitées sur la nouvelle infrastructure, un taux de réussite de migration des VM d’environ 99 % dès le premier passage, et un objectif de retour sur investissement reposant sur une division par deux du TCO sur cinq ans par rapport à la solution précédente. Dans un retail ouvert au public, la condition était non négociable : les magasins devaient continuer à fonctionner pendant la bascule. Ce genre d’exigence rend la réussite d’autant plus significative, car elle reflète une migration « sans théâtre », au contact du réel.
Pour ancrer les points clés, voici une liste des leviers qui font la différence lorsqu’une entreprise veut entrer pleinement dans l’ère agentique, sans sacrifier la stabilité :
- 🧭 Centraliser la donnée (data lake) pour éviter les copies incohérentes et accélérer la recherche sémantique.
- 🧱 Concevoir la résilience dès le départ (blocs distribués, maintien de performances en panne, automatisation).
- 🔐 Élever la sauvegarde au rang de bouclier stratégique (analyse IA, clean room, restauration contrôlée).
- ⚡ Accélérer les chemins critiques (DPU, séparation des plans, réduction des goulets CPU).
- 💸 Rendre les coûts prévisibles (mutualisation, virtualisation, modèles de licences lisibles).
Le fil rouge est limpide : Huawei cherche à transformer l’IA agentique en un système exploitable au quotidien, pas en une vitrine. Et l’insight final qui reste en tête, c’est celui-ci : quand l’IA passe de la réponse à l’action, l’infrastructure passe de l’arrière-plan au premier rôle — et c’est précisément là que se joue la nouvelle ère d’intelligence.

Anna Bailly dirige la rédaction de CDI TECH MEDIA. Journaliste numérique depuis onze ans, elle a fait ses armes au pôle innovation de Numerama avant de rejoindre Usbek & Rica comme cheffe de la rubrique technologies, puis de co-fonder un média indépendant dédié à l’intelligence artificielle à Berlin. Diplômée de Sciences Po Paris et titulaire d’un DU d’éthique de l’intelligence artificielle, elle s’intéresse autant à la mécanique interne des modèles de langage qu’aux dynamiques sociales du numérique.