Stockage distribué 2026. Un guide technique (controversé)

Une autre année vivante, une autre année à regarder l’industrie du stockage distribué se surpasser en créativité commerciale. Si 2024 était l’année où tout le monde a découvert qu’il fallait du “stockage pour l’IA” (spoiler : c’est le même vieux stockage, mais avec un meilleur marketing), 2025 est l’année où MinIO a décidé de s’immoler publiquement pendant que le reste de l’écosystème continue d’évoluer à un rythme soutenu.

Accrochez-vous, ça va secouer!

Le drame de l’année : MinIO passe en “mode maintenance” (lire : mode abandon).

Si tu n’as pas suivi le feuilleton MinIO, laisse-moi te donner un peu de contexte. MinIO était le stockage d’objets open source que tout le monde déployait. Simple, rapide, compatible avec S3. Tu le mettais en place et en service en 15 minutes. C’était le WordPress du stockage objet.

Eh bien, en décembre 2025, un commit silencieux dans le README a tout changé : “Ce projet est actuellement en maintenance et n’accepte pas de nouvelles modifications”. Pas d’annonce. Pas de guide de migration. Pas d’adieu. Juste un commit et un simple au revoir.

La communauté, sans surprise, s’est enflammée. Un développeur a parfaitement résumé la situation : “Une mise à jour silencieuse du README vient de mettre fin à l’ère de MinIO en tant que moteur S3 open-source par défaut”.

Mais cela ne s’est pas fait du jour au lendemain. MinIO poursuivait depuis des années une stratégie “open source mais sans en faire trop” :

  • 2021: Passage silencieux d’Apache 2.0 à AGPL v3 (pas d’annonce, pas de PR, rien)
  • 2022-2023: Campagnes agressives contre Nutanix et Weka pour “violation de licence”.
  • Février 2025: la console Web, la gestion des seaux et la réplication sont supprimées de la version communautaire.
  • Octobre 2025: arrête de distribuer des images Docker
  • Décembre 2025: Mode maintenance

Le message est clair : si tu veux MinIO pour de vrai, paie. Leur produit AIStor pour les entreprises commence à 96 000 €/an pour 400 TiB. Pour 1 PB, nous parlons de plus de 244 000 €/an.

La leçon à en tirer ? En 2025, l'”Open Source” sans gouvernance ouverte ne vaut rien. MinIO était une entreprise avec un produit open source, pas un projet communautaire. La différence est importante.

Pendant ce temps, Ceph continue de nager paisiblement.

Pendant que MinIO s’autodétruisait, Ceph fêtait sa 20e version stable : Tentacle (v20.2.0), sortie en novembre 2025. Le projet accumule plus d’un exaoctet de stockage déployé à l’échelle mondiale sur plus de 3 000 clusters.

L’élément le plus intéressant de Tentacle est FastEC (Fast Erasure Coding), qui améliore les performances des petites lectures et écritures de 2x à 3x. Cela rend l’erasure coding enfin viable pour les charges de travail de fichiers froids non purs. Avec un profil EC 6+2, tu peux désormais obtenir environ 50 % des performances de la réplication 3 tout en utilisant seulement 33 % de l’espace.

Pour ceux d’entre nous qui entendent depuis des années que “le codage par effacement est lent pour la production”, cela change vraiment la donne.

D’autres nouvelles de Tentacle :

  • Prise en charge intégrée de SMB via Samba Manager
  • Groupes de passerelles NVMe/TCP avec prise en charge de plusieurs espaces de noms
  • Authentification OAuth 2.0 sur le tableau de bord
  • Répertoires CephFS insensibles à la casse (enfin)
  • ISA-L remplace Jerasure (qui a été abandonné)

Le Crimson OSD (basé sur Seastar pour l’optimisation NVMe) est encore en avant-première technique. Il n’est pas prêt pour la production, mais la feuille de route est prometteuse.

Les chiffres qui comptent

Bloomberg exploite plus de 100 Po dans des grappes Ceph. Elle est membre Diamant de la Fondation Ceph et son responsable de l’ingénierie du stockage fait partie du conseil d’administration. DigitalOcean possède plus de 54 Po dans 37 clusters de production. Le CERN maintient 50+ PBs dans plus de 10 clusters.

Et voici la partie intéressante : ZTE Corporation fait partie des 3 premiers contributeurs mondiaux à Ceph et est numéro 1 en Chine. Son produit TECS CloveStorage (basé sur Ceph) est déployé dans plus de 320 projets NFV dans le monde, notamment chez China Mobile, izzi Telecom (Mexique) et Deutsche Telekom.

Le secteur des télécoms est la superpuissance secrète de Ceph. Alors que beaucoup pensent encore aux appareils traditionnels, les télécoms font fonctionner Ceph en production à grande échelle.

L’écosystème de l’entreprise : comprendre ce que tu achètes

C’est là que les choses deviennent intéressantes. Et il vaut la peine de comprendre ce qui se cache derrière chaque option.

 

IBM Fusion : deux saveurs pour des besoins différents

IBM propose deux produits sous la marque Fusion, et il est important de comprendre la différence :

  • IBM Fusion HCI: utilise IBM Storage Scale ECE (l’ancien GPFS/Spectrum Scale). Système de fichiers parallèle avec codage d’effacement distribué. Appareil hyperconvergé qui évolue de 6 à 20 nœuds.
  • IBM Fusion SDS: utilise OpenShift Data Foundation (ODF), qui est basé sur Ceph packagé par Red Hat.

Storage Scale est une technologie véritablement différenciée, notamment pour le calcul intensif. Son architecture de système de fichiers parallèle offre des capacités que Ceph n’a tout simplement pas : gestion avancée des métadonnées, tiering intégré, AFM pour la fédération…. Si tu as des charges de travail de calcul haute performance, de supercalculateur ou d’IA à une échelle sérieuse, Storage Scale a de solides arguments techniques pour se justifier.

Les performances revendiquées par IBM Fusion HCI sont impressionnantes : accélération de 90x sur les requêtes S3 avec mise en cache locale, performances équivalentes à celles de Databricks Photon à 60 % du coût, etc.

Cependant, il vaut toujours la peine de se poser la question suivante : quelle est la part de cette performance qui relève de la technologie propriétaire et quelle est celle qui relève simplement d’un matériel bien dimensionné dans la bonne configuration ? Ce n’est pas une critique, c’est une question légitime que tout architecte devrait se poser avant de prendre une décision.

Dans le cas de Fusion SDS, tu achètes Ceph avec la valeur ajoutée du packaging, de l’intégration OpenShift et du support d’entreprise IBM. Pour de nombreuses organisations, cela a une réelle valeur.

Red Hat Ceph Storage : le standard de l’entreprise

Red Hat Ceph Storage continue d’être la distribution de choix pour les entreprises. Ils offrent 36 mois d’assistance à la production et 24 mois d’assistance étendue en option. Le produit est solide et bien intégré.

Ce que tu achètes en réalité, c’est

  • Paquets testés et certifiés
  • Assistance aux entreprises 24 heures sur 24, 7 jours sur 7
  • Cycles de vie prévisibles
  • Intégration d’OpenShift

Cela en vaut-il la peine ? Cela dépend de votre contexte. Si ton organisation a besoin d’un contrat d’assistance pour respecter la conformité ou simplement pour dormir tranquille, probablement oui. Et nous serions heureux de t’aider dans ce domaine. Mais si tu as l’équipe technique pour exploiter Ceph en amont, c’est une décision qui mérite d’être analysée.

SUSE : une leçon sur l’enfermement des fournisseurs

Voici une histoire qui mérite réflexion : SUSE a complètement quitté le marché des entreprises Ceph. Leur produit SUSE Enterprise Storage (SES) a atteint la fin du support en janvier 2023. Après avoir acquis Rancher Labs en 2020, ils ont pivoté vers Longhorn pour le stockage natif de Kubernetes.

Si tu étais un client SES, tu t’es retrouvé orphelin. Tes options étaient de migrer vers Red Hat Ceph Storage, Canonical Charmed Ceph, community Ceph, ou de trouver un partenaire spécialisé pour t’aider dans la transition.

Il ne s’agit pas d’une critique à l’égard de SUSE ; les entreprises pivotent en fonction de leur stratégie. Mais c’est un rappel que le contrôle de ton infrastructure a une valeur qui n’apparaît pas toujours dans le coût total de possession.

Pure Storage et NetApp : l’approche des appliances

Pure Storage a créé une catégorie appelée “Unified Fast File and Object” (UFFO) avec sa famille FlashBlade. Matériel impressionnant, performances constantes, expérience utilisateur soignée. Son FlashBlade//S R2 évolue jusqu’à 60 Po par cluster avec des modules DirectFlash de 150 To.

NetApp StorageGRID 12.0 met l’accent sur l’IA avec des améliorations de débit de 20x via une mise en cache avancée et la prise en charge de plus de 600 milliards d’objets dans un seul cluster.

Les deux sont des solutions solides qui rivalisent avec Ceph RGW dans le domaine du stockage d’objets compatibles S3. Les performances sont excellentes. La question que chaque organisation doit se poser est de savoir si la prime justifie le verrouillage du fournisseur pour son cas d’utilisation spécifique.

La question que personne ne pose : qu’est-ce que tu achètes vraiment ?

C’est ici que je mets mon chapeau d’ingénieur réfléchissant.

Ceph upstream est extrêmement stable. Il compte 20 versions à son actif. La Fondation Ceph comprend IBM, Red Hat, Bloomberg, DigitalOcean, OVHcloud et des dizaines d’autres. Le développement est actif, la communauté est forte et la documentation est abondante.

Alors, quand est-il judicieux de payer pour une distribution d’entreprise et quand ne l’est-il pas ?

Cela a du sens lorsque :

  • Ton organisation a besoin d’un contrat d’aide à la conformité ou d’une politique interne.
  • Tu n’as pas le personnel technique pour faire fonctionner Ceph et tu ne veux pas le développer.
  • Tu as besoin de cycles de mise à jour prévisibles et testés.
  • Le coût du temps d’arrêt est plus élevé que le coût de la licence.
  • Besoin d’une intégration spécifique avec les produits d’autres fournisseurs

Elle mérite une analyse plus approfondie lorsque :

  • La décision est basée sur “c’est ce que tout le monde fait”.
  • Personne n’a vraiment évalué les alternatives
  • La raison principale est que “le fournisseur nous a dit que l’open source n’était pas pris en charge”.
  • Tu disposes d’un équipement technique performant mais tu n’as pas investi dans sa formation.

Le vrai défi, c’est la connaissance. Ceph a une courbe d’apprentissage abrupte. Concevoir correctement un cluster, comprendre les cartes CRUSH, régler BlueStore, optimiser les groupes de placement… tout cela nécessite une formation sérieuse et une expérience pratique.

Mais une fois que tu as ces connaissances, tu as des options. Tu peux choisir judicieusement un fournisseur d’entreprise, en sachant exactement quelle valeur ajoutée tu achètes. Ou tu peux opérer en amont avec un soutien spécialisé. L’essentiel est de prendre une décision en connaissance de cause.

Démystifier les affirmations marketing

Une chose que je recommande toujours est de lire les benchmarks et les affirmations marketing avec un esprit critique constructif.

“Notre produit est 90x plus rapide” – Par rapport à quelle base de référence ? Sur quelle charge de travail spécifique ? Sur quelle configuration du concurrent ?

“Des performances équivalentes à celles de [concurrent] à 60 % du coût” – cela inclut-il le coût total de possession (TCO) ? les licences, l’assistance, la formation, le personnel ?

“Solution certifiée de niveau entreprise” – qu’est-ce que cela signifie exactement ? Parce que Ceph en amont est également de niveau entreprise au CERN, chez Bloomberg et dans des centaines de télécoms.

Je ne dis pas que ces affirmations sont fausses. Je dis que le contexte est important. En réalité, les performances du stockage distribué dépendent fortement de:

  • Conception correcte des clusters (domaines de défaillance, groupes de placement).
  • HW approprié (réseau 25/100GbE, NVMe avec protection contre la perte de puissance).
  • Configuration du système d’exploitation (IOMMU, gouverneurs de CPU)
  • Réglage spécifique à la charge de travail (osd_memory_target, paramètres bluestore)

Un cluster Ceph bien conçu et géré par des personnes expérimentées peut atteindre des performances impressionnantes. Le benchmark Clyso a atteint 1 TiB/s avec 68 serveurs Dell PowerEdge. IBM a démontré plus de 450 000 IOPS sur un cluster Ceph à 4 nœuds avec 24 NVMe par nœud.

Parfois, cette estampille “solution certifiée” que tu vois sur une fiche technique est, au fond, un logiciel libre avec une configuration experte, un matériel bien dimensionné et beaucoup de tests. Cela a de la valeur, mais il est bon de le savoir.

Une décision intelligente : décider en s’informant

Après 15 ans dans ce secteur, ma conclusion est qu’il n’y a pas de réponse unique. Ce qu’il y a, ce sont des décisions éclairées.

Pour certaines organisations, une solution d’entreprise packagée est exactement ce dont elles ont besoin : une assistance garantie, des temps de cycle prévisibles, une intégration validée et la tranquillité d’esprit d’avoir un fournisseur responsable. IBM Fusion avec Storage Scale est un excellent choix pour le calcul intensif. Red Hat Ceph Storage est une solution solide pour tous ceux qui veulent une solution Ceph soutenue par l’entreprise.

Pour les autres organisations, Ceph en amont avec un support et une formation spécialisés offre des avantages significatifs :

  1. Gouvernance de la fondation: Ceph est un projet de la Fondation Linux avec une gouvernance ouverte. MinIO ne peut pas se produire.
  2. Communauté active: des milliers de contributeurs, des versions régulières, des bugs corrigés rapidement.
  3. Flexibilité: c’est ton cluster, ta configuration. Si demain tu décides de changer de partenaire d’assistance, tu ne perds rien.
  4. Coût total de possession transparent: Le logiciel est gratuit. Tu investis dans le matériel et les connaissances appropriés.
  5. Contrôle des versions: Tu mets à jour quand cela te semble logique, et non pas quand le fournisseur sort la prochaine version packagée.

Le dénominateur commun dans les deux cas est la connaissance. Que tu achètes une solution d’entreprise ou que tu déploies en amont, une compréhension approfondie de Ceph te permet de prendre de meilleures décisions, de mieux négocier avec les fournisseurs et de résoudre les problèmes plus rapidement.

Où trouver ces connaissances ?

Ceph est complexe. Mais il existe des chemins clairs :

La documentation officielle est très complète et s’est beaucoup améliorée. Le blog Ceph propose d’excellents approfondissements techniques.

Cephalocon est la conférence annuelle où tu peux apprendre de ceux qui exploitent Ceph à une échelle réelle (Bloomberg, CERN, DigitalOcean).

Une formation structurée avec des laboratoires pratiques est le moyen le plus efficace d’acquérir de réelles compétences. Tu n’apprends pas Ceph en lisant des diapositives ; tu l’apprends en cassant et en réparant des clusters.

L’assistance technique L3 assurée par des personnes qui vivent Ceph tous les jours te sort du pétrin quand les choses se compliquent en production. Parce que c’est le cas. Chez SIXE, nous avons passé des années à former des équipes techniques à Ceph et à fournir une assistance L3 à des organisations de tous types : celles qui opèrent en amont, celles qui utilisent des distributions d’entreprise et celles qui évaluent les options. Notre programme de formation Ceph couvre tout, de l’architecture de base aux opérations avancées, avec de véritables laboratoires pratiques. Et si tu as déjà Ceph en production et que tu as besoin d’une véritable assistance technique, notre support technique spécialisé est conçu exactement pour cela.

Nous venons également de lancer un programme de certification avec des badges sur Credly pour que ton équipe puisse démontrer ses compétences de manière tangible. Parce que dans ce secteur, “être Ceph” ne signifie pas la même chose pour tout le monde.

Badge de certification de l'administrateur SIXE CEPH - Administration du stockage Ceph d'entrée de gamme Badge de certification SIXE CEPH Advanced Administrator - Niveau avancé d'administration du stockage Ceph Badge de certification SIXE CEPH Production Operations - Niveau expert en Ceph Production Operations

Conclusions pour 2026

  1. MinIO est mort pour une utilisation sérieuse. Cherche des alternatives. Ceph RGW, SeaweedFS, ou même le fork OpenMaxIO si tu es courageux.
  2. Comprends ce que tu achètes. Il y a des cas où une solution d’entreprise packagée apporte une réelle valeur ajoutée. Il y en a d’autres où tu paies principalement pour un logo et une configuration que tu pourrais reproduire.
  3. Ceph en amont est mature et prêt pour la production. Bloomberg, DigitalOcean, le CERN et plus de 320 projets de télécommunications ne peuvent pas tous se tromper.
  4. Le véritable coût du stockage distribué est la connaissance. Investis dans une formation et un soutien de qualité, quelle que soit l’option choisie.
  5. Le contrôle de ton infrastructure a de la valeur. Demande aux clients de SUSE SES comment cela s’est passé lorsque le fournisseur a décidé de changer de cap.
  6. La gouvernance du projet compte autant que la technologie. Open Foundation > entreprise avec un produit open source.

2026 semble intéressant. FastEC va changer l’équation du codage par effacement. L’intégration avec l’IA et la ML continuera de pousser à plus de performance. Et l’écosystème des fournisseurs continuera d’évoluer avec des propositions qui méritent une évaluation sérieuse.

C’est à toi de décider. C’est la seule chose importante.

SIXE