Singe du chaos et chaîne d'approvisionnement de Netflix

J'ai récemment eu une conversation avec Carlos Crespo, directeur de l'exploitation de la société mère de Zara, Inditex, dans laquelle il a mentionné un outil logiciel créé par Netflix il y a plus de dix ans pour institutionnaliser la résilience du système. Le nom est accrocheur, et pour les leaders de la chaîne d'approvisionnement qui tentent de réinventer leurs réseaux d'approvisionnement en période de turbulences, il est irrésistible. Et pourtant, un GoogleGOOG
la recherche de "singe du chaos de la chaîne d'approvisionnement" a donné exactement une citation, à partir de 2012.

Pourquoi n'appliquons-nous pas cette idée à la résilience de la chaîne d'approvisionnement ?

Qu'est-ce que Chaos Monkey ?

Il s'agit d'un outil logiciel, et plus largement, un principe d'ingénierie qui arrête de manière aléatoire des parties d'un système complexe obligeant les opérateurs à récupérer en direct. Un peu comme un exercice d'incendie surprise, mais quotidien, et de manière aléatoire. L'idée est que devenir bon pour résoudre rapidement les problèmes du système est un processus d'apprentissage qui devrait bénéficier d'une courbe d'apprentissage de plus en plus accentuée.

L'histoire raconte comment Netflix a fait évoluer son activité de streaming sur Amazon Web Services tout en passant de l'expédition de DVD aux portes des clients. À première vue, c'est une approche logique de la planification de la redondance du système, comme ce que vous attendez de la NASA, mais en pratique, elle exploite une norme culturelle de Netflix qui permet aux contributeurs individuels de résoudre leurs propres problèmes. Comme relaté dans "Ingénierie du chaos” un livre de 2020 de Casey Rosenthal et Nora Jones qui ont été les pionniers de la pratique chez Netflix, cela se résume à cinq principes :

  • Construire une hypothèse autour du comportement en régime permanent
  • Variez les événements du monde réel
  • Exécuter des expériences en production
  • Automatisez les expériences pour qu'elles s'exécutent en continu
  • Minimiser le rayon de souffle

Le mélange de culture et de processus chez Netflix est important car il a favorisé et exploité une approche open source de résolution de problèmes, tout en tournant systématiquement la roue des arrêts aléatoires pour accélérer l'apprentissage au sein de l'équipe élargie.

Résilience de la chaîne d'approvisionnement et ingénierie du chaos

Transformation numérique dans la chaîne d'approvisionnement a été chaud cette année parce qu'il aide les chaînes d'approvisionnement à soutenir de nouveaux modèles commerciaux et à se diriger vers des opérations durables (voir étude BCG X), mais aussi parce qu'il promet de la « résilience ». Malheureusement, les applications pratiques de la transformation numérique pour la résilience de la chaîne d'approvisionnement se résument encore généralement à des plates-formes pour une meilleure "visibilité", soutenues par un tas de tactiques traditionnelles comme la mise en mémoire tampon des stocks et le double approvisionnement. Cette approche repose sur une autre couche de travail analytique sur temps de récupération par David Simchi-Levi au MIT, et une vague de simulations utilisant des jumeaux numériques. Tout cela a l'air génial, mais ce qui manque, c'est un moyen systématique d'expérimenter une véritable défaillance de la chaîne d'approvisionnement pour apprendre comment mieux récupérer dans la pratique.

Application de Chaos Monkey aux chaînes d'approvisionnement

Les médecins prêtent le serment d'Hippocrate avant de nous ouvrir, y compris le fameux "d'abord ne pas faire de mal". Ce n'est pas une mauvaise idée pour quiconque applique les principes de Chaos Monkey aux chaînes d'approvisionnement, ce qui implique d'éteindre au hasard une vraie machine quelque part. Ce n'est pas trivial, et pour autant que je sache, cela ne se produit encore nulle part.

  • Le premier principe cité ci-dessus dit de se concentrer sur les sorties du système plutôt que sur les attributs internes. Vérifiez que le système fonctionne au lieu d'essayer de comprendre pourquoi il fonctionne.
  • Le deuxième principe dit de casser diverses choses de manière réaliste. Pas besoin de simuler une guerre thermonucléaire mondiale, il suffit d'éteindre un interrupteur ou de perdre une commande et d'apprendre quelle solution fonctionne le mieux.
  • Le troisième principe dit que le meilleur endroit pour apprendre est en production. L'apprentissage par la pratique est préférable à l'apprentissage par simulation - c'est-à-dire que les jumeaux numériques sont formidables, mais ils ne suffiront peut-être pas à créer une culture de résilience.
  • Le quatrième principe institutionnalise les principes du singe du chaos car il permet de faire évoluer le processus d'expérimentation, ce qui vous amène à une courbe d'apprentissage plus abrupte. Utilisez la science des données sur la lutte contre les incendies.
  • Enfin, minimisez le rayon de souffle. Cela signifie « ne pas nuire » et se traduit par une sorte de mise en mémoire tampon (inventaire, délai, expédition accélérée) pour empêcher les clients de ressentir votre expérience. Apprenez à gérer les explosions contrôlées.

On pourrait soutenir que les trois dernières années de covid, guerre, agitation ouvrière, et la tourmente économique a été une grande course à vide pour tout le monde. La leçon de Netflix était que ce type de crise n'est pas seulement quelque chose à planifier, mais quelque chose à maîtriser en tant que fait permanent de la vie.

La tempête parfaite peut ne jamais finir, alors peut-être devrions-nous apprendre à vivre avec.

Source : https://www.forbes.com/sites/kevinomarah/2022/12/22/netflix-chaos-monkey-and-supply-chain/