mercredi, 12 octobre 2011 20:47

BlackBerry Blackout

Écrit par
Évaluer cet élément
(0 Votes)

Depuis lundi 10 octobre 2011 à 15h30 (heure de Paris), les utilisateurs de BlackBerry de plusieurs continents observent des problèmes de réception d'e-mails et de connexion Internet en raison d'une méga panne chez RIM.

La méga panne

La panne a été annoncée lundi 10 octobre 2011 à 15:42 (heure de Paris) par le fabricant du BlackBerry, Research In Motion (RIM) via un message depuis son compte Twitter BlackBerry UK : "Des utilisateurs en zone EMEA (Europe, the Middle East and Africa) observent des problèmes. Nous recherchons la cause et nous vous présentons nos excuses pour les désagréments occasionnés.". J'ai moi-même observé l'incident à 15:29 : à partir de ce moment-là, je n'ai plus été capable de recevoir d'e-mails, ni de surfer ou d'utiliser les applications Twitter ou Facebook depuis mon BlackBerry. Le problème semble toucher plusieurs continents : l'Europe, le Moyen-Orient, l'Afrique, l'Inde et même le Brésil et depuis mercredi les Etats-Unis. Le Financial Times indique que la moitié des utilisateurs BlackBerry ont été touchés soit entre 30 et 40 millions de personnes (sur 70).

3ème jour de panne

Mon message envoyé à 15h29 arrive finalement le lundi soir à 23h49, ce qui nous donne une panne d'une durée de 8h20. Mais la panne n'est pas résolue pour autant car les e-mails arrivent et partent au compte-goutte. La panne persiste ce mercredi 12 octobre et nombre d'utilisateurs BlackBerry ne reçoivent toujours pas leurs e-mails correctement.

Un commutateur de cœur de réseau en panne...

Le site de RIM à Slough (Royaume-Uni)Plusieurs sources parlent de pannes de serveurs suite à un problème d'alimentation électrique sur le datacenter de RIM situé à Slough au Royaume-Uni, à 35 km à l'ouest de Londres (photo ci-contre) mais un autre datacenter aurait dû prendre le relai.

Par ailleurs, dans un communiqué envoyé à l'AFP, RIM explique mardi la cause de la panne : "Les retards affectant la messagerie texte et le navigateur internet des usagers de BlackBerry en Europe, au Moyen-Orient, en Afrique, en Inde, au Brésil, au Chili et en Argentine ont été causés par la défaillance d'un commutateur de cœur du réseau dans l'infrastructure de RIM".

 

... et un secours inadapté

Un commutateur de cœur de réseau a forcément un secours me direz-vous. Oui, sauf que RIM précise : "Bien que le système soit conçu de manière à réorienter le trafic vers un commutateur de secours, ce système de secours n'a pas fonctionné comme lors d'essais antérieurs. Par conséquent, un gros encombrement de données s'est créé et nous travaillons maintenant à l'éliminer et restaurer le service normal aussi vite que possible."

Les questions que pose cet incident

L'explication de RIM pose d'emblée une première question : comment expliquer qu'un seul commutateur de cœur de réseau puisse entraîner une panne quasi-mondiale ? Si ce commutateur est localisé dans un datacenter au Royaume-Uni (par exemple), comment expliquer que sa défaillance engendre des problèmes en Inde ou au Brésil ? Sommes-nous en présence de ce que je me risque à appeler un "SPOF (Single Point of Failure) mondial" ? Si le problème vient d'un commutateur, comment expliquer que les e-mails arrivent tout de même mais avec du retard ? Où sont stockés ces e-mails ?

La panne de RIM montre aussi que l'on a sans doute dévoyé l'idée d'origine d'Internet. Internet multiplie les chemins pour augmenter la résilience. Mais, certaines entreprises ont préféré se mettre "en coupure" pour fournir des services différenciés et capter plus de valeur ajoutée. RIM en est un exemple caricatural. Quand on achète un BlackBerry chez SFR ou Vodafone UK, on pense acheter un terminal à RIM et un service à un opérateur télécom. Les choses sont visiblement plus complexes et ce blackout montre la dépendance voire l'impuissance des opérateurs. Malheureusement, on peut citer bien d'autres exemples d'entreprises qui ont un peu trop tiré la couverture de leur côté. Quelles seraient les conséquences d'une panne chez Apple pour la myriade d'applications iPhone ? Que se passerait-il pour nombre d'entreprises si le moteur de recherche de Google devenait fou ? Et que dire de la dépendance d'un nombre croissant d'entreprises vis-à-vis des fournisseurs de cloud ?

La communication de crise doit également être dirigée vers les clients. Comment expliquer que les utilisateurs de BlackBerry n'aient reçu aucun message pour les informer de la panne ? Et que dire de cette annonce prématurée de RIM qui annoncé dans la soirée de lundi aux Etats-Unis que "tous les services fonctionnent normalement"... Il a fallu attendre mercredi pour que RIM se décide enfin à publier une page d'information officielle sur la panne du BlackBerry (la version anglaise est plus complète) avec un message de la DSI de RIM Robin Bienfait.

Les conséquences

RIM avait imposé le BlackBerry, notamment sur le marché des professionnels, par une réputation de qualité et de fiabilité. L'absence d'un plan de secours efficace et suffisamment testé remet en cause cette réputation et risque d'être très préjudiciable en terme d'image. Lorsqu'il s'agira de changer de portable, de nombreux utilisateurs risquent de voter avec leurs pieds. De plus, cet événement arrive au plus mauvais moment pour RIM qui souffre de la concurrence de l'iPhone et des téléphones Android. La question de l'indemnisation des clients par les opérateurs est également posée alors que deux opérateurs de Dubaï (Du et Etisalat) ont déjà annoncé un remboursement pour leurs clients. Enfin, certains actionnaires de RIM comme la banque Jaguar Financial Corporation, demandent clairement la démission des deux co-PDG, James Balsillie et Mike Lazaridis.

Lu 11669 fois
Serge Baccou

Serge Baccou est Directeur Associé d'Alterest. Il est en charge des services Continuité Informatique, Cloud Consulting et Management de Transition.