Transcription d'une vidéo de Chat Sceptique: L'erreur Excel qui a coûté la vie à 1500 personnes 💀
—
by 2f1cafc
Ceci est une tentative de transcription d'une vidéo de Chat Sceptique:
https://www.youtube.com/watch?v=VubMw46DK0U
donc je cherche des corrections où la transcription ne se conforme pas à la vidéo (sauf cette introduction - là toutes corrections sont bienvenues :-) ).
Merci à Chat Sceptique pour la vidéo très intéressante !
===
Je vais te raconter Bombou le petite histoire d'une catastrophe statistique. Nous sommes fin deux mil vignt au Royaume Uni et il se passe plein de trucs. Le trois Octobre, par exemple, trente-deux millimetres de pluie, pardon, un point vignt-quatre inches de pluie, tombe sur tout le pays en moyenne, ce qui représente assez d'eau pour remplir le Loch Ness en Ecosse. Pour mettre ça en contexte le Loch Ness contient davantage d'eau que tous les lacs d'Angleterre réunis. C'est un très grand lac.
00:30
Le lendemain un scandale éclate, alors que le pays suit nervousement l'évolution des contaminations au corona virus il est révelé que des milliers de cas environ six mil au total ont été oublié de stat officiel par l'agence de santé publique anglaise le jour précédent. Sur ce graphique, réalisé par The Guardian 00:50 l'un des meilleurs journaux au monde, on voit que l'ajout des cas manquants change notablemment le percéption de l'épidémie. En clair Bombou, on passe d'une épidémie qui semblait se stabiliser à une épidémie dont on est occupé de perdre le contrôle. Et comme si ça ne suffisait pas on se met à craindre que les seize mil personnes concernées n'auraient pas été averties à temps de leur positivité. C'est-à-dire que on craint que beaucoup de ces gens auraient continué de se mélanger aux non-contaminées en pensant que tout allait bien causant de nouvelle contamination à grande éschelle.
01:23
Deux économistes de l'Université de Warwick publieront d'ailleurs un mois plus tard une éstimation de cent vignt cinq mil contaminations potentielles et mil cinq cent morts causés par ces seize mil personnes. Une éstimation néanmoins rejetée par l'agence de santé anglaise. Alors question Bombou - que s'est-il passé ? Et bien il s'est très vite avéré la faute est à imputer à Excel, ou plutôt à son mauvaise usage.
01:50
Excel c'est un logiciel tableur de trés loin le logiciel de ce type le plus connu au monde et qui se présente sous forme d'une grille des cellules apparemment infinie; chaque cellule pouvant typiquement contenir un nombre ou un peu de texte. 02:05 Leur usage favori du grand public c'est comme lieu de stockage de données. Par exemple Bonbou je pourrait y noter année après année ton poid au fur et en mesure des visite chez le vetinnaire ou encore le temps que je passe jour après jour à regarder des vidéos de chats mignons. Le souci c'est que la grille de cellules apparemment infinie ne l'est bien sûr pas. Dans le cas de Excel les limites sont aujourd'hui d'un million de lignes et seize mil colonnes. C'est énorme, hein ? Si on suit la règle traditionnelle en stat d'ultiliser une ligne par personne et une colonne par variable comme le poids de la personne sa pression sanguin ou si il ? au positive au corona virus, on a donc assez de places pour encoder les données d'un million de personnes selon seize mil variables différentes. Mais cette limite n'aurait pas toujours été aussi généreuse. Excel existe depuis plusieurs décinnées et pendant toute une période de son histoire, il était pas possible d'avoir plus de soixante six mil lignes et deux cent cinquant six colonnes par par grille.
03:08
Et c'est là que les ennuis commencent. L'agence de santée publique anglaise ben apparemment elle utilise une version d'Excel completement dépassée au fur et en mesure que le pandemie a evolué que les contaminés ont commencé ? à se compter en centaines, en milliers puis en dizaines de milier la capacité maximal de leur version d'Excel a été atteinte et personne ne s'en est rendu compte pendant plursieurs jours. Bref, une histoire navrant mais surtout un fiasco qui a clairement pu être évitée.
03:36
Voici Bonbou le deux grands leçons que moi en tant que statistician je veux en tirer.
On a tendence à l'oublier mais les outiles que nous utilisons ont toujours leur limite, et il est important les connaître, même si ce n'est que vaguement. Pour faire des stats mon logiciel tableur favorie à moi c'est JAMOVI. ?C'est un? logiciel relativement nouveau, cent pourcent gratuit et qui a très rapidement gangé en popularité en raison de sa fiabilié et de sa simplicité d'utilisation. 04:06 J'ai même une amie Coraline qui a créé un chouette bouquin le concernant intitulé sobrement JAMOVI pour les statistiques. En principe il n y a pas de limite au nombre de ligne que le logiciel peut gérer. C'est en tout cas que m'a certifier son cofondateur. C'est-a-dire que si ton ordinateur est suffisemement puissant Bombou, tu peux utiliser JAMOVI pour manipuler des milliards de ligne. Sauf que mes testes sur ce point n'ont pas été très concluants. 04:33 La version deux point deux du logiciel réussit à chargé un jeu de données d'un million de lignes et dix colonnes sans trop de mal. Mais plaint systématiquement face a des jeux de données de dix colonnes et dix million de lignes ou plus. Vu que j'ai testé ça sur le même ordinateur surpuissante que j'utilise pour monter mes vidéos, et que je sais et en principe capable bien plus de données que ça je doit avouer être un peu déçu. Mais bon, ce que je voulais c'est connaître la limite, maintenant je sais.
04:59
Apropos des colonnes Jonaton a été en honnête avec moi. C'est limité à mil, c'est-à-dire dix fois moins qu'Excel. 05:06 Mes testes l'ont confirmé dans sens où si'il est bien possible d'importer des jeux de données avec plus de mil colonnes dans JAMOVI l'interface du logiciel ne permet en pratique d'interagir qu'avec les mil premières.
05:19
Le seconde leçon a retenir de l'histoire navrant du jour Bonbou est je crois ceci. Tenir à minimum à jour ces logiciciels est plus généralement son ordinateur et smartphone c'est la base. D'une part pour disposer des outiles les plus performants du moment et aider à repousser les frontiers du possible, mais aussi pour de simple raison de sécurité. N'oublie jamais Bombou, les seize mil cas de Corona Virus passés à l'attrappe fin deux mil vignt au Royaume Uni. Si tu choissis une carrière dans le science, et bien je suis convaincu cela contribuera à faire de toi une meilleur scientifique.
Bravo ! Impressionnant ! Je suppose que vous étudiez le français depuis au moins dix ans et que vous habitez en milieu francophone.
Je n'ai pas tellement corrigé l'orthographe des nombres car elle est soumise à des conventions d'autant plus obscures qu'il en existe plusieurs selon les époques et les écoles. Si ça vous intéresse, jetez un œil à ce site qui vous dira tout.