Vous êtes en voiture. Le tableau de bord indique votre vitesse, le niveau d’essence, l’huile. Tout est sous contrôle. Tout d’un coup, un voyant rouge s’allume. Panique. Faut-il ralentir ? Faut-il s’arrêter ? C’est toute l’histoire du tableau de bord.
Showing posts with label graphs. Show all posts
Showing posts with label graphs. Show all posts
Saturday, 15 September 2018
Le tableau de bord, un outil indispensable pour la gestion de projet
September 15, 2018
analyse, controle de gestion, dashboard, decisions, graphs, indicateurs, KPI, outil de mesure, tableau de bord
No comments
Ecrit par
Vous êtes en voiture. Le tableau de bord indique votre vitesse, le niveau d’essence, l’huile. Tout est sous contrôle. Tout d’un coup, un voyant rouge s’allume. Panique. Faut-il ralentir ? Faut-il s’arrêter ? C’est toute l’histoire du tableau de bord.
Vous êtes en voiture. Le tableau de bord indique votre vitesse, le niveau d’essence, l’huile. Tout est sous contrôle. Tout d’un coup, un voyant rouge s’allume. Panique. Faut-il ralentir ? Faut-il s’arrêter ? C’est toute l’histoire du tableau de bord.
Depuis les années 2000, on parle de mega-données en France, ou plus généralement de big data. Avec l’effet boule de neige, cette explosion des données a entrainé une multiplication des informations, des analyses. Toutes ces informations, si elles sont notre quotidien, peuvent compliquer l’exercice de synthèse. En revanche, bien analysées, ces données peuvent être utiles et nous aider à améliorer les processus de décision, à rendre plus efficaces les opérations des entreprises. Malheureusement, dans de nombreux cas, on observe une difficulté à analyser les chiffres, à focaliser et à rester en accord avec les objectifs stratégiques.
En voiture, le tableau de bord informe le conducteur du fonctionnement du véhicule. Les voyants de signalisation renseignent sur le fonctionnement général de la voiture, les témoins d’alerte comme le niveau de carburant, ou l’usure des plaquettes de frein, permettent d’anticiper les incidents. Enfin, les témoins d’alarmes, comme l’icône de défaillance des freins, imposent au conducteur de s’arrêter immédiatement. En gestion de projet, le concept est le même. Pour améliorer l’efficacité de la prise de décision, on ne le dira jamais assez, il faut mettre en place un tableau de bord. Plus facile à dire qu’à faire !
Dans son ouvrage Information Dashboard Design paru en 2006, Stephen Few déclare :
« Un tableau de bord est une représentation visuelle des informations les plus importantes nécessaires pour atteindre un ou plusieurs objectifs ; regroupées et disposées dans un seul écran pour une consultation rapide ».
En clair, il s’agit de mettre en place un système pour piloter de manière globale. Les indicateurs doivent être évocateurs et permettre de diriger une entreprise, ou un projet.
Si l’on reprend la définition de Stephan Few, on peut dans un premier temps, s’arrêter sur le caractère visuel du tableau de bord. En effet, cet outil résume la situation en un coup d’œil. La page doit être visuelle et doit attirer l’attention du lecteur sur des points essentiels au bon déroulement du projet. Il est recommandé d’utiliser sans limites, les couleurs, les pourcentages, les diagrammes ou les icons. Il vous faut rendre la page agréable à l’œil pour favoriser l’adoption des utilisateurs. Genius Project propose un cadran avec des symboles et couleurs de façon à tout de suite voir la progression du projet, et les statuts. L’utilisateur peut aussi voir si le budget est sous contrôle ou si les délais sont respectés.
La définition de Stephan Few évoque aussi l’importance des informations. Nous touchons là, un point sensible. Trop de tableaux de bord présentent des chiffres et résultats, les uns à coté des autres, et très obscures pour l’utilisateur. Le premier piège lors de la création d’un tableau de bord, c’est de proposer trop d’indicateurs. Deux indicateurs précis et concrets ont en fait plus de valeur que 10 chiffres complexes et dont on ne sait pas tirer les conclusions. Pour créer un tableau de bord efficace et utile, il faut donc chercher des indicateurs pertinents. Ceux-ci doivent être rapidement compréhensibles et en quantité réduite.
On recommande souvent de ne pas avoir plus de 10 indicateurs. Au delà, le tableau devient trop complexe. Le choix de ces indicateurs est important. Il est essentiel pour prendre les bonnes décisions et réduire les délais de décisions. Des indicateurs bien choisis permettent de savoir exactement de quoi on parle et de déceler les éventuels problèmes rapidement.
L’idée de l’outil réside dans le fait de montrer la situation actuelle, par rapport aux objectifs stratégiques. Les informations doivent donc être mises à jour. Les pourcentages montrent de manière claire les tâches ou étapes qui restent à réaliser pour atteindre les objectifs. Les couleurs permettent de différencier rapidement les domaines en «rouge » ou à problème des domaines en « vert ».
Plus un tableau est personnalisé, simple à lire et intuitif, plus il sera utilisé. Convivial, il motivera les utilisateurs et améliorera la productivité.
Pour avoir des informations plus détaillées sur un projet, le collaborateur peut cliquer sur un paramètre et creuser pour s’informer. Le tableau de bord reste global, montre les tendances et vise à garder les objectifs stratégiques en vue.
Un dernier conseil. Évitez de le modifier tout le temps. Cela évitera aux utilisateurs de devoir tout le temps vérifier le contenu et la signification des indications. Pas de modifications intempestives donc, mais des mises à jour régulières !
Bonne route !
Thursday, 13 September 2018
Comment améliorer et fiabiliser le reporting de gestion
September 13, 2018
analyse, comptabilite, controle, gestion, graphs, presentation, processus, reporting, strategie
No comments
Ecrit par Caroline Selmer
Nous pouvons vous aider avec votre projet. Il suffit de cliquer ici si vous voulez en savoir plus sur nous, ou entrer en contact.
Le reporting met en évidence les points clés et les objectifs délégués aux différentes entités d’un groupe. C’est un outil de contrôle à postériori des responsabilités déléguées, plutôt qu’un support pour l’action. Il doit répondre aux besoins des actionnaires et des partenaires, ainsi qu’aux besoins des actionnaires et des décideurs.
Les principaux reproches fait au reporting, mettant en cause sa fiabilité, portent sur :
- La déficience de l’organisation
- L’indisponibilité de l’information
- Une insuffisance de communication et de coordination
- Des systèmes d’information non optimisés
Le reporting de gestion s’intègre dans le processus de consolidation des données. La qualité des informations et des analyses produites dans le reporting dépend de la bonne maîtrise et de la fiabilité des processus de remontée des informations et des mécanismes de consolidation.
Choisir un référentiel commun à la comptabilité et à la gestion
L’information réelle est systématiquement comparée à une référence : budget, année précédente, cible, concurrents sur le marché ou autre benchmark. Il est important de connaître chaque marché pour identifier les bons indicateurs et savoir les interpréter.
Mettre en place un manuel financier
La terminologie au sein d’un groupe doit être standardisée. L’information doit être définie de façon précise et être connue et partagée par tous. Un lexique des indicateurs financiers peut figurer à la fin du reporting, ou être mis à disposition en ligne afin de rappeler les définitions en cas d’oubli.
Organiser les niveaux de validation des résultats
Le reporting doit permettre de focaliser chaque niveau de responsabilité sur les chiffres clés sur lesquels il a un levier d’action : performance actuelle, estimation de la performance en fin d’exercice, moyens envisagés pour atteindre les objectifs ambitieux.
Mettre en place des outils intégrant contrôles et interfaces
L’outil doit permettre de sortir des informations justes et à l’heure, en évitant les reprises manuelles. Il doit être paramétré pour dégager des tendances, des prévisions par rapport à l’année précédente, au marché…
Effectuer des analyses détaillées systématiques
Le reporting doit alerter les responsables sur le maintien du bien-fondé des hypothèses initiales, sur les dérives significatives. Le reporting doit présenter des analyses de business et pas des analyses de données : présenter une vue globale du compte de résultat, pousser les analyses de marges par produit, client, pays, marques… afin de challenger les responsables opérationnels.
Thursday, 30 August 2018
Pourquoi vous ne comprenez rien aux chiffres…
August 30, 2018
analyse, dashboard, decisions, excel, graphs, KPI, mesurer, outil de mesure, piloter, planifier, ratios, reporting, strategie, tableau de bord
No comments
Pourquoi n’arrivez vous pas à comprendre les chiffres que vous recevez? Avouez-le, vous vous êtes déjà pris la tête pour comprendre un tableau de bord alors que vous n’êtes pas plus bête qu’un autre. Je me trompe? Alors pourquoi?
La réponse est simple: les chiffres que l’on vous donne à lire sont simplement inefficaces.
Je ne sais pas vous, mais je suis souvent effaré par la quantité d’informations chiffrées qu’une entreprise peut produire tous les jours.
Les managers reçoivent en permanence un flux de chiffres qui ferait rougir d’envie n’importe quel statisticien. C’est dingue qu’à l’heure de la business intelligence, de la multiplication des logiciels facilitant l’accès aux chiffres et alors que les système d’information n’ont jamais été aussi évolué, que les managers éprouvent encore -parfois- des difficultés à comprendre ce qu’ils lisent.
Mon avis sur la question? Si les décisionnaires n’aiment toujours pas les chiffres et ne les comprennent toujours pas…. c’est que le reporting est mauvais!
Soyez réaliste: beaucoup font semblant de comprendre ces tableaux, mais quand il s’agit de prendre des décisions, c’est une autre paire de manche!
Alors plutôt que de lire des données inutiles, autant se poser les bonnes questions…
Le reporting est mort…vive l’insight!
Faire du reporting pour faire du reporting, c’est inutile et dangereux. Un manager à besoin de deux choses et pas plus:
- Être rassuré et savoir que tout se passe bien.
- Comprendre comment faire mieux
et c’est tout.
Pour être rassuré, le reporting traditionnel doit faire place à des alertes. Les alertes à mettre en place peuvent être des alertes de perte de marché, de perte de revenu, de baisse sur un ratio de productivité… bref, tout le reste n’est que blabla.
Combien de rapports ne sont pas lus? Mais les rapports rassurent et les mentalités peuvent prendre du temps à changer.
par contre, procurer de l’insight, c’est ce qui parle aux managers
Procurer de l’insight, c’est fournir aux manager les leviers d’une bonne prise de décision en leur donnant les leviers sur lesquels ils pourront agir.
Rien de très compliqué. Le rôle de l’analyste à mon sens doit être orienté vers l’action. Il doit discuter (beaucoup) et réfléchir (encore plus).
Pour procurer de l’insight, il faut que l’analyste soit au centre de la réalité opérationnelle de la société. Il doit être de tous les meetings importants pour comprendre ce qui se passe dans le détail. Une fois cette information absorbée, il doit nourrir les discussions et répondre aux interrogations. Son travail d’analyste est de comprendre ce qui se passe et de se poser comme un soutien, un appui aux décideurs.
Voilà pourquoi vous ne comprenez pas les chiffres: tout simplement parce qu’ils vous sont inutiles à l’action et loin de vos préoccupations…
Saturday, 7 July 2018
Regardez les données comme un statisticien, moins le Ph. D
July 07, 2018
controleur, data, decisions, donnees, gestion, graphs, mesurer, outil de mesure, piloter, predictive, presentation, resultat, statistiques, strategie
No comments
Ecrit par
Kevin Purdy
Traduit par Vincent van Heesewijk
Nathan Yau est un candidat au doctorat en statistiques, mais les leçons les plus précieuses qu'il a apprises en analysant et en travaillant avec des données n'impliquent pas de mathématiques formelles. Voici comment il suggère de regarder des lignes, des graphiques et des chiffres pour trouver des choses intéressantes.
Yau
expose les compétences et les mentalités qui l'ont bien servi dans ses études
et analyses. Comme il le dit, il ne peut pas tirer de la hanche avec des
questions sur la taille de l'échantillon ou l'analyse formelle, mais il a
appris ce qu'il faut rechercher quand on regarde les données - que nous faisons
tous régulièrement, que ce soit dans des budgets mensuels ou des tableurs..
Deux de ses suggestions:
Voir la grande image
... Il est important de ne
pas trop se perdre avec des points de données individuels ou une petite section
dans un très grand ensemble de données. Nous l'avons vu dans le graphique de
récupération récent. Comme certains l'ont souligné, si nous prenions un peu de
recul et regardions un plus grand laps de temps, le contraste Obama / Bush ne
semble pas si choquant.
Demande le pourquoi?
... C'est la chose la plus importante que j'ai apprise: demandez toujours pourquoi. Quand vous voyez un point dans un graphique, vous devriez vous demander pourquoi il est là. Si vous trouvez une corrélation, vous devriez réfléchir à la question de savoir si cela a un sens ou non. Si cela a du sens, alors refroidissez, mais sinon, creuser plus profondément. Les chiffres sont excellents, mais vous devez vous rappeler que lorsque les humains sont impliqués, les erreurs sont toujours possibles.
Ce n'est pas une liste des 10 meilleurs ou
des hacks secrets - juste des conseils intelligents, et il vaut la peine de
regarder en arrière quand vous êtes vexé par un message caché sous tous les
nombres et lignes que vous voyez dans n'importe quel ensemble de données.
Nous pouvons vous aider avec votre projet. Il suffit de cliquer ici si vous voulez en savoir plus sur nous, ou entrer en contact.
SOURCE
Sunday, 1 July 2018
Comment choisir le meilleur tableau pour vos données
July 01, 2018
donnees, gestion, graphs, marketing, media, objectives, outil de mesure, piloter, planifier, presentation, resultat, utilisation
No comments
Ecrit par Alan Henry
Traduit par Vincent van Heesewijk
Les chiffres ne mentent pas, mais une mauvaise décision graphique rend extrêmement difficile de comprendre ce que ces chiffres signifient. Avant de mettre en place une autre présentation PowerPoint, assurez-vous que vous choisissez le bon type de graphique pour communiquer clairement les informations que vous souhaitez partager. Voici comment.
Pourquoi le type de graphique est-il important?
Lorsque
j'étais étudiant en physique - et encore une fois quand je travaillais dans un
laboratoire - j'ai appris que travailler et collecter énormément de données
était gratifiant, mais ces données sont aussi bonnes que la façon dont vous
pouvez communiquer ce que cela signifie. Il est facile de jeter vos données sur
un diagramme à barres dispersées ou à barres, de les glisser dans une
présentation, et de vous convaincre que vous allez faire l'explication, mais
c'est un raccourci terrible. Lorsque la présentation est terminée et qu'il ne
reste que vos diapositives, personne n'aura la moindre idée de ce que votre
graphique essayait de communiquer.
Le problème est qu'il y a tellement de
types de graphiques, de styles et de méthodes de présentation de données qu'il
peut être déroutant et difficile de choisir le bon. Les passionnés de données
comme le statisticien et informaticien Edward Tufte ont consacré leur vie à
aider les gens à apprendre à mieux présenter l'information, et voici quelques
conseils et outils inspirés par leur travail qui peuvent vous aider.
Tout d'abord, comprenez le message que vous essayez
de présenter avec vos données
Lorsque vous
créez un graphique, vous essayez de montrer l'une des quatre choses avec les
données que vous avez: une relation entre des points de données, une
comparaison de points de données, une composition de données ou une
distribution de données.
- Une relation tente de montrer une connexion ou une corrélation entre deux variables ou plus à travers les données présentées, comme la capitalisation boursière d'un titre donné au fil du temps par rapport à la tendance générale du marché.
- Une comparaison tente de définir un ensemble de variables en dehors d'un autre et d'afficher comment ces deux variables interagissent, comme le nombre de visiteurs de cinq sites Web concurrents en un seul mois.
- Une composition essaie de collecter différents types d'informations qui composent un ensemble et de les afficher ensemble, comme les termes de recherche que ces visiteurs ont trouvés sur votre site, ou combien d'entre eux provenaient de liens, de moteurs de recherche ou de trafic direct.
- Une distribution essaie de mettre en page une collection d'informations connexes ou non, simples pour voir comment elle corrèle, voire pas du tout, et comprendre s'il y a une interaction entre les variables, comme le nombre de bugs rapportés pendant chaque mois d'une beta.
Ensuite, sélectionnez le meilleur arrangement
Une fois que vous avez compris le message que vous essayez d'envoyer avec les données dont vous disposez, il est temps de sélectionner la meilleure méthode pour afficher cette information. Différents types de graphiques conviennent mieux aux différentes méthodes. Par exemple, les diagrammes de dispersion sont mieux utilisés pour afficher les distributions, alors que les diagrammes linéaires (essentiellement, les diagrammes de dispersion avec une tendance définie) sont mieux adaptés aux relations. Les diagrammes à secteurs fonctionnent bien lorsque vous essayez de communiquer une composition, mais faites des comparaisons ou des distributions médiocres (bien que Tufte soutiendrait qu'il n'y a pas de bon usage pour un graphique type camembert).
Cet organigramme de la méthode de
présentation extrême peut vous aider à sélectionner le meilleur type de
graphique pour le message que vous souhaitez envoyer. L'outil Sélecteur de
graphiques de Juice Analytics va encore plus loin: l'outil sélectionne
automatiquement les types de graphiques en fonction de vos sélections et
propose des modèles Excel et PowerPoint à télécharger qui vous permettent de
présenter vos données correctement..
Enfin, formatez votre graphique
Une fois
que vous avez sélectionné le bon type de graphique pour vos données,
assurez-vous de ne pas rendre un mauvais service à vos données en oubliant
certains conseils de conception de base. Tuez les lignes de la grille à moins
qu'elles ne soient absolument nécessaires, ou du moins qu'elles soient subtiles
afin qu'elles ne vous distraient pas des informations que vous essayez de
présenter. Assurez-vous que votre tableau est centré sur les données que vous
voulez présenter, que vos axes sont clairement étiquetés et que vos axes
comportent des unités si nécessaire, donc personne n'a à deviner ou à déduire
ce que vous essayez de dire. Rappelez-vous que votre objectif est que tout le
monde puisse trouver votre graphique, que vous soyez là pour en parler ou non,
et que vous compreniez l'information que les données tentent de communiquer..
Expérimenter avec de nouvelles méthodes de présentation
Toutes
ces suggestions vous aideront à démarrer, mais il n'y a pas de règles strictes
sur la façon dont les données doivent être présentées, à part cela, elles
doivent être claires, communicatives et parlent d'elles-mêmes. Si vous trouvez
que vous êtes restreint par des types de graphiques communs, alors ramenez-vous
à des techniques plus expérimentales. Il n'y a aucune raison de ne pas laisser
votre concepteur intérieur s'asseoir avec votre statisticien intérieur.
Ensemble, vous pouvez trouver des méthodes intelligentes et informatives pour
présenter l'information, et vous n'aurez pas à vous rabattre sur des diagrammes
à secteurs et des diagrammes à barres. fais le. Photo via XKCD.
Qu'est-ce que tu penses? Tenez-vous à des types de graphiques
spécifiques pour vos données ou créez-vous vos propres diagrammes à partir de
zéro? Partagez vos conseils dans les commentaires ci-dessous.
Nous pouvons vous aider avec votre projet. Il suffit de cliquer ici si vous voulez en savoir plus sur nous, ou entrer en contact.
Tuesday, 26 June 2018
Voici ce que les expressions «très probable» et «probablement pas» signifient pour différentes personnes
June 26, 2018
decisions, donnees, gestion, graphs, marketing, personnelle, piloter, presentation, strategie, surveillance
No comments
Ecrit par Nick Douglas
Traduit par Vincent van Heesewijk
À quel point «probablement» vous semble-t-il probable? Redditor zonination a demandé aux utilisateurs de l'interrogation subreddit / r / samplesize d'assigner des valeurs en pourcentage à une gamme de phrases courantes sur la probabilité, et de représenter graphiquement les résultats. La taille de l'échantillon est minuscule (seulement 46 répondants), mais les données semblent encore assez groupées pour être utiles - en plus elles correspondent généralement aux résultats de l'enquête qui l'a inspiré, une étude de 23 officiers de l'OTAN. Deux ans après leur enquête initiale, la zonation a redéfini les données sous la forme d'un magnifique «joyplot» (la Joy Division).
Le graphique ci-dessus est lissé. vous pouvez voir un graphique plus précis et plus bancal, ainsi que les données originales, sur la page GitHub du projet. Il y a quelques valeurs aberrantes (une personne étiquetée «probablement pas» comme étant 100%), mais la zonation indique que les valeurs aberrantes proviennent toutes du même répondant (elles auraient probablement dû être omises).Il y a aussi des données sur ce que signifient "quelques" ou "douzaines de" pour les gens, mais le graphique est sur une échelle logarithmique qui rend certaines réponses difficiles à interpréter. Bien sûr, les phrases ci-dessous ont été dépouillées du contexte qui pourrait impliquer des significations très différentes. "Certains Américains possèdent deux maisons" signifie évidemment quelque chose de différent "J'ai laissé quelques plats dans l'évier."
La principale conclusion est que les gens interprètent la même phrase de
manière très différente, donc quand vous avez besoin de communiquer une
probabilité ou un montant important, il est préférable d'utiliser un langage
concret et quantitatif, idéalement une gamme numérique réelle.
Nous pouvons vous aider avec votre projet. Il suffit de cliquer ici si vous voulez en savoir plus sur nous, ou entrer en contact.Tuesday, 19 June 2018
Comment mentir à soi-même et aux autres avec les statistiques
June 19, 2018
analyse, biais, data, decisions, donnees, gestion, graphs, presentation, reporting, resultat, sources, statistiques, surveillance
No comments
Ecrit par Eric
Ravenscraft
Traduit par Vincent van Heesewijk
L'utilisation abusive des statistiques est l'un des moyens les plus puissants de mentir. Normalement, nous vous enseignons comment éviter les erreurs d'interprétation des statistiques, mais savoir comment les nombres sont manipulés peut vous aider à repérer quand cela arrive. À cette fin, nous allons vous montrer comment faire en sorte que les données disent quoi que vous fassiez pour sauvegarder toute mauvaise idée que vous avez.
Collectez des exemples de
données qui ajoutent un biais à vos résultats
La
première étape de la création de statistiques consiste à déterminer ce que vous
voulez analyser. Les statisticiens appellent cela la «population». Ensuite,
vous définissez un sous-ensemble de ces données à collecter qui, une fois
analysées, doivent être représentatives de la population dans son ensemble.
Plus l'échantillon est grand et précis, plus vos conclusions peuvent être
précises.
Bien sûr, il existe quelques grandes façons
de bousiller ce type d'échantillonnage statistique, soit par accident ou
intentionnellement. Si les données d'échantillon que vous rassemblez sont
mauvaises, vous finirez avec de fausses conclusions, peu importe quoi. Il y a beaucoup de façons de gâcher vos
données, mais voici quelques-unes des plus importantes:
- Biais de sélection personelle: Ce type de biais se produit lorsque les personnes ou les données que
vous étudiez volontairement se mettent dans un groupe qui n'est pas
représentatif de l'ensemble de votre population. Par exemple, lorsque nous
demandons à nos lecteurs des questions comme «Quelle est votre application
de textos préférée?», Nous recevons seulement des réponses de personnes
qui choisissent de lire Lifehacker. Les résultats d'un sondage informel
comme celui-ci ne seront probablement pas représentatifs de la population
dans son ensemble, car tous nos lecteurs sont plus intelligents, plus
drôles et plus attirants que la moyenne des gens.
- Échantillonnage de commodité: Ce biais se produit lorsqu'une étude analyse les données disponibles,
au lieu d'essayer de trouver des données représentatives. Par exemple, un
réseau de nouvelles par câble pourrait interroger ses téléspectateurs au
sujet d'un candidat politique. Sans interroger les gens qui regardent
d'autres réseaux (ou ne regardent pas du tout la télévision), il est
impossible de dire que les résultats du sondage représenteraient la
réalité.
- Biais de non-réponse: Cela se produit lorsque certaines personnes d'un ensemble choisi ne
répondent pas à une enquête statistique, ce qui entraîne une modification
des réponses. Par exemple, si une enquête sur l'activité sexuelle
demandait «Avez-vous déjà trompé votre conjoint?» Certaines personnes
peuvent ne pas vouloir admettre l'infidélité, donnant l'impression que la
tricherie est plus rare qu'elle ne l'est.
- Sondages en accès libre: ce type de sondage
permet à quiconque de soumettre des réponses et, dans de nombreux cas, ne
vérifie même pas que les personnes ne soumettent une réponse qu'une seule
fois. Bien qu'ils soient communs, ils sont fondamentalement biaisés parce
qu'ils n'essaient pas de contrôler l'entrée de manière significative. Par
exemple, les sondages en ligne qui vous demandent simplement de cliquer
sur votre option préférée tombent sous ce biais. Bien qu'ils puissent être
amusants et utiles, ils ne sont pas bons pour prouver objectivement un
point.
Ce ne sont que quelques-unes des nombreuses
façons dont un échantillon peut être biaisé. Si vous voulez créer une
impression trompeuse, choisissez votre poison. Par exemple, les sondages en
libre accès sur les sites Web peuvent être utilisés pour «prouver» que le
candidat que vous aimez le mieux a remporté un débat ou que Undertale est le
meilleur jeu de tous les temps. La beauté des biais de l'échantillonnage est
que quelqu'un, quelque part prend un sondage non scientifique qui dira tout ce
que vous voulez. Donc, juste Google autour jusqu'à ce que vous trouviez un
sondage non scientifique que vous aimez, ou diable - créez votre propre.
Choisissez l'analyse qui soutien vos idées
Le quatuor
d'Anscombe montre quatre graphiques différents qui ont presque exactement les
mêmes sommaires statistiques.
Étant donné que les statistiques utilisent
des chiffres, il est facile de supposer qu'elles constituent une preuve
tangible des idées qu'elles prétendent soutenir. En réalité, la mathématique
derrière les statistiques est complexe, et l'analyser incorrectement peut
donner des conclusions différentes, voire totalement contradictoires. Si vous
vouliez tordre une statistique pour répondre à vos besoins, fudge les maths.
Pour démontrer les failles dans l'analyse
des données, le statisticien Francis Anscom a créé le quatuor d'Anscombe (voir
ci-dessus). Il se compose de quatre graphiques qui, lorsqu'ils sont affichés
sur un graphique, montrent des tendances très différentes. Le graphique X1
montre un diagramme de dispersion basique avec une tendance ascendante. X2
montre une tendance incurvée qui montait, mais qui descend maintenant. X3
montre une tendance plus faible vers le haut, mais avec une valeur aberrante
sur l'axe Y. X4 affiche des données parfaitement plates sur l'axe X, sauf une
valeur aberrante super haute sur les deux axes.
Voici où ça devient fou. Pour les quatre
graphiques, les affirmations suivantes sont vraies:
• La valeur x
moyenne est de 9 pour chaque ensemble de données
• La valeur y
moyenne est de 7.50 pour chaque ensemble de données
• La variance
pour x est 11 et la variance pour y est 4.12
• La corrélation entre x et y est de 0,816 pour
chaque ensemble de données
Si vous
avez seulement vu ces données sous forme de texte, vous pourriez penser que les
quatre situations étaient identiques. Par exemple, disons que vous avez un
tableau comme X1 qui montre les salaires des hommes dans votre entreprise au fil
des ans, et un comme X2 montrant les salaires des femmes à la même époque dans
la même entreprise. Si vous montrez seulement le texte, vous verriez qu'ils ont
fait le même salaire moyen! Cependant, si vous montrez les graphiques, les gens
verraient que les salaires des femmes étaient à la baisse pour une raison
quelconque.
Anscombe a suggéré que pour éviter d'induire les
gens en erreur, vous devriez toujours visualiser vos données avant de tirer des
conclusions et être conscient de la façon dont les valeurs aberrantes
influencent l'analyse. Il est difficile de rater une valeur aberrante sur un
graphique correctement tracé, mais ils peuvent avoir un effet massif mais
invisible sur le texte. Bien sûr, si votre objectif est d'induire les gens en
erreur, vous pouvez simplement ignorer cette étape.
Créez des graphiques qui ne
mettent en évidence que votre conclusion préconçue
La
plupart des gens n'ont pas le temps de faire leur propre analyse statistique,
alors ils comptent sur vous pour leur montrer des graphiques qui résument vos
conclusions. Si vous créez correctement vos graphiques, ils devraient suggérer
des idées qui correspondent à la réalité. Si vous voulez les visser, vous
pouvez mettre l'accent sur les données que vous préférez.
L'un des graphiques les plus célèbres, hilarement
inexacts de mémoire récente est venu d'un membre du Congrès lors d'une réunion
concernant Planned Parenthood. Au cours de cette réunion, le représentant Jason
Chaffetz (R-Utah) a tenté de faire valoir que les services d'avortement de PP
ont augmenté depuis 2006, alors que ses services de cancer ont diminué au cours
de la même période. Voici le tableau qu'il a utilisé pour démontrer
ceci:
C'est l'un des pires
graphiques que j'ai jamais vu. Et il a été présenté au Comité de surveillance
de la Chambre.
À première vue, cela ressemble que le niveau d'avortements a explosé tandis que les services de cancer ont chuté de façon spectaculaire.
Nous pouvons remercier plusieurs défauts dans ce tableau pour cette conclusion:
·
• Il n'y a pas d'étiquette sur l'axe Y. Alors
que l'axe X inférieur est étiqueté depuis des années, l'axe Y n'a aucune
étiquette. Est-ce le nombre de procédures? Montant d'argent dépensé pour les
procédures? Qui sait! Vous n'êtes pas obligé.
·
• Les échelles de l'axe Y sont toutes fausses. En
plus de l'étiquette incorrecte, l'échelle de l'axe Y est tout faux. Le point de
données final de la ligne rouge est 327 000, ce qui est inexplicablement plus
élevé sur le graphique que le point de données final de la ligne rose 935 573.
Techniquement, chaque ligne va dans la bonne direction, mais l'échelle est
mauvaise.
·
• Il manque de contexte. Ces
points de données (tels qu'ils sont) suggèrent seulement ce qui se passe, pas
pourquoi cela arrive. Par exemple, en 2009, le groupe de travail américain sur
les services préventifs a mis à jour sa recommandation de passer des examens de
mammographie tous les deux ans, au lieu de la suggestion précédente de chaque
année. Cela pourrait expliquer la diminution des dépistages du cancer.
La plupart des graphiques ne sont pas aussi
flagrants, mais c'est un bon exemple de tromperie en omettant simplement
quelques éléments clés d'un graphique. Quartz a montré à quoi ressemblerait
cette charte si elle était représentée correctement (note: les données de 2008
ne sont pas fournies et donc manquantes dans le tableau):
C'est beaucoup plus précis. Si vous êtes dans ce genre de chose.
Sur
cette échelle, l'augmentation des procédures d'avortement est relativement
stable, tandis que les dépistages du cancer ont diminué. Cependant, étant donné
que des points de données individuels sont montrés, nous pouvons voir que la
baisse a commencé tout autour de 2009, tout comme nous l'avions prévu. C'est
ainsi que vous présentez précisément l'information dans son contexte approprié!
Donc, si vous voulez tromper les gens, tout ce qu'il faut, c'est un peu de
triche. Laissez vos étiquettes, manipulez un peu l'axe et vous pouvez vous
faire croire que vous avez un meilleur point que vous avez reelement.
Obscurcir
vos sources à tout prix
Plus il
est facile de voir vos sources, plus les autres peuvent facilement vérifier ou
réfuter vos conclusions. Si vos conclusions peuvent être vérifiées, alors
laissez les gens voir vos données et comment vous y êtes arrivé. Cependant, si
votre but est d'induire les gens en erreur, ne laissez personne découvrir
comment vous êtes arrivé aux conclusions que vous avez faites.
Pour un approvisionnement correct, chaque
personne qui mentionne un élément de données inclura une référence à la source.
Les sites d'actualités doivent être liés aux études ou aux recherches qu'ils
citent (pas d'articles sur les études). Les chercheurs peuvent ne pas montrer
l'ensemble de leurs données, mais la source d'une étude devrait répondre à
quelques questions de base:
- Comment les données ont-elles été recueillies? Avez-vous appelé les gens au téléphone? Arrêtez-les à l'extérieur du centre commercial? Était-ce un sondage Twitter? La méthode que vous utilisez pour recueillir vos données peut pointer vers (ou réfuter) le biais d'échantillonnage.
- Quand les données ont-elles été collectées? Quand avez-vous collecté les
données et combien de temps cela a-t-il pris pour se rassembler? Les
rapports peuvent devenir obsolètes rapidement et les tendances peuvent
changer avec le temps. Y compris le temps dont proviennent les données
peut en dire beaucoup sur les conclusions que vous dessinez.
- Qui a collecté les données? La personne ou le groupe qui
collecte les données peut fournir des indications sur la fiabilité des
données. Une étude d'une compagnie de tabac affirmant que les cigarettes
sont sûres pourrait ne pas être correcte à moins que quelqu'un d'autre
puisse la vérifier.
- Qui a été demandé? Particulièrement dans le domaine des enquêtes
et des sondages, il est important de savoir qui a été interrogé. Si un
politicien interroge seulement des personnes qui sont déjà amicales avec
eux, ils n'obtiendront pas de données qui représentent la population dans
son ensemble.
L'approvisionnement n'est pas seulement
utilisé pour éviter les préjugés, mais pour permettre aux autres de vérifier
vos affirmations. Il ouvre vos données, vos méthodes et vos conclusions à la
critique. Il permet à d'autres d'essayer de percer des trous dans vos idées. Si
vos conclusions ne peuvent pas résister à la critique, elles s'effondrent. Les
statistiques les plus précises sont celles que les autres peuvent voir et
corroborer avec leurs propres recherches. Cependant, si votre but est de vous
tromper ou de tromper quelqu'un, ne vous embêtez pas à partager les sources. En
fait, votre meilleure défense consiste simplement à dire «Cherchez-le!» Et à partir.
Personne ne peut réfuter cela.
Illustration par Angelica Alzona. Photos par
Wikimedia Commons, Américains unis pour la vie et Quartz.