Ethique et biais de visualisation

Un regard critique sur les utilisations possibles de la dataviz comme argument d’autorité.

Résumé

Quels risques

Les graphiques et les visualisations peuvent être de formidables outils de communication et de discussion, mais comme tous les outils leur impact dépend de l’utilisation qui est en faite :

  • Comment une visualisation est créée ?
  • Dans quel but ?
  • Comment la visualisation est-elle comprise ?
  • Il n’y a pas de “données brutes”, une visualisation est toujours une interprétation !

Que faire ?

Il existe quelques règles globales pour faire des visualisations moins trompeuses et plus claires, et pour mieux déchiffrer les visualisations qui nous sont présentées :

  • Faire attention au lie factor d’un graphique
  • Vérifier les sources, la marge d’erreur, les échelles
  • Être attentif aux causalités supposées
  • Essayer de maximiser le data to ink ratio
  • Accepter la complexité dans les visualisations : clarifier plutôt que simplifier

TD

Analyse des visualisations

Pour chacune des visualisations proposées ci-dessous, indiquez les points qui vous semblent impacter négativement la compréhension ou distordre la perception des données. Comment remédier à chacun d’eux ? Effectuez un rapide brouillon en guise d’exemple corrigé pour les trois premiers.

Modifier le message communiqué

Pour cet exercice, executez le code suivant avant tout pour générer les données :

library(tibble)

lebron <- tibble(year = c(2003, 2004, 2005, 2006, 2007, 2008, 2009, 2010, 2011, 2012, 2013, 2014, 2015, 2016), points = c(20.9, 27.2, 31.4, 27.3, 30, 28.4, 29.7, 26.8, 27.1, 26.8, 27.1, 25.3, 25.3, 26.4))

Le tibble créé contient la moyenne de points par match de basketball marqués par LeBron James, année par année depuis le début de sa carrière.

  1. Visualisez les données dans un line graph.

  2. Utilisez toutes les techniques abordées en cours afin de mettre l’emphase sur ses plus mauvaises performances et de donner un ressenti plus négatif au lecteur vis-à-vis des performances de LeBron James.

  3. A l’inverse, modifiez déformez la manière dont les données sont présentées afin de mettre en valeur les performances du joueur. Quelles autres données pourriez-vous ajouter au graphique dans cette optique ?

Plus de mauvais exemples

  1. Pour chacun des graphiques proposés dans cet exercice, représentez les données de la manière la moins déformée et la plus neutre possible. Vous pouvez recréer le graphique via ggplot2 ou simplement au brouillon en traçant une représentation approximative de la version corrigée.
  1. Même consigne que le point précédent, mais à appliquer sur deux graphiques Fox News de votre choix. Vous trouverez quelques exemples ici.

  3. Parcourez https://viz.wtf/ afin de trouver un exemple illustrant un des biais vus en cours.

Conception de visualisations de données
Conception de visualisations de données
Printemps 2024

Cours de conception de visualisations de données du printemps 2024.