Analyser des données avec les feuilles de calcul

Introduction

Une fois votre jeu de données nettoyé et filtré, vous pouvez passer à son analyse. L’analyse des données vous aidera à comprendre leur signification et donc également à trouver des réponses aux questions posées.

Observez les données que nous venons d’importer (ne vous inquiétez pas si vous vous n’avez pas terminé le tutoriel précédent, vous pouvez récupérer un exemple de feuille de calcul ici).

Voici des données de la Banque Mondiale contenant des informations sur le PIB, la population, les dépenses de santé et l’espérance de vie pour la période 2000 – 2011. Prenez quelques minutes pour observer les données. Plutôt intéressant, mais que nous enseignetn-elles ?

Tâche :
Brainstormez, réfléchissez … que pourriez vous rechercher / découvrir en utilisant ces données ?

Voici quelques idées qui nous sont venues :

  1. Combien (en USD) est dépensé pour la santé au total ans dans chaque pays ?
  2. Combien (en USD) est dépensé par habitant dans chaque pays ?
  3. Dans quel pays dépense-t-on le plus par personne ? Dans quel pays dépense-t-on le moins ? Quelle est la moyenne pour chaque continent ? Dans le monde ?
  4. Quelle est la relation entre les dépenses de santé privées et publiques dans chaque pays ? Où les citoyens dépensent-ils le plus (dépenses privées) ? Où l’Etat dépense-t-il le plus (dépenses publiques) ?
  5. Existe-t-il un lien entre les dépenses de santé et et l’espérance de vie moyenne ?
  6. Le fait que la dépense soit publique ou privée fait-il une différence ?
NOTE :
En ce qui concerne les deux dernières questions, vous devez être extrêmement prudent. Même si vous trouvez des liens, cela ne signifie pas nécessairement que l’une a provoqué l’autre ! Par exemple : imaginez qu’il y ait eu une épidémie soudaine de peste. La maladie n’est pas toujours fatale, mais de nombreuses personnes l’ayant contractée mourront. Les dépenses de santé publiques risquent d’augmenter. L’espérance de vie baisse immédiatement. Cela ne veut pas dire que votre système de santé est soudainement devenu moins efficace ! Vous devez toujours être EXTREMEMENT prudent quant aux conclusions possibles pour ce genre de données … mais il peut toujours être intéressant de faire les calculs.

Il y a de nombreuses autres questions auxquelles on pourrait répondre en utilisant ces données, dont de nombreuses en lien étroit avec les débats actuels sur les politiques publiques. Par exemple, si mon pays était en plein débat sur ses dépenses de santé, je pourrais utiliser ces données pour explorer et analyser de quelle manière la dépense dans mon pays a évolué au fil du temps, et commencer à comprendre comment mon pays se situe par rapport aux autres.

Formules

Plongeons au coeur du sujet. Les données dont nous disposons ne sont pas complètes. Pour l’instant, les dépenses de santé sont présentées en tant que pourcentage du PIB. Afin de pouvoir comparer les dépenses totales dans différents pays, ce chiffre doit être converti en dollars US (USD).

Pour faire ce calcul, laissez-nous vous présenter les formules.

Les formules ont permis aux tableurs de devenir des outils importants. Mais comment fonctionnent-elles ? Découvrons-le ensemble en jouant avec…

Astuce:
Lorsque vous téléchargez un jeu de données, la toute première chose que vous devriez faire est d’en faire une copie. Chaque changement que vous pourriez faire devrait être fait dans cette copie du document. Les données d’origine doivent rester inchangées et non modifiées ! Ainsi, vous pouvez vous y référer et y retourner à n’importe quel moment. Il est également recommandé de noter la provenance des données et quand et comment elles ont été récupérées.

Une fois que vous aurez fait votre propre copie de données (essayez d’ajouter « copie de travail » où quelque chose de similaire après le nom d’origine), créez une nouvelle feuille de travail dans votre tableur. Cette « feuille-test » vous permettra d’essayer différentes choses tout en développant vos connaissances sur les formules.

Passons à présent sur la colonne « Total fruits vendus ». Commencez dans la première ligne. Il est temps à présent d’écrire une formule …

Explication détaillée : utiliser les feuilles de calcul pour ajouter des valeurs.

Utiliser ce jeu de données pour calculer le total des fruits vendus.

  1. Accédez aux données et créez une copie de travail.
  2. Pour commencer, mettez-vous sur la première ligne
  3. Chaque formule dans une feuille de calcul commence par =
  4. Insérez le caractère « = » et sélectionnez la première cellule que vous voulez ajouter. Remarquez la manière dont la référence de la cellule apparait dans la formule.http://farm9.staticflickr.com/8179/8073780056_05b170a958_o_d.png
  5. Tapez + et sélectionnez la deuxième cellule que vous souhaitez ajouter

    http://farm9.staticflickr.com/8173/8073780166_59fb9bcaa0_o_d.png

  6. Validez en appuyant sur Entrée ou tabulation

  7. La formule disparaît et est remplacée par la valeur

    http://farm9.staticflickr.com/8176/8073780244_836ef3f299_o_d.png

  8. Essayez de changer le nombre dans l’une des cellules d’origine (pommes ou prunes)
  9. Vous pouvez taper chaque formule individuellement, mais il est aussi possible de copier/coller ou de glisser/déposer des formules sur un ensemble de cellules.

  10. Copiez la formule que vous venez d’écrire (en utilisant ctrl + c) et collez la dans la cellule du dessous (en utilisant ctrl + v), vous obtiendrez la somme des deux nombres dans la cellule du dessous.

  11.  Alternativement, cliquez sur le coin inférieur droit de la cellule (le carré bleu), et glissez la formule jusqu’au pied de la colonne. Remarquez la mise à jour du total de la colonne. C’est magique !

    Tache: rédigez une formule calculant le montant total de pommes et de prunes vendues pendant la semaine.

Avez vous ajouté toutes les cellules manuellement ? C’est beaucoup de clics ! Pour les grandes feuilles de calcul, ajoutez chaque cellule à la main peut prendre beaucoup de temps. Jetez un oeil à la section « formules » (en anglais) dans le guide de l’école des données, vous y trouvez des solution simples pour additionner un groupe de cellules ou de colonnes.

 

Et maintenant ?

Maintenant que vous savez rédiger une formule simple, vous savez faire beaucoup ! Le guide de l’école des données vous permettra éventuellement de vous familiariser avec :

  • Multiplications dans une feuille de calcul
  • Divisions dans une feuille de calcul
  • Copier des formules sur les cotés
  • Déterminer les valeurs minimales et maximales
  • Gérer les cellules vides dans vos données (formules complexes). Cette étape utilise la logique booléenne.

Vous aurez besoin de vous référer à ces chapitres pour aller au bout des défis à venir.

Défi de multiplication et de division

Tâche: Utilisez les données de la Banque Mondiale (si vous ne les avez pas, téléchargez les ici). Dans ces données nous trouvons des informations sur les dépenses de santé en pourcentage (%) du PIB. Calculez le montant total des dépenses de santé en USD en Afghanistan pour l’année 2001. Si vos connaissances en calcul de pourcentages sont « rouillées » jetez un oeil à la section sur les formules dans le guide.

Tâche: Toujours en utilisant les données de la Banque Mondiale, déterminez quel montant (en USD) est dépensé pour la santé par personne en Albanie en 2001

Tâche: Calculez les valeurs moyennes et médianes pour toutes les colonnes.

Tâche: Quelle est la formule calculant les dépenses de santé par personne ? Pouvez-vous la modifier afin de ne la calculer que lorsque les données sont présentes (comprendre « que lorsque la cellule n’est pas vide ») ?

Bilan et aller plus loin

Dans ce module nous avons approfondi l’analyse. Nous avons exploré notre jeu de données et notamment ses bornes. Nous avons abordé les formules à conditions pour gérer les valeurs manquantes et développé pas à pas une formule plutôt complexe. Pour finir nous avons efleuré la question de la normalisation des données dans le but de comparer des éléments.

1. Liste des fonction du tableur Google Apps
2. Introduction à la logique booléenne sur Wikiversity

Cours suivant

Article d’origine : https://schoolofdata.org/handbook/courses/analysing-data/

téléchargement

Aidez-nous à améliorer la traduction de cet article sur GitHub !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *