Trier et filtrer : les bases des feuilles de calcul

Introduction

L’outil le plus basique pour la manipulation des données est la feuille de calcul. Les données contenue dans une feuille de calcul sont dans un format structuré, lisible par les machines, qui peut être trié et filtré. Dans ce cours, vous allez apprendre à utiliser de simples feuilles de calcul, un outil cependant puissant pour faire des opérations basiques (trouver le total, la moyenne, etc.), appliquer un traitement de masse, ou créer des graphiques et des tableaux.

A la fin de ce module, vous aurez appris comment télécharger des données, les importer dans une feuille de calcul, comment les nettoyer et les interpréter avec les fonctions « trier » et « filtrer ».

Un aperçu des feuilles de calcul

Aujourd’hui, les feuilles de calcul sont répandues et un grand nombre de personnes les utilisent quotidiennement. Une grande variété de tableurs et d’applications existent. Par exemple, Microsoft Office propose Excel, LibreOffice avec Calc… Sans surprise, Google a décidé de proposer un service de tableur dans sa suite Google Docs. Comme il ne requiert pas d’acheter ou d’installer un logiciel, nous utiliserons les feuilles de calcul Google pour ce cours (Notez qu’il existe un logiciel libre, EtherCalc, qui propose les mêmes fonctionnalités, disponible notamment sur : http://framacalc.org).

Selon ce que vous voulez faire, vous pouvez choisir d’utiliser un logiciel de tableur différent. Voici quelques considérations à connaître avant de choisir votre outil favori :

Feuille de calcul Google Feuille de calcul Open(Libre)Office Microsoft Excel
Usage Gratuit Gratuit Commercial
Stockage des données Google Drive Votre disque dur Votre disque dur
Internet requis Oui Non Non
Installation requise Non Oui Non
Collaboration Oui Non Non
Partage des résultats Facile Difficile Difficile
Visualisations Large gamme Graphiques de base Graphiques de base

Créer une feuille de calcul et télécharger les données

Dans ce cours nous allons utiliser Google Docs pour manipuler (convertir) vos données. Cela permet de commencer immédiatement sans avoir besoin d’installer un logiciel. Puisque les données que nous utilisons sont déjà publiques, nous n’avons pas besoin de nous soucier du fait qu’elles ne sont pas stockées sur notre disque dur (en interne).

Pas à pas : créer une feuille de calcul et télécharger les données

  1. Rendez-vous sur Google docs.
  2. Si vous n’êtes pas connecté sur Google docs, connectez-vous.
  3. La première étape est de créer une nouvelle feuille de calcul.
  4. Faites-le en cliquant à gauche sur le bouton « créer » et sélectionnez « feuille de calcul » (Spreadsheet pour la version anglaise).

http://farm9.staticflickr.com/8448/7871786616_ef5892fe33_o_d.jpg

5.  Cela crée une nouvelle feuille de calcul.
6.  Téléchargeons maintenant des données.
7.  Vous allez avoir besoin du fichier que nous avons téléchargé sur le site de la Banque Mondiale dans le tutoriel précédent. Si vous n’avez pas suivi le tutoriel ou que vous avez perdu le fichier : téléchargez le ici.
8.  Dans votre feuille de calcul, sélectionnez « importer » dans le menu « fichier ». Cela ouvre une boîte de dialogue.
9.  Sélectionnez le fichier que vous avez téléchargé
10.  N’oubliez pas de sélectionner « insérer des nouvelles feuilles » et cliquez sur importer
http://farm9.staticflickr.com/8306/7872679284_c321614681_b_d.jpg

Verrouillage des lignes et des colonnes

La feuille de calcul sur laquelle nous travaillons est plutôt grande. Vous allez voir qu’en faisant défiler la colonne, les labels de colonnes disparaîtront fréquemment. La même chose se produira avec le nom des pays. Pour éviter ça vous pouvez verrouiller les lignes et colonnes pour ne pas qu’elles disparaîssent.

Pas à pas : verrouiller la ligne supérieure

  1. Allez sur la feuille de calcul avec vos données et faites la défiler jusqu’en haut.
  2. En haut à gauche au niveau des labels de colonnes et de lignes vous verrez une petite zone rayée.

    http://farm9.staticflickr.com/8322/8070104022_e233a65687_o_d.png

  3. Survolez la barre rayée en haut de la case où est inscrit le chiffre « 1 ». Un curseur en forme de main doit apparaître. Cliquez et tirez le vers le bas sur une ligne.
  4. Le résultat devrait ressembler à ça :

    http://farm9.staticflickr.com/8176/8070115059_d960b3d09e_o_d.png

  5. Essayez de faire défiler. Vous remarquez comment les colonnes du haut restent fixes ?

Trier les données

La première chose à faire quand vous découvrez un nouveau jeu de données, c’est de vous orienter. Cela nécessite de regarder les valeurs maximales et minimales puis de trier les données pour que cela prenne du sens. Regardons les colonnes. Nous avons des données sur le PIB, les dépenses de santé et l’espérance de vie. Maintenant partons explorer les données par un simple tri.

Pas à pas : trier un jeu de données

  1. Sélectionner la feuille entière que vous voulez trier. Pour se faire, cliquez sur le coin en haut à gauche, entre les noms des lignes et des colonnes.

    http://farm9.staticflickr.com/8322/8070104022_e233a65687_o_d.png

  2. Sélectionner « Trier la plage » depuis le menu « données » ce qui va ouvrir une nouvelle fenêtre.
  3. Cochez « Données avec ligne d’en-tête »

    http://farm9.staticflickr.com/8437/7872826062_017d1bfe19_o_d.jpg

  4. Sélectionner la colonne que vous voulez trier dans le menu dépliant.
  5. Triez par PIB – Quel pays a le plus faible ?
  6. Essayez de nouveau avec d’autres valeurs, pouvez vous trier de manière ascendante et descendante ?

Astuce : faites attention ! Une erreur commune est d’oublier de sélectionner toutes les données. Si vous triez sans sélectionner toutes les données de la feuille, les lignes ne vont pas correspondre.

Filtrer les données

L’autre étape courant est de filtrer les valeurs que vous ne voulez pas voir. Avez vous remarqué que certains « Noms de pays » ne sont pas corrects ? Vous trouverez certaines choses comme « World », “North America” et “Arab World”. Filtrons les.

Pas à pas : filtrer des données

  1. Sélectionnez tout le tableau
  2. Sélectionnez « filtre » depuis le menu « données »
  3. Vous devriez maintenant voir des triangles à côté des noms de colonnes sur la première ligne
  4. Cliquez sur le triangle à côté du nom du pays
  5. Vous devriez voir une longue liste de noms de pays dans la case

http://farm9.staticflickr.com/8316/8070573150_2cf29b914f_o_d.png

6.   Trouvez ceux qui ne sont pas des pays et cliquez dessus (la case verte cochée disparaîtra).
7.   Vous avez réussi à filtrer votre jeu de données.
8.   Allez-y, jouez avec les données ! Les données ne seront pas supprimées, elles ne seront seulement pas affichées.

 

Résumé

Dans cette section nous avons acquis des compétences fondamentales pour utiliser une feuille de calcul. Nous avons parlé de la saisie de données et de comment trier et filtrer des données en utilisant un logiciel de feuille de calcul. Dans le prochain cours nous parlerons d’analyse de données et vous présenterons les formules.

Lecture complémentaires et références

  1. Aide Google sur les feuilles de calcul : https://support.google.com/drive/topic/20322?hl=fr&ref_topic=2811806

Article d’origine : https://schoolofdata.org/handbook/courses/sort-and-filter/

téléchargement

Aidez-nous à améliorer la traduction de cet article sur GitHub !

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *