7 ensembles de données publiques que vous pouvez analyser gratuitement dès maintenant
Hé, les données sont partout. Vous le saviez probablement déjà, puisqu’il est plutôt difficile de passer à côté quand elles font constamment l’actualité, qu’elles constituent un domaine professionnel en pleine expansion et que les compétences en matière de données sont de plus en plus précieuses sur tous les marchés du travail. Cependant, les données ne sont pas réservées aux grandes entreprises et vous n’avez pas besoin de collecter vos propres données pour les analyser. Il existe des tonnes d’ensembles de données publiques !
Si vous cherchez à apprendre à analyser des données, à créer des visualisations de données ou simplement à renforcer vos compétences en matière de données, les ensembles de données publiques constituent un point de départ idéal. Voici quelques grands ensembles de données publiques que vous pouvez analyser gratuitement dès maintenant. Si vous avez besoin d’aide pour mettre en forme vos résultats, nous avons également des rédactions sur les blogs de visualisation de données à suivre et les meilleurs exemples de visualisation de données pour vous inspirer.
Google Trends
Curated by : Google
Exemple d’ensemble de données : Résultats de recherche « Cupcake »
C’est l’un des ensembles de données publiques les plus vastes et les plus intéressants à analyser. Le vaste moteur de recherche de Google suit les données relatives aux termes de recherche pour nous montrer ce que les gens recherchent et quand. Vous pouvez explorer les statistiques sur le volume de recherche pour presque tous les termes de recherche depuis 2004. Saisissez n’importe quel terme de recherche, ou une poignée de termes de recherche, et cliquez sur le bouton de téléchargement pour analyser les données en dehors du site Web de Trends.
Il existe une variété de filtres pour affiner les tendances en fonction de l’emplacement (dans le monde entier ou par pays), de diverses plages de temps, de catégories, ou même de types de recherche spécifiques (web vs image vs résultats de recherche YouTube). Sur la page d’accueil de Trends, vous pouvez facilement voir quels sont les sujets les plus populaires en ce moment et ce qui est actuellement en vogue. Google met également en évidence plusieurs exemples intéressants de tendances avec des visuels de données sur cette page d’accueil.
Si vous êtes intéressé par d’autres données Google, consultez Google Finance, Google Public Data et Google Scholar.
National Climatic Data Center
Curated by : National Centers for Environmental Information (anciennement NOAA)
Exemple de jeu de données : Données climatologiques locales (LCD)
Si la météo et la science du climat sont votre truc, vous ne pouvez pas obtenir beaucoup plus de détails que le National Climatic Data Center. Ils ont fait un peu de rebranding, en fusionnant les centres de données de la National Oceanic and Atmospheric Administration (NOAA) pour devenir les National Centers for Environmental Information (NCEI).
Vous y trouverez des archives de jeux de données climatiques et météorologiques à travers les États-Unis, la plus grande archive de données environnementales au monde. C’est une énorme ressource pour toutes sortes de données météorologiques, y compris les données météorologiques, océaniques, climatiques, atmosphériques et géophysiques.
Données de l’Observatoire mondial de la santé
Curated by : Organisation mondiale de la santé (OMS)
Exemple de jeu de données : Accès universel à la santé reproductive
Dans le cadre de leur objectif principal visant à améliorer l’information sur la santé dans le monde, l’Organisation mondiale de la santé met ses données sur la santé mondiale à la disposition du public par le biais de l’Observatoire de la santé mondiale (OSM). Le GHO fait office de portail avec lequel il est possible d’accéder et d’analyser des situations sanitaires et des thèmes importants.
Les différents ensembles de données sont organisés selon des thèmes, tels que la mortalité, les systèmes de santé, les maladies transmissibles et non transmissibles, les médicaments et les vaccins, les risques sanitaires, etc. Les statistiques sanitaires de l’OMS sont la source incontournable d’informations sanitaires mondiales et sont également utilisées dans le travail des Centres américains de contrôle et de prévention des maladies.
Data.gov.sg
Curated by : Gouvernement de Singapour
Exemple de jeu de données : Résidents de Singapour par groupe d’âge, groupe ethnique et sexe, fin juin, annuel (2017)
Il existe en fait beaucoup d’excellents sites de données gouvernementales sur Internet. La plupart d’entre eux sont d’incroyables mines de données et d’informations. Les États-Unis ont l’un des plus connus à data.gov, et le Royaume-Uni et l’Australie ont également de grands sites correspondants. Avec tous ceux-là, et avec de grands échantillons de population, nous avons beaucoup de données auxquelles nous pouvons accéder. Alors pourquoi Singapour ?
Franchement, le site de données du gouvernement de Singapour est juste tellement accessible visuellement. La page d’accueil est pleine de petites visualisations racontant des histoires sur chaque ensemble de données. Une partie de la visualisation des données consiste à s’assurer que non seulement elle affiche les informations dans un format précis et pertinent, mais aussi qu’elle attire l’intérêt. La plupart des sites de données gouvernementales sont utilitaires et simples, suffisants pour transmettre les données d’une manière facile à comprendre. Singapour, cependant, l’égaye avec des visualisations colorées, des éclaboussures de couleur dans les graphiques et une section « Datasets similaires » au bas de chaque ensemble de données pour encourager les lecteurs à explorer.
Earthdata
Curated by : NASA
Exemple d’ensemble de données : Électricité atmosphérique (foudre)
Earthdata fait partie du programme de systèmes de données en sciences de la Terre de la NASA, plus précisément du système de données et d’informations du système d’observation de la Terre (EOSDIS). EOSDIS agit comme un moyen de traiter et de distribuer les données des sciences de la Terre provenant des satellites d’observation de la Terre, des avions et des mesures sur le terrain.
Via Earthdata, le public peut accéder aux données, aux nouvelles et aux informations sur les événements de la NASA. Il couvre les données de l’atmosphère terrestre, de la radiance solaire, de la cryosphère (zones arctiques/gelées), de l’océan, de la surface terrestre (gravité, géomagnétisme, tectonique) et des environnements humains.
Amazon Web Services Open Data Registry
Curated by : Amazon
Exemple de jeu de données : Projet 1000 Génomes
Alors que de plus en plus d’organisations mettent leurs données à la disposition du public, Amazon a créé un registre pour trouver et partager ces différents ensembles de données. Le registre d’Amazon prend en charge plus de 50 ensembles de données publiques, allant des déclarations d’impôts aux images satellites de la NASA, en passant par le séquençage de l’ADN et l’exploration du Web. Les ensembles de données comprennent également des exemples d’utilisation, montrant ce que d’autres organisations et groupes ont fait avec les données.
Pew Internet
Curated by : Pew Research Center
Exemple de jeu de données : Ados, médias sociaux & Technologie 2018
La mission du Pew Research Center est de collecter et d’analyser des données du monde entier. Ils couvrent toutes sortes de sujets comme la politique, les médias sociaux, le journalisme, l’économie, la vie privée en ligne, la religion et les tendances démographiques. Bien qu’ils effectuent leurs propres recherches et analyses non partisanes et non militantes, ils offrent également leurs données brutes en accès public. L’accès nécessite simplement une brève inscription sur le site et le crédit au Pew Research Center comme source des données, avec une renonciation à ce que Pew ne soit pas responsable des conclusions des données alternatives.
D’une certaine manière, rendre les données accessibles est aussi un autre projet de recherche pour Pew. Ils ont déjà toutes les informations sur la façon dont ils utilisent les données dans leurs recherches et ils sont intéressés à apprendre comment les autres utilisent également leurs données. Ils n’ont qu’une seule demande – les contacter par e-mail si quelque chose est publié suite à l’acquisition des données.