7 openbare datasets die je nu gratis kunt analyseren
Hey, data zijn overal. Dat wist je waarschijnlijk al, want het is moeilijk over het hoofd te zien als het voortdurend in het nieuws is, een groeiend vakgebied is en gegevensvaardigheden steeds waardevoller worden op elke banenmarkt. Data is echter niet alleen voor grote bedrijven en je hoeft niet je eigen gegevens te verzamelen om ze te analyseren. Er zijn talloze openbare datasets beschikbaar!
Als je wilt leren hoe je data moet analyseren, hoe je datavisualisaties maakt of gewoon je datavaardigheden wilt verbeteren, zijn openbare datasets een perfecte plek om te beginnen. Hier zijn enkele geweldige openbare datasets die je nu gratis kunt analyseren. Als u hulp nodig hebt bij het omzetten van uw bevindingen in vorm, hebben we ook een aantal blogs over datavisualisatie die u kunt volgen en de beste voorbeelden van datavisualisatie ter inspiratie.
Google Trends
Gecureerd door: Google
Voorbeeld dataset: “Cupcake” zoekresultaten
Dit is een van de breedste en meest interessante openbare datasets om te analyseren. Google’s uitgebreide zoekmachine houdt zoektermgegevens bij om ons te laten zien waar mensen naar zoeken en wanneer. U kunt statistieken over zoekvolume voor bijna elke zoekterm sinds 2004 bekijken. Voer een zoekterm in, of een handvol zoektermen, en klik op de downloadknop om de gegevens buiten de Trends-website te analyseren.
Er zijn verschillende filters om trends te beperken op basis van locatie (wereldwijd of per land), verschillende tijdbereiken, categorieën, of zelfs specifieke zoektypen (web- vs. afbeelding- vs. YouTube-zoekresultaten). U kunt gemakkelijk zien welke onderwerpen op dit moment populair zijn en wat er momenteel trending is op de Trends-homepage. Google belicht ook verschillende interessante voorbeelden van trends met data visuals op die homepage.
Als je geïnteresseerd bent in meer Google data, kijk dan eens bij Google Finance, Google Public Data, en Google Scholar.
National Climatic Data Center
Curated by: National Centers for Environmental Information (voorheen NOAA)
Voorbeeld gegevensverzameling: Local Climatological Data (LCD)
Als weer- en klimaatwetenschap je ding is, kun je niet veel gedetailleerder zijn dan het National Climatic Data Center. Ze hebben een kleine rebranding uitgevoerd, waarbij de gegevenscentra van de National Oceanic and Atmospheric Administration (NOAA) zijn samengevoegd tot de National Centers for Environmental Information (NCEI).
Hier vindt u een archief van klimaat- en weergegevensverzamelingen uit de hele VS, het grootste archief van milieugegevens ter wereld. Het is een enorme bron voor alle soorten weergegevens, waaronder meteorologische, oceanische, klimaat-, atmosferische en geofysische gegevens.
Global Health Observatory data
Gecureerd door: Wereldgezondheidsorganisatie (WHO)
Voorbeeld gegevensverzameling: Universele toegang tot reproductieve gezondheid
Als onderdeel van hun kerndoelstelling voor betere gezondheidsinformatie wereldwijd, maakt de Wereldgezondheidsorganisatie hun gegevens over wereldwijde gezondheid openbaar via het Global Health Observatory (GHO). Het GHO fungeert als een portaal waarmee gezondheidssituaties en belangrijke thema’s kunnen worden opgevraagd en geanalyseerd.
De verschillende gegevensverzamelingen zijn georganiseerd volgens thema’s, zoals sterfte, gezondheidsstelsels, overdraagbare en niet-overdraagbare ziekten, geneesmiddelen en vaccins, gezondheidsrisico’s, enzovoorts. De gezondheidsstatistieken van de WHO zijn de bron bij uitstek voor wereldwijde gezondheidsinformatie en worden ook gebruikt in het werk van de Amerikaanse Centers for Disease Control and Prevention.
Data.gov.sg
Gecureerd door: Singaporese overheid
Voorbeeld dataset: Singapore Residents By Age Group, Ethnic Group And Gender, End June, Annual (2017)
Er zijn eigenlijk heel veel geweldige overheidsdata websites op het internet. De meeste daarvan zijn ongelooflijke rijkdommen aan gegevens en informatie. De VS heeft een van de meest bekende op data.gov, en het Verenigd Koninkrijk en Australië hebben ook grote overeenkomstige sites. Met al die sites, en met grote bevolkingssteekproeven, hebben we een heleboel gegevens die toegankelijk zijn. Dus waarom Singapore?
Om eerlijk te zijn is de overheidsdatasite van Singapore gewoon zo visueel toegankelijk. De homepage staat vol met kleine visualisaties die een verhaal vertellen over elke dataset. Een onderdeel van datavisualisatie is ervoor te zorgen dat de informatie niet alleen in een accuraat en relevant formaat wordt weergegeven, maar ook dat de belangstelling wordt gewekt. De meeste datasites van de overheid zijn utilitair en eenvoudig, genoeg om de gegevens op een gemakkelijk te begrijpen manier over te brengen. Singapore echter, fleurt het op met kleurrijke visualisaties, spatten van kleur in de grafieken, en een “Similar Datasets” sectie onderaan elke dataset om lezers aan te moedigen om te verkennen.
Earthdata
Curated by: NASA
Voorbeeld dataset: Atmospheric Electricity (Lightning)
Earthdata is onderdeel van NASA’s Earth Science Data Systems Program, in het bijzonder het Earth Observing System Data and Information System (EOSDIS). EOSDIS verwerkt en distribueert aardwetenschappelijke gegevens van aardobservatiesatellieten, -vliegtuigen en -veldmetingen.
Via Earthdata heeft het publiek toegang tot NASA’s gegevens, nieuws en informatie over evenementen. Het omvat gegevens over de atmosfeer van de aarde, zonnestraling, de cryosfeer (arctische/bevroren gebieden), de oceaan, het landoppervlak (zwaartekracht, geomagnetisme, tektoniek), en de menselijke omgeving.
Amazon Web Services Open Data Registry
Gecureerd door: Amazon
Voorbeeld gegevensverzameling: 1000 Genomes Project
Naarmate meer organisaties hun data beschikbaar maken voor publieke toegang, heeft Amazon een register gemaakt om die verschillende datasets te vinden en te delen. Er worden meer dan 50 openbare datasets ondersteund door het Amazon-register, variërend van belastingaangiften tot NASA-satellietbeelden en van DNA-sequencing tot webcrawling. De datasets bevatten ook gebruiksvoorbeelden, die laten zien wat andere organisaties en groepen met de gegevens hebben gedaan.
Pew Internet
Gecureerd door: Pew Research Center
Voorbeeld dataset: Tieners, Sociale media & Technologie 2018
De missie van het Pew Research Center is het verzamelen en analyseren van gegevens van over de hele wereld. Ze bestrijken allerlei onderwerpen zoals politiek, sociale media, journalistiek, de economie, online privacy, religie en demografische trends. Hoewel ze hun eigen onpartijdige, niet-advocatoire onderzoek en analyse doen, bieden ze hun ruwe gegevens ook aan voor publieke toegang. Toegang vereist slechts een korte registratie op de site en vermelding van Pew Research Center als de bron van de gegevens, met een verklaring van afstand dat Pew niet verantwoordelijk is voor alternatieve gegevensconclusies.
In zekere zin is het toegankelijk maken van gegevens ook een ander onderzoeksproject voor Pew. Zij hebben al alle informatie over hoe zij de gegevens in hun onderzoek gebruiken en zij zijn geïnteresseerd om te leren hoe anderen hun gegevens ook gebruiken. Ze hebben één verzoek – om contact met hen op te nemen via e-mail als er iets wordt gepubliceerd als gevolg van de verkregen gegevens.