7 publicznych zbiorów danych, które możesz analizować za darmo już teraz
Hej, dane są wszędzie. Prawdopodobnie już o tym wiedziałeś, ponieważ trudno jest je przeoczyć, gdy są stale obecne w wiadomościach, stanowią rozwijającą się dziedzinę zawodową, a umiejętności związane z danymi są coraz bardziej cenne na każdym rynku pracy. Jednak dane nie są przeznaczone tylko dla dużych firm i nie musisz zbierać własnych danych, aby je analizować. Istnieją tony publicznych zbiorów danych!
Jeśli chcesz nauczyć się analizować dane, tworzyć wizualizacje danych lub po prostu zwiększyć swoje umiejętności w tym zakresie, publiczne zbiory danych są doskonałym miejscem do rozpoczęcia pracy. Oto kilka wspaniałych publicznych zbiorów danych, które możesz przeanalizować za darmo już teraz. Jeśli potrzebujesz pomocy w przekształceniu swoich ustaleń w formę, mamy również opisy blogów poświęconych wizualizacji danych, które warto śledzić, oraz najlepsze przykłady wizualizacji danych, które mogą być inspiracją.
Google Trends
Kurator:: Google
Przykładowy zestaw danych: „Cupcake” wyniki wyszukiwania
Jest to jeden z najszerszych i najciekawszych publicznych zbiorów danych do analizy. Ogromna wyszukiwarka Google śledzi dane dotyczące wyszukiwanych haseł, aby pokazać nam, czego ludzie szukają i kiedy. Możesz zbadać statystyki dotyczące wielkości wyszukiwania dla prawie każdego terminu od 2004 roku. Wpisz dowolne hasło lub kilka haseł i kliknij przycisk Pobierz, aby przeanalizować dane poza witryną Trendy.
Dostępne są różne filtry, które pozwalają zawęzić trendy w zależności od lokalizacji (na całym świecie lub w danym kraju), różnych przedziałów czasowych, kategorii, a nawet konkretnych typów wyszukiwania (wyniki wyszukiwania w Internecie vs obrazy vs YouTube). Na stronie głównej Trendy można łatwo sprawdzić, jakie tematy są obecnie popularne i co jest aktualnie trendy. Google podkreśla również kilka interesujących przykładów trendów za pomocą wizualizacji danych na tej stronie głównej.
Jeśli interesuje cię więcej danych Google, sprawdź Google Finance, Google Public Data i Google Scholar.
National Climatic Data Center
Kurowane przez: National Centers for Environmental Information (dawniej NOAA)
Przykładowy zestaw danych: Local Climatological Data (LCD)
Jeśli nauka o pogodzie i klimacie to twoja sprawa, nie możesz uzyskać dużo więcej szczegółów niż z National Climatic Data Center. Dokonali oni małego rebrandingu, łącząc centra danych Narodowej Administracji Oceanicznej i Atmosferycznej (NOAA), aby przekształcić się w Narodowe Centra Informacji o Środowisku (NCEI).
Można tu znaleźć archiwum zbiorów danych klimatycznych i pogodowych z całego USA, największe archiwum danych środowiskowych na świecie. Jest to ogromny zasób wszelkiego rodzaju danych pogodowych, w tym danych meteorologicznych, oceanicznych, klimatycznych, atmosferycznych i geofizycznych.
Dane Globalnego Obserwatorium Zdrowia
Kurowane przez: Światową Organizację Zdrowia (WHO)
Przykładowy zestaw danych: Powszechny dostęp do zdrowia reprodukcyjnego
Jako część ich głównego celu dla lepszej informacji o zdrowiu na całym świecie, Światowa Organizacja Zdrowia udostępnia publicznie swoje dane na temat zdrowia na świecie poprzez Globalne Obserwatorium Zdrowia (GHO). GHO działa jako portal umożliwiający dostęp i analizę sytuacji zdrowotnej oraz ważnych tematów.
Różne zestawy danych są zorganizowane według tematów, takich jak umieralność, systemy opieki zdrowotnej, choroby zakaźne i niezakaźne, leki i szczepionki, zagrożenia dla zdrowia itd. Statystyki zdrowotne WHO są źródłem informacji na temat zdrowia na świecie i są również wykorzystywane w pracy amerykańskich Centrów Kontroli i Zapobiegania Chorobom.
Data.gov.sg
Kurowane przez: Singaporean government
Przykładowy zestaw danych: Singapore Residents By Age Group, Ethnic Group And Gender, End June, Annual (2017)
W internecie jest właściwie mnóstwo świetnych stron z danymi rządowymi. Większość z nich to niesamowite bogactwo danych i informacji. USA ma jeden z najbardziej znanych na data.gov, a Wielka Brytania i Australia również mają świetne odpowiednie strony. Dzięki nim wszystkim i dużym próbom populacji mamy dostęp do wielu danych. Dlaczego więc Singapur?
Prawdę mówiąc, rządowa strona danych Singapuru jest po prostu bardzo przystępna wizualnie. Strona główna jest pełna małych wizualizacji opowiadających historie o każdym zbiorze danych. Częścią wizualizacji danych jest upewnienie się, że nie tylko wyświetlają one informacje w dokładnym i odpowiednim formacie, ale także, że przyciągają zainteresowanie. Większość rządowych stron z danymi jest utylitarna i prosta, wystarczająca do przedstawienia danych w łatwy do zrozumienia sposób. Singapur jednak rozjaśnia je kolorowymi wizualizacjami, kolorowymi wykresami i sekcją „Similar Datasets” na dole każdego zbioru danych, aby zachęcić czytelników do eksploracji.
Earthdata
Curated by: NASA
Przykładowy zestaw danych: Atmospheric Electricity (Lightning)
Earthdata jest częścią programu NASA Earth Science Data Systems Program, a konkretnie Earth Observing System Data and Information System (EOSDIS). EOSDIS działa jako środek do przetwarzania i dystrybucji danych nauki o Ziemi z satelitów obserwacyjnych Ziemi, samolotów i pomiarów terenowych.
Poprzez Earthdata, społeczeństwo może uzyskać dostęp do danych NASA, wiadomości i informacji o wydarzeniach. Obejmuje on dane z atmosfery ziemskiej, promieniowania słonecznego, kriosfery (arktyka/obszary zamarznięte), oceanu, powierzchni ziemi (grawitacja, geomagnetyzm, tektonika) i środowiska ludzkiego.
Amazon Web Services Open Data Registry
Kurowane przez: Amazon
Przykładowy zbiór danych: 1000 Genomes Project
W miarę jak coraz więcej organizacji udostępnia swoje dane do publicznego dostępu, Amazon stworzył rejestr, aby znaleźć i udostępnić te różne zbiory danych. W rejestrze Amazona znajduje się ponad 50 publicznych zestawów danych, począwszy od zgłoszeń IRS, poprzez zdjęcia satelitarne NASA, sekwencjonowanie DNA, aż po indeksowanie stron internetowych. Zestawy danych zawierają również przykłady użycia, pokazujące, co inne organizacje i grupy zrobiły z danymi.
Pew Internet
Kurator:: Pew Research Center
Przykładowy zestaw danych: Teens, Social Media & Technologia 2018
Misją Pew Research Center jest zbieranie i analizowanie danych z całego świata. Obejmują one wszelkiego rodzaju tematy, takie jak polityka, media społecznościowe, dziennikarstwo, gospodarka, prywatność online, religia i trendy demograficzne. Prowadzą własne, bezpartyjne i nieagresywne badania i analizy, ale oferują również swoje dane do publicznego dostępu. Dostęp wymaga jedynie krótkiej rejestracji na stronie i podania Pew Research Center jako źródła danych, z zastrzeżeniem, że Pew nie ponosi odpowiedzialności za alternatywne wnioski z danych.
W pewnym sensie udostępnianie danych jest również kolejnym projektem badawczym Pew. Mają już wszystkie informacje na temat tego, jak wykorzystują dane w swoich badaniach i są zainteresowani dowiedzeniem się, jak inni również korzystają z ich danych. Mają jedną prośbę – o kontakt mailowy, jeśli cokolwiek zostanie opublikowane w wyniku pozyskanych danych.