今すぐ無料で分析できる7つの公開データセット
データはどこにでもあるものです。 常にニュースで取り上げられ、成長中の専門分野であり、データのスキルがあらゆる雇用市場でますます価値を高めていることを考えると、見過ごすわけにはいきませんから、もうお分かりでしょう。 しかし、データは大企業だけのものではありませんし、自分でデータを集めて分析する必要もありません。
データの分析方法を学びたい、データの可視化をしたい、データリテラシーを高めたいと考えている方には、公共のデータセットは最適な場所です。 ここでは、今すぐ無料で分析できる素晴らしいパブリックデータセットをいくつかご紹介します。
Google Trends
Curated by: Google
サンプル データ セット。 “Cupcake” search results
これは、分析するのに最も広く、最も興味深い公開データ セットの 1 つです。 Googleの広大な検索エンジンは、検索語データを追跡し、人々がいつ何を検索しているかを示します。 2004年以降のほぼすべての検索語について、検索ボリュームの統計を調べることができます。
さまざまなフィルターを使って、場所(世界中または国別)、さまざまな時間範囲、カテゴリ、さらには特定の検索タイプ(ウェブ vs 画像 vs YouTube の検索結果)に応じてトレンドを絞り込むことができます。 トレンドのトップページでは、今どんなトピックが人気なのか、何が現在トレンドになっているのかを簡単に確認することができます。
さらにGoogleのデータに興味がある方は、Google Finance、Google Public Data、Google Scholarをチェックしてみてください。
National Climatic Data Center
Curated by: National Centers for Environmental Information (旧NOAA)
サンプルデータセットです。
もしあなたが気象や気候の科学に興味があるなら、National Climatic Data Centerよりも詳細なデータを得ることはできません。
ここでは、世界最大の環境データのアーカイブである、アメリカ全土の気候・気象データセットのアーカイブを見ることができます。 気象データ、海洋データ、気候データ、大気データ、地球物理データなど、あらゆる気象データの巨大なリソースとなっています。
Global Health Observatory data
Curated by: 世界保健機関(WHO)
サンプルデータセットです。
Curated by: World Health Organization (WHO)
Example data set: Universal access to reproductive health
世界保健機関(WHO)は、世界の健康に関するデータをGlobal Health Observatory(GHO)で公開しています。 GHOは、健康状態や重要なテーマにアクセスして分析するためのポータルとして機能しています。
さまざまなデータセットは、死亡率、健康システム、感染症と非感染症、医薬品とワクチン、健康リスクなどのテーマごとに整理されています。
Data.gov.sg
Curated by: シンガポール政府
データセットの例です。 Singapore Residents By Age Group, Ethnic Group And Gender, End June, Annual (2017)
インターネット上には、実は素晴らしい政府のデータサイトがたくさんあります。 そのほとんどが、驚くほど豊富なデータと情報を持っています。 アメリカにはdata.govという最も有名なサイトがありますし、イギリスやオーストラリアにも素晴らしい対応サイトがあります。 これらのサイトでは、大規模な人口サンプルを用いて、多くのデータにアクセスすることができます。
それにしても、シンガポールの政府データサイトは、視覚的にアクセスしやすいですね。 ホームページには、各データセットについてのストーリーを伝える小さなビジュアライゼーションがたくさんあります。 データビジュアライゼーションでは、情報を正確かつ適切な形で表示するだけでなく、興味を引くようにアピールすることも重要です。 政府のデータサイトの多くは、データをわかりやすく伝えるための実用的でシンプルなものです。
Earthdata
Curated by: NASA
サンプルデータセット。 Atmospheric Electricity (Lightning)
EarthdataはNASAのEarth Science Data Systems Programの一部であり、特にEOSDIS (Earth Observing System Data and Information System)に属しています。
Earthdataは、NASAの地球科学データシステムプログラムの一部であり、特にEarth Observatory System Data and Information System (EOSDIS)は、地球観測衛星、航空機、フィールド計測から得られる地球科学データを処理し、配信する手段として機能しています。
Amazon Web Services Open Data Registry
Curated by: Amazon
サンプルデータセット。 1000ゲノムプロジェクト
より多くの組織がデータを公開するのに伴い、アマゾンはそれらの様々なデータセットを見つけて共有するためのレジストリを作成しました。 アマゾンのレジストリを通じてサポートされているパブリックデータセットは50以上あり、IRSのファイリングからNASAの衛星画像、DNAシーケンス、ウェブクローリングまで多岐にわたっています。
Pew Internet
Curated by: Pew Research Center
データセットの例を示します。 Teens, Social Media & Technology 2018
ピュー・リサーチ・センターのミッションは、世界中からデータを収集し、分析することです。 政治、ソーシャルメディア、ジャーナリズム、経済、オンラインプライバシー、宗教、人口動態など、あらゆる種類のトピックを扱っています。 彼らは超党派で主張しない独自の調査・分析を行う一方で、生のデータを一般に公開しています。
ある意味、データにアクセスできるようにすることは、Pewのもう一つの研究プロジェクトでもあります。
ある意味、データにアクセスできるようにすることは、Pewのもうひとつの研究プロジェクトでもあります。彼らは、自分たちが研究でどのようにデータを使用しているかについて、すでにすべての情報を持っています。 彼らの要求は1つ、取得したデータの結果として何か発表された場合には、電子メールで連絡することです。