2018年9月、Googleはローンチしました 新しいデータセット検索エンジン 研究者が公的な情報源からの大規模なデータセットを注ぐのを助けることを目的としています。これらには、国勢調査データ、人口統計調査、医学研究など、あらゆるものが含まれます。
データセットは、主に学術研究者が数値を計算してパターンを抽出するためのものです。しかし、通常の素人でも、一部のデータセットは探索するのが魅力的です。
Googleデータセット検索の仕組み
長年にわたり、Googleの検索エンジンの最大の弱点の1つは、 地下インターネット 見えないままでした。
このインターネットは、情報自体がGoogleのWebクローラーで検索できないため、「地下」のままでした。これは、データが特別な検索クエリを必要とするデータベースに保存されているか、ダウンロードして分析することしかできないデータファイルとして保存されているためです。
ただし、Google Dataset Searchを使用して情報を検索すると、ウェブサイトを返す代わりに、データベースのリストが返されます。
これらのデータベースのいずれかをクリックすると、ソースデータへのリンクが表示されます。
ソースデータには、検索可能なデータベース、ダウンロード可能なファイル、またはデータベースに含まれる大量の情報を分析および視覚化するのに役立つオンライン視覚化ツールが含まれる場合があります。
どんな情報がありますか?
改装されたMacBookを購入するのに最適な場所
Googleのデータセット検索エンジンからリンクされている最も興味深いデータセットのいくつかを以下に示します。
1.1。 米国海洋大気庁
Googleデータセットを通じて、NOAAEV2画像アクセスシステムへのリンクを見つけることができます。
これは、マイクロフィッシュからデジタル形式までの古い気候データの印象的なアーカイブであり、一般の人々に無料で提供されています。
このデータベースから引き出すことができる印象的なレコードのいくつかは次のとおりです。
- 数十年前にさかのぼる気温、降水量、および風のデータの空港気象観測所の記録
- 場合によっては1800年代後半にさかのぼる毎日の気温と降水量の気象観測所の測定値
- 何年も前に遡る国立気象局と連邦航空局で記録された降水量データ
いずれの場合も、データが必要な状態を選択する必要があります。戻ってデータをプルできる年数は、状態によって異なります。
アームチェアの気候学者、または単に地球規模の気候変動に関心のある人にとって、これは注目に値するリソースです。
2.2。 NOAAインタラクティブマップ
ダウンロード可能なデータセットに加えて、Google Datasetsには、NOAAのインタラクティブマップへのリンクもあります。
これらのマップは、日付と測定値に基づいて気候データのビューを調整できる、信じられないほどのリソースです。
NOAAインタラクティブマップには、次の各データトレンドの視覚的表現が含まれています。
- すべてのデータの毎日または毎月の観測
- 降雪レベルのみ
- 歴史的な世界の海上輸送トラック
- 1995年から2010年までの気象レーダー画像
- 1981年から2010年までの平年値(30年間の気候変数の平均)
これらの地図は、何年にもわたって調べ、地球の気候がどのようにゆっくりと変化したかを観察するのに魅力的です。気候学者でない人にとっても、これらのインタラクティブな地図は素晴らしいリソースです。
3.NASAストームトラック[利用できなくなりました]
NASAのウェブサイトは常に有用な情報の倉庫でした。多くの人が気付いていないかもしれませんが、世界中の気象パターンに関する衛星データも収集して共有しています。
最も広範なデータセットの1つは、NASAの温帯低気圧のアトラスです。 1961年から1998年までの暴風雨データをカバーしています。データセットページから、月または季節と年を選択し、その年に発生した主要な暴風雨の次の側面のいずれかのダウンロードを要求できます。
- 周波数
- 強度
- 周波数、極投影
- 強度、極投影
- トラック
数十年前にさかのぼる嵐のパターンをレビューすることは印象的です。これは、気候パターンを探している研究者にとって貴重なデータのライブラリです。
4. WHISPers [壊れたURLが削除されました]
WHISPersは、野生生物の健康情報共有パートナーシップのイベント報告システムです。これは、米国で発生した最近の20の野生生物の健康イベントを示すインタラクティブマップです。
ニュースでは、鳥の大量死、コウモリの個体数を殺す病気、慢性消耗病の症例について耳にすることがあります。しかし、このマップを監視すると、そのようなケースのクラスターがメディアに表示されるずっと前に表示されます。
5.5。 人間のエボラ出血熱の発生
人間の病気の蔓延は、従うべき魅力的な分野です。エボラ出血熱の発生ほど恐ろしい現代の人間の病気の発生はありません。西アフリカは、2014年にこの地域で人類史上最悪のエボラ出血熱の発生が見られたときにニュースを発表しました。
ただし、過去に他のエボラ出血熱の発生がありました。それらは、Figshareが提供するこのオンラインデータベースでログに記録され、共有されます。
データセットは1976年に始まり、現在まで続いています。アウトブレイクの増減、アウトブレイクがないように見える期間、そしてそれらがどれほど積極的に再開しているように見えるかを追跡するのは興味深いことです。
詳細なデータセットは、一般データのオンラインWebバージョンからダウンロードできます。
6.6。 世界の人口推計と予測
Googleデータセットで「世界の人口推計」を検索すると、世界銀行のインタラクティブな「人口推計と予測」ツールへのリンクが見つかります。
これは、プロットする国と一連のデータから選択できる印象的なツールです。右側には、データの結果が表、グラフ、またはマップの形式で表示されます。
人口統計や国などの要因にわたる人口予測の傾向を確認することは非常に明白です。このツールを使用すると、時間を大幅に節約できます。メタデータを自分で掘り下げてこれらのグラフを作成する代わりに、世界銀行のツールがすべてを行います。
さらに印象的なのは、人口データベースに限定されないことです。メインデータベースを人口から貧困、国民皆保険、仕事、教育統計などに切り替えることができます。
Googleが提供するデータセットリンクの中で、これは最も便利なものの1つです。
7。 国立UFO報告センター
Google Datasetsを深く掘り下げるほど、どのような種類の情報を発見できるかに驚くでしょう。
たとえば、国立UFOレポーティングセンターから昨年のすべてのUFOレポートをダウンロードするためのリンクがあります。データには、事件の場所、発見された物体の種類、目撃が続いた時間、目撃者の要約などが含まれます。
クラスター化された目撃情報の時間と場所に基づいてパターンを見つけることができると思いますか?データセット全体をダウンロードし、相関関係を探して、試してみてください。
Googleデータセットの検索
Google DatasetsSearchを使用して見つける情報の量は印象的です。上記の例は、氷山の一角にすぎません。あなた自身のいくつかのキーワードをタイプしてみて、あなたがあなた自身を発見することができるものを見てください。
また、見つけた大量のデータを分析する方法がわからない場合は、Excelにロードしてください。 Excelは、大量のデータセットを分析するための強力なツールです。これまでにこれを行ったことがない場合は、 Excelのデータ分析機能 あなたが明らかにするすべての情報を掘り下げ始める前に。
共有 共有 つぶやき Eメール これらのWindowsファイルとフォルダを削除して、ディスク領域を解放しますWindowsコンピュータのディスク領域をクリアする必要がありますか?ディスクスペースを解放するために安全に削除できるWindowsファイルとフォルダは次のとおりです。
次を読む 関連トピック- インターネット
- グーグル
- Web検索
- ビッグデータ
ライアンは電気工学の理学士号を取得しています。彼は自動化エンジニアリングで13年間、ITで5年間働いており、現在はアプリエンジニアです。 MakeUseOfの元編集長であり、データの視覚化に関する全国会議で講演され、全国のテレビやラジオで取り上げられました。
RyanDubeのその他の作品ニュースレターを購読する
ニュースレターに参加して、技術的なヒント、レビュー、無料の電子書籍、限定セールを入手してください。
購読するにはここをクリックしてください