-
地震データ
政府 地震調査研究推進本部や関係機関が保有・公開する様々なデータ。 -
ペットボトル緑茶に関する会場調査データ (滋賀大学調べ)
緑茶飲料の味覚・購入意向を、試飲・アンケートにより調査したデータ。 対象者はインターネット調査による事前調査を用いて会場に呼集した258名。 収集した生データから、基本的な分析の流れと分析結果までを含む。 -
日本古典籍データセット(無料)
古典籍画像データ: 701 点の各作品について,その全冊(約16 万コマ)のJPEG 形式の画像データ。 IIIF規格でのページ毎の閲覧が可能。ZIPでの書誌単位でのダウンロードも可能。ファイルサイズが小さくて済む書誌データ、本文テキストデータ、タグデータのみの配布もあり。 -
Yahoo!知恵袋データセット
「Yahoo!知恵袋」の解決済みとなった質問と回答(期間:2004年4月-2009年4月 質問数:約1600万 回答数:約5000万)を、国立情報学研究所がヤフー株式会社から提供を受けて研究者に提供。 (申込み必要) データ利用時のライセンスについては、データ提供元のライセンスに従って下さい。 -
人口総数:総務省『国勢調査』
市区町村別の人口総数を時系列で整理したCSVファイル。(DATA.GO.JPの総務省提供データより選定) -
旅客地域流動統計
都道府県間の旅客移動人数を様々な移動手段(鉄道、自動車、バス、船舶、航空 等)毎に集計した統計データ。(DATA.GO.JPの国交省提供データより選定) -
全産業活動指数 時系列データ
全産業活動指数は全産業の生産活動状況を供給面から捉えることを目的とするデータ。(DATA.GO.JPの経産省提供データより選定) -
教育用標準データセット
e-Statに収録されている「都道府県・市区町村のすがた(社会・人口統計体系)」の市区町村データから約100項目余を抜き出し、縦に市区町村、横にデータ項目が並ぶ表形式のデータに整備したデータ。 -
the KIT Whole-Body Human Motion Database
光学式モーションキャプチャで計測した身体運動とラベルのデータセット -
CMU Graphics Lab Motion Capture Database
光学式モーションキャプチャで計測した身体運動のデータセット -
NEXRAD on AWS
次期世代気象レーダーのセンサーデータ -
Landsat on AWS
ランドサット 8 号衛星により作成中の地球全土の衛星画像データ -
MNIST
0から9までの手書きで書かれた数字の画像データ。28×28ピクセルのグレースケールの画像で、60000枚のトレーニング画像と10000枚のテスト用画像。 -
CIFAR-10
飛行機,車,鳥,猫,鹿,犬,蛙,馬,船,トラックの10種類のカテゴリに分類された32×32ピクセルのカラー画像データ。カテゴリごとに6000枚,合計60000枚(トレーニング用に50000枚,テスト用に10000枚)。 -
STL-10 dataset
飛行機,車,鳥,猫,鹿,犬,蛙,馬,船,トラックの10種類のカテゴリに分類された96×96ピクセルのカラー画像データ.カテゴリごとにトレーニング画像500枚,テスト画像800枚.また,100000枚のラベルのない画像データ(10種のカテゴリに属さないものも有)も含む. -
UME-JRF
留学生による読み上げ日本語音声データベース(WAV: 16kHz・16bit・Mono). (申込みが必要) -
UME-ERJ
日本人学生による読み上げ英語音声データベース(WAV: 16kHz・16bit・Mono).( (申込みが必要) -
livedoor ニュースコーパス(無料)
9 カテゴリのニュース記事,CC BY-ND 日本語の雑多なニュースからCCライセンスの記事のみを取り出し、HTMLタグなどを自動的に取り除いて文章のみとしたもの。テキストの他、Apache Solr向けのデータも提供されている。Apache -
気象庁過去の気象データ(無料)
アメダスなどの気象にまつわるデータ.各地点ごとの気温・降水量・日照時間・積雪・降雪・風・湿度・気圧・天気など。 -
国民生活基礎調査
世帯数と世帯人員の状況、各種世帯の所得等の状況、世帯員の健康状況、介護の状況等の結果を提供。全国の世帯及び世帯員を対象に、保健、医療、福祉、年金、所得等国民生活の基礎的事項を調査し、厚生労働行政の企画及び運営に必要な基礎資料を得ることを目的とし、昭和61年を初年として3年ごとに大規模な調査を実施し、中間の各年は簡易な調査を実施している。