-
日本古典籍データセット(無料)
古典籍画像データ: 701 点の各作品について,その全冊(約16 万コマ)のJPEG 形式の画像データ。 IIIF規格でのページ毎の閲覧が可能。ZIPでの書誌単位でのダウンロードも可能。ファイルサイズが小さくて済む書誌データ、本文テキストデータ、タグデータのみの配布もあり。 -
the KIT Whole-Body Human Motion Database
光学式モーションキャプチャで計測した身体運動とラベルのデータセット -
CMU Graphics Lab Motion Capture Database
光学式モーションキャプチャで計測した身体運動のデータセット -
MNIST
0から9までの手書きで書かれた数字の画像データ。28×28ピクセルのグレースケールの画像で、60000枚のトレーニング画像と10000枚のテスト用画像。 -
livedoor ニュースコーパス(無料)
9 カテゴリのニュース記事,CC BY-ND 日本語の雑多なニュースからCCライセンスの記事のみを取り出し、HTMLタグなどを自動的に取り除いて文章のみとしたもの。テキストの他、Apache Solr向けのデータも提供されている。Apache