Open Dataset/Corpus
言語データ
言語データベースとソフトウェア ・・・ 国立国語研究所で開発されたコーパス,辞書,ソフトウェア
少納言 ・・・現代日本語書き言葉コーパス
名大会話コーパス ・・・
ASPEC ・・・ Asian Scientific Paper Excerpt Corpus(論文のアブストラクト)
言語資源協会(GSK) ・・・ 言語処理に利用できる各種データを提供しています。
辞書
EDICT ・・・ Japanese-English Dictionary file
学習者コーパス