講座と書いてますが、リンクとメモ書き程度のことが中心です
前処理時済みテキストコーパス
ja.text8 ・・・ wikipediaのデータから余分の情報をカットしたもの
text8 ・・・ 本家text8はこちら
GPT関係
rinna Co., Ltd の言語モデル