情報系大学院生のブログ

M1河田。研究の備忘録として論文やプログラムについて書いています。

2018-04-13から1日間の記事一覧

コーパスの加工(毎日新聞)

今回は自然言語処理の研究で行う 「コーパスの処理」 について僕が行った方法などを紹介する。 使ったデータ 研究室で購入している毎日新聞のコーパスを使用した。大体こんなかんじでタイトルや本文ごとにタグが付与されている\T1\○○山の桜、満開 \T2\ ○…