コードネームは初話ユウ

自然言語処理でいろいろやってみる

2012-09-20から1日間の記事一覧

cabochaソースを読む(2)入力データから情報抽出

前記事の続き。 tree->read() (tree.cpp l.406) が文字列入力からデータ構造を構築する。まずデータ構造の宣言をチェック。 cabocha.h に struct cabocha_chunk_t (l.75), struct cabocha_token_t (l.87) の宣言がある。chunk が文節、token が形態素。ちな…