(^^)v3 smile peace ver.3

自分で書き込み。
まだ、未登録単語が多くて使い物になりませんね。普段使っているATOKから自身で登録した単語を引き出してchasenの辞書にコンバートしてみようかとも思っています。
ただ、"iBlog" などの英単語に関してはどうしたものか...辞書の育成というのは鍵になりそうです。

もう一段階増えたってことですね。


さらに自分で書き込み。
設定で、英単語を連続した記号として読み込ませてやることができるようなのでそれを採用。さらに、上記「output.txt」はsedでタグを切り取ってからchasenにかけてみたのだけど、タグそのものをコメントとして出力させてしまうことにすれば一手間省けるかな。
まぁなんにせよ、「會澤」が「會(未知語)」と「澤(名詞)」になるのは辞書を鍛えるしかないなと痛感。


chasen は僕の iBlog のブログで使っています。僕の iBlog のブログには類似エントリがあるじゃないですか。あれに使っています。

chasen の結果をそのまま利用すると未知語に悩む場面が出てきますが、chasen の設定に加えて、ちょっと結果を加工すると気にならないくらいにできます。

タグクラウドに使いたいのでしたら GETA の活用をお薦めします。google で GETA を検索すると一発で出てきます。


類似エントリはおそらくchasen(もしくはそれに類するもの)を使用しているんだろうなと想像しておりました。あとそれに類義語の連想エンジン...と思っていたのですが、それがGETAということなんですね。面白いなぁ。

早速やってみます。


Name:

URL:

Comment:  ? 

 

Commenting by HaloScan