解析エンジニアの自動化 blog

コツコツと自動化した方法を残す blog

10 秒で出来る形態素解析【python】【janome】【Windows】



こんにちは。
仕事の自動化にやりがいと達成感を感じるガッくんです。


この記事の目次



背景・目的


自然言語処理をやってみたくなったので、とりあえず形態素分析をやりました。



動作環境


Windows 7
・winpython 64bit 3.4.4
janome

事前に winpython はインストールされていることを前提とします。



プログラム

janome インストール

WinPython Command Prompt から pip でインストールします。

図1 janome インストール

コマンドはこちら

図2 janome インストール

ソースコード


from janome.tokenizer import Tokenizer

t = Tokenizer()

for token in t.tokenize(u'私はこの味が好ましくない。'):
    print(token)



結果


In [1]: runfile('C:/WinPython-64bit-3.4.4.6Qt5/settings/.spyder-py3/temp.py', wdir='C:/WinPython-64bit-3.4.4.6Qt5/settings/.spyder-py3')
私       名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ
は       助詞,係助詞,*,*,*,*,は,ハ,ワ
この      連体詞,*,*,*,*,*,この,コノ,コノ
味       名詞,一般,*,*,*,*,味,アジ,アジ
が       助詞,格助詞,一般,*,*,*,が,ガ,ガ
好ましく    形容詞,自立,*,*,形容詞・イ段,連用テ接続,好ましい,コノマシク,コノマシク
ない      助動詞,*,*,*,特殊・ナイ,基本形,ない,ナイ,ナイ
。       記号,句点,*,*,*,*,。,。,。
 
In [2]:

図3 結果



コメント

たったこれだけで形態素分析が出来ちゃいます。



以上