tinysegmenter3をPyPIに登録したよ (分かち書きモジュール)
mecab
なしで分かち書きができるモジュールTinySegmenter3
をPyPIに登録しました.
元々はjsで書かれていたTinySegmenterをpythonに書き直した方がいます.ここ参照
しかし,PyPIにpython3に対応したパッケージが無かったので,作成し公開致しました.
インストールの方法
pip install tinysegmenter3
として頂ければインストールできます.
使用例:
from tinysegmenter import TinySegmenter segmenter = TinySegmenter() statement = '私はpython大好きStanding Engineerです.' tokenized_statement = segmenter.tokenize(statement) print(tokenized_statement) # ['私', 'は', 'python', '大好き', 'Standing', ' Engineer', 'です', '.']
ちなみに,これはpython3.x
,python2.x
どちらでも利用出来ます.
メンテは僕のgithub上で行っているので,いつでもPR, issue, マサカリ受け付けています.
P.S みなさん,python3を使いましょうね!