mysqlを使う前に気をつける事
mysqlを使う前に気をつける事
いつも忘れするんだけれど,mysqlを使う前に文字コードの設定を行いましょう. ということで,いつも設定し忘れるのでmysqlの備忘録です.
mysqlをインストールしたら,/etc/mysql/my.conf
か/etc/my.conf
に
下記の設定を追加してutf-8
にしましょう.
[client] default-character-set=utf8 [mysqld] character-set-server = utf8
設置をチェックする時は
SHOW VARIABLES LIKE 'character_set%';
このコマンドでチェックします.結果はこのように表示されます.
+--------------------------+----------------------------+ | Variable_name | Value | +--------------------------+----------------------------+ | character_set_client | utf8 | | character_set_connection | utf8 | | character_set_database | utf8 | | character_set_filesystem | binary | | character_set_results | utf8 | | character_set_server | utf8 | | character_set_system | utf8 | | character_sets_dir | /usr/share/mysql/charsets/ | +--------------------------+----------------------------+
以上です.コメントなどあればいつでもお待ちしております.
tinysegmenter3をPyPIに登録したよ (分かち書きモジュール)
mecab
なしで分かち書きができるモジュールTinySegmenter3
をPyPIに登録しました.
元々はjsで書かれていたTinySegmenterをpythonに書き直した方がいます.ここ参照
しかし,PyPIにpython3に対応したパッケージが無かったので,作成し公開致しました.
インストールの方法
pip install tinysegmenter3
として頂ければインストールできます.
使用例:
from tinysegmenter import TinySegmenter segmenter = TinySegmenter() statement = '私はpython大好きStanding Engineerです.' tokenized_statement = segmenter.tokenize(statement) print(tokenized_statement) # ['私', 'は', 'python', '大好き', 'Standing', ' Engineer', 'です', '.']
ちなみに,これはpython3.x
,python2.x
どちらでも利用出来ます.
メンテは僕のgithub上で行っているので,いつでもPR, issue, マサカリ受け付けています.
P.S みなさん,python3を使いましょうね!
pip install nltk3-alpha
pip install nltk3-alpha
nltkのプロジェクトではpipが使えますが,pip3に対応しているのにはバグがあり,
正しくインストールできません.ただnltk3-alphaをソースからインストールすることはできますが,zipを展開して,python setup.py install
とかやらないといけません.
再度インストールする時にこれをまたやるのが辛いので,pipでインストールできるようにしました.
インストールの方法
pip install git+https://github.com/SamuraiT/nltk3-alpha
はい,これだけです.
インストールしたら.
import nltk
してみて下さい.エラーが出なければ正常にインストールされています.
はい,そろそろpython3移行を考えましょう.