Python, web, Algorithm 技術的なメモ

技術的なメモを書いていきます.pythonistaを目指しています.

mysqlを使う前に気をつける事

mysqlを使う前に気をつける事

いつも忘れするんだけれど,mysqlを使う前に文字コードの設定を行いましょう. ということで,いつも設定し忘れるのでmysqlの備忘録です.

mysqlをインストールしたら,/etc/mysql/my.conf/etc/my.confに 下記の設定を追加してutf-8にしましょう.

[client]
default-character-set=utf8
[mysqld]
character-set-server = utf8

設置をチェックする時は

SHOW VARIABLES LIKE 'character_set%';

このコマンドでチェックします.結果はこのように表示されます.

+--------------------------+----------------------------+
| Variable_name            | Value                      |
+--------------------------+----------------------------+
| character_set_client     | utf8                       |
| character_set_connection | utf8                       |
| character_set_database   | utf8                       |
| character_set_filesystem | binary                     |
| character_set_results    | utf8                       |
| character_set_server     | utf8                       |
| character_set_system     | utf8                       |
| character_sets_dir       | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+

以上です.コメントなどあればいつでもお待ちしております.

tinysegmenter3をPyPIに登録したよ (分かち書きモジュール)

mecabなしで分かち書きができるモジュールTinySegmenter3PyPIに登録しました.

元々はjsで書かれていたTinySegmenterpythonに書き直した方がいます.ここ参照

しかし,PyPIにpython3に対応したパッケージが無かったので,作成し公開致しました.

インストールの方法

pip install tinysegmenter3

として頂ければインストールできます.

使用例:

from tinysegmenter import TinySegmenter
segmenter = TinySegmenter()
statement = '私はpython大好きStanding Engineerです.'
tokenized_statement = segmenter.tokenize(statement)
print(tokenized_statement)
# ['私', 'は', 'python', '大好き', 'Standing', ' Engineer', 'です', '.']

ちなみに,これはpython3.x,python2.xどちらでも利用出来ます.
メンテは僕のgithub上で行っているので,いつでもPR, issue, マサカリ受け付けています.

P.S みなさん,python3を使いましょうね!

pip install nltk3-alpha

pip install nltk3-alpha

nltkのプロジェクトではpipが使えますが,pip3に対応しているのにはバグがあり, 正しくインストールできません.ただnltk3-alphaをソースからインストールすることはできますが,zipを展開して,python setup.py installとかやらないといけません.

再度インストールする時にこれをまたやるのが辛いので,pipでインストールできるようにしました.

インストールの方法

pip install git+https://github.com/SamuraiT/nltk3-alpha

はい,これだけです.

インストールしたら.

import nltk

してみて下さい.エラーが出なければ正常にインストールされています.

はい,そろそろpython3移行を考えましょう.

python3に対応したMecabのインストールはmecab-python3 installの記事を見てね.