未経験からの自然言語処理(NLP) 実践入門

MeCab(形態素解析)をPythonから2分で使えるようにする方法

  • このエントリーをはてなブックマークに追加
  • Pocket
MeCabをPythonから使う方法

Javaだと、Kuromojiを使用するまでに必要な手続きは、基本的にjarファイルを追加するだけで完了しますので、形態素解析を使うまでの敷居は高くありません。

しかし、PythonでMeCabを使おうとすると、セットアップに時間を取られてしまうことがあります。

ですので、今回は最小限の労力で、PythonからMeCabを使う方法を紹介致します。

使用した環境

  • Ubuntu 16.04
  • python3、pipはインストールされていると仮定

*インスタンスを用意した直後の、何も手を加えていないインタクトなマシンの状態のままです。

1.MeCabのインストール(1分以内)

コマンドを打ち間違えなければ、完了まで1分かかららず、ご活用いただけるはずです。

MeCabを使えるようにするという事だけを優先するので、MeCabの詳細等は、別途御確認頂ければと存じます。

1-1.MeCab本体のインストール

git clone https://github.com/taku910/mecab.git
cd mecab/mecab
./configure  --enable-utf8-only
make
make check
sudo make install

1-2.辞書(ipadic)のインストール

cd ../mecab-ipadic
./configure --with-charset=utf8
make
sudo make install

1-3.MeCabの動作確認

% mecab
すもももももももものうち
すもも 名詞,一般,*,*,*,*,すもも, スモモ, スモモ
も   助詞,係助詞,*,*,*,*,も, モ, モ
もも  名詞,一般,*,*,*,*,もも, モモ, モモ
も   助詞,係助詞,*,*,*,*,も, モ, モ
もも  名詞,一般,*,*,*,*,もも, モモ, モモ
の 助詞,連体化,*,*,*,*,の, ノ, ノ
うち 名詞,非独立,副詞可能,*,*,*,うち, ウチ, ウチ

ここまで、1分。

2.PythonとMeCabの連携(1分以内)

2-1.Pythonバインディングのインストール

sudo pip install mecab-python3

2-2.Python3からMeCab動作確認

python3
>>> import sys
>>> import MeCab
>>> mecab = MeCab.Tagger("-Ochasen")
>>> print(mecab.parse("今日はいい天気ですね。"))
今日  キョウ   今日  名詞-副詞可能
は ハ は 助詞-係助詞
いい  イイ  いい  形容詞-自立    形容詞・イイ  基本形
天気  テンキ   天気  名詞-一般
です  デス  です  助動詞   特殊・デス 基本形
ね ネ ね 助詞-終助詞
。 。 。 記号-句点
EOS

ここまで合計で2分以内のはずです。これだけ簡単に、PythonからMeCabを使用する事ができれば、セットアップの手間を大きく軽減できますね。

ご質問等ございましたら、以下コメント欄よりお気軽にお問合せ下さい!

【動画あり】AI店員(人工知能)が小売業・流通業の接客を可能に!ニュースにも登場!

AI店員

お知らせ

2017/12/12 【セミナー】【世界最高レベルの精度のAIチャットボットを開発・導入する方法】 2017/02/18(日) 東京 開催

2017/12/12 【プレスリリース】レッジ、ウェブライダー、SPJが共同で機械学習を用いた文章校正の共同研究を開始

2017/12/08 AI店員がテレ朝に掲載されました!弊社の対話エンジン搭載!(動画あり)

2017/12/05 年末年始休業のお知らせ(2017/12/29-2018/1/3)

2017/12/04 【プレスリリース】【AIが人手不足を解消】小売業に特化したAI接客システムを開発、多言語対応で外国人の接客も可能に!

過去のお知らせ一覧

アクセス・ランキング

人気AI記事 月間ランキングTOP25

詳しくはこちら

よく一緒に読まれているAI記事

音声アシストとは?4つの音声アシスタント代表的製品を比較... あらすじ 人工知能ブームがますます加速する現在、Siriに代表される音声アシストは、どんどん存在感を増していき、それを追従するような製品が、大手企業やベンチャー企業まで、幅広くリリースされるようになってきました。 音声アシスト・アプリが便利なのは、スマートフォン等の機器にデフォルトで搭載され...
【入門】トピックモデルとは?トピック分析の3つの手法を解説... 1.あらすじ 人工知能ブームの昨今、人間の話し言葉や、書き言葉を機械に学習させ理解させたり、人間の思考的なものを人工知能技術を使用して実現させようという、NLP(自然言語処理)は未来を切り開く技術として大きな注目を集めており、人工知能の花形ということができるでしょう。 NLPの応用範囲は幅広...
Bag of wordsでのテキストマイニング最速精度向上方法... 空前のAI(人工知能)ブームで、NLP(自然言語処理)に興味を持ち、MeCabやKuromoji等の形態素解析器を試した方は多いと思います。 ただし、いまいち形態素解析器が何に活かせるのか把握していない人は多く、その出力をどう料理すればいいのかわからない人が多いのも事実です。 そこで、本...
あの!パリのフラワーショップ「MONCEAU FLEURS(モンソーフルール)」銀座マロニエゲート店... あのパリのフラワーショップ、モンソーフルール【MONCEAU FLEURS】銀座マロニエゲート店に新人AIスタッフ(Helene エレーヌ)が登場します。 エレーヌはお花の事を沢山知っているAI店員です。エレーヌはお客様の顔を認識し、会話によってお客様お一人お一人にお好みのアレンジをお奨めしま...
Jupyter Notebookで最速でディープラーニング環境を構築する方法... とりあえず、話題の機械学習とやらに触れてみたい! ディープラーニングを最速で試してみたいが、プログラミング経験が無いので、とりあえず簡単にスグに動かせる環境が欲しい! そんな方へ向けて、Jupyter Notebookを使用し、最速でディープラーニングをブラウザ上で実行出来る環境を構築す...

最新の人工知能アルゴリズムをSNSでお届けします

Leave a Reply

*