未経験からの自然言語処理 実践入門

MeCab(形態素解析)をPythonから2分で使えるようにする方法

  • このエントリーをはてなブックマークに追加
  • Pocket
MeCabをPythonから使う方法

Javaだと、Kuromojiを使用するまでに必要な手続きは、基本的にjarファイルを追加するだけで完了しますので、形態素解析を使うまでの敷居は高くありません。

しかし、PythonでMeCabを使おうとすると、セットアップに時間を取られてしまうことがあります。

ですので、今回は最小限の労力で、PythonからMeCabを使う方法を紹介致します。

使用した環境

  • Ubuntu 16.04
  • python3、pipはインストールされていると仮定

*インスタンスを用意した直後の、何も手を加えていないインタクトなマシンの状態のままです。

1.MeCabのインストール(1分以内)

コマンドを打ち間違えなければ、完了まで1分かかららず、ご活用いただけるはずです。

MeCabを使えるようにするという事だけを優先するので、MeCabの詳細等は、別途御確認頂ければと存じます。

1-1.MeCab本体のインストール

git clone https://github.com/taku910/mecab.git
cd mecab/mecab
./configure  --enable-utf8-only
make
make check
sudo make install

1-2.辞書(ipadic)のインストール

cd ../mecab-ipadic
./configure --with-charset=utf8
make
sudo make install

1-3.MeCabの動作確認

% mecab
すもももももももものうち
すもも 名詞,一般,*,*,*,*,すもも, スモモ, スモモ
も   助詞,係助詞,*,*,*,*,も, モ, モ
もも  名詞,一般,*,*,*,*,もも, モモ, モモ
も   助詞,係助詞,*,*,*,*,も, モ, モ
もも  名詞,一般,*,*,*,*,もも, モモ, モモ
の 助詞,連体化,*,*,*,*,の, ノ, ノ
うち 名詞,非独立,副詞可能,*,*,*,うち, ウチ, ウチ

ここまで、1分。

2.PythonとMeCabの連携(1分以内)

2-1.Pythonバインディングのインストール

sudo pip install mecab-python3

2-2.Python3からMeCab動作確認

python3
>>> import sys
>>> import MeCab
>>> mecab = MeCab.Tagger("-Ochasen")
>>> print(mecab.parse("今日はいい天気ですね。"))
今日  キョウ   今日  名詞-副詞可能
は ハ は 助詞-係助詞
いい  イイ  いい  形容詞-自立    形容詞・イイ  基本形
天気  テンキ   天気  名詞-一般
です  デス  です  助動詞   特殊・デス 基本形
ね ネ ね 助詞-終助詞
。 。 。 記号-句点
EOS

ここまで合計で2分以内のはずです。これだけ簡単に、PythonからMeCabを使用する事ができれば、セットアップの手間を大きく軽減できますね。

ご質問等ございましたら、以下コメント欄よりお気軽にお問合せ下さい!

  • このエントリーをはてなブックマークに追加
  • Pocket

アクセス・ランキング

人気AI記事 月間ランキングTOP25

詳しくはこちら

よく一緒に読まれているAI記事

ディープラーニングで文章のカテゴリー分類を自動化する方法... 1.あらすじ 人工知能という言葉が、昨今、ますます身近になってきており、Siriなどの対話システムも日々発達してきています。 また、人間の言語を人工知能に解釈させる対話システムの需要が増えると共に、NLP(自然言語処理)のニーズも日に日に高くなって来ています。 NLP分野では、画像処理...
決定木の2つの種類とランダムフォレストによる機械学習入門... 1.あらすじ 空前の人工知能ブームの昨今、ディープラーニングを始めとする、人工知能技術の中心である「機械学習」に対する期待と、世の中の需要は日に日に上昇してきています。 ディープラーニングも、ニューラルネットをベースにした機械学習の1つであり、現在の人工知能分野で主流のアルゴリズムになってい...
音声認識の仕組みと、隠れマルコフモデル(HMM)... 1.あらすじ Siriや、Google音声アシスタント等、音声アシスタントアプリケーションは、すっかりと日常生活に浸透し、実際に使用している読者の方も多いかと思います。 使用された方はお気づきかと思いますが、そういったアプリの音声認識の精度はかなり素晴らしく、十分実用に達しています。 ...
【入門】自然言語処理の8つの課題と解決策とは?... 1.自然言語とは何か? 言語は、私たちの生活の中に常にあり、また、なくてはならないものです。 そんな日々当たり前に使われる言語を見つめ直し、解析すると、どんな興味深いものが見えてくるのでしょうか。 1-1.言語の世界とは? 「自然言語処理」の「自然言語」とは何か? 言語には、大きく...
対話システムを構成する2つの仕組みと、フレームワークとは?... 1.あらすじ 昨今の人工知能ブームで、Siriに話しかけている人や、店頭にいるpepper等のロボットに話しかけている人、また、Line上でりんなに話しかけて対話を楽しんでいる人等が増えてきていると思います。 また、商業的な観点からは、コンタクトセンタ等の問い合わせ対応の手間を軽減させるため...

最新の人工知能アルゴリズムをSNSでお届けします

Leave a Reply

*