未経験からの自然言語処理(NLP) 実践入門

MeCab(形態素解析)をPythonから2分で使えるようにする方法

  • このエントリーをはてなブックマークに追加
  • Pocket
MeCabをPythonから使う方法

Javaだと、Kuromojiを使用するまでに必要な手続きは、基本的にjarファイルを追加するだけで完了しますので、形態素解析を使うまでの敷居は高くありません。

しかし、PythonでMeCabを使おうとすると、セットアップに時間を取られてしまうことがあります。

ですので、今回は最小限の労力で、PythonからMeCabを使う方法を紹介致します。

使用した環境

  • Ubuntu 16.04
  • python3、pipはインストールされていると仮定

*インスタンスを用意した直後の、何も手を加えていないインタクトなマシンの状態のままです。

1.MeCabのインストール(1分以内)

コマンドを打ち間違えなければ、完了まで1分かかららず、ご活用いただけるはずです。

MeCabを使えるようにするという事だけを優先するので、MeCabの詳細等は、別途御確認頂ければと存じます。

1-1.MeCab本体のインストール

git clone https://github.com/taku910/mecab.git
cd mecab/mecab
./configure  --enable-utf8-only
make
make check
sudo make install

1-2.辞書(ipadic)のインストール

cd ../mecab-ipadic
./configure --with-charset=utf8
make
sudo make install

1-3.MeCabの動作確認

% mecab
すもももももももものうち
すもも 名詞,一般,*,*,*,*,すもも, スモモ, スモモ
も   助詞,係助詞,*,*,*,*,も, モ, モ
もも  名詞,一般,*,*,*,*,もも, モモ, モモ
も   助詞,係助詞,*,*,*,*,も, モ, モ
もも  名詞,一般,*,*,*,*,もも, モモ, モモ
の 助詞,連体化,*,*,*,*,の, ノ, ノ
うち 名詞,非独立,副詞可能,*,*,*,うち, ウチ, ウチ

ここまで、1分。

2.PythonとMeCabの連携(1分以内)

2-1.Pythonバインディングのインストール

sudo pip install mecab-python3

2-2.Python3からMeCab動作確認

python3
>>> import sys
>>> import MeCab
>>> mecab = MeCab.Tagger("-Ochasen")
>>> print(mecab.parse("今日はいい天気ですね。"))
今日  キョウ   今日  名詞-副詞可能
は ハ は 助詞-係助詞
いい  イイ  いい  形容詞-自立    形容詞・イイ  基本形
天気  テンキ   天気  名詞-一般
です  デス  です  助動詞   特殊・デス 基本形
ね ネ ね 助詞-終助詞
。 。 。 記号-句点
EOS

ここまで合計で2分以内のはずです。これだけ簡単に、PythonからMeCabを使用する事ができれば、セットアップの手間を大きく軽減できますね。

ご質問等ございましたら、以下コメント欄よりお気軽にお問合せ下さい!

【動画あり】AI店員(人工知能)が小売業・流通業の接客を可能に!ニュースにも登場!

AI店員

AI関連サービス導入事例

AI導入事例

オージス総研

詳しくはこちら

お知らせ

2018/04/20 【セミナー】【世界最高レベルの精度のAIチャットボットを開発・導入する方法】 2018/05/19(土) 東京 開催

2018/03/12 【プレスリリース】世界初!会話を学習しアナタだけの性格に育つメイド カーナビAIを共同開発

2018/03/03 【セミナー】【世界最高レベルの精度のAIチャットボットを開発・導入する方法】 2018/04/21(土) 東京 開催

2018/02/20 【メディア掲載】Ledge.ai(AI:人工知能特化型メディア)にインタビュー記事が掲載されました

2018/01/24 【セミナー】【世界最高レベルの精度のAIチャットボットを開発・導入する方法】 2018/03/24(土) 東京 開催

過去のお知らせ一覧

アクセス・ランキング

人気AI記事 月間ランキングTOP25

詳しくはこちら

よく一緒に読まれているAI記事

【入門】自然言語処理(NLP)の8つの課題と解決策とは?... 1.自然言語とは何か? 言語は、私たちの生活の中に常にあり、また、なくてはならないものです。 そんな日々当たり前に使われる言語を見つめ直し、解析すると、どんな興味深いものが見えてくるのでしょうか。 1-1.言語の世界とは? 「自然言語処理」の「自然言語」とは何か? 言語には、大きく...
音声アシストとは?4つの音声アシスタント代表的製品を比較... あらすじ 人工知能ブームがますます加速する現在、Siriに代表される音声アシストは、どんどん存在感を増していき、それを追従するような製品が、大手企業やベンチャー企業まで、幅広くリリースされるようになってきました。 音声アシスト・アプリが便利なのは、スマートフォン等の機器にデフォルトで搭載され...
【AIが人手不足を解消】小売業に特化したAI接客システムを開発、多言語対応で外国人の接客も可能に!... 株式会社SPJ(本社:東京都千代田区、代表取締役CEO:江口 天、以下「当社」)は、小売業に特化した高精度 人工知能 接客システムを2017年12月7日(金)にリリース致します。 通常の対話システムは、雑談等幅広い話題に対応出来るようにすることを目標に開発されています。その結果、意図解釈能力が...
ディープラーニングで文章のカテゴリー分類を自動化する方法... 1.あらすじ 人工知能という言葉が、昨今、ますます身近になってきており、Siriなどの対話システムも日々発達してきています。 また、人間の言語を人工知能に解釈させる対話システムの需要が増えると共に、NLP(自然言語処理)のニーズも日に日に高くなって来ています。 NLP分野では、画像処理...
レッジ、ウェブライダー、SPJが共同で機械学習を用いた文章校正の共同研究を開始... ■プロジェクトの目的と経緯 株式会社レッジ、株式会社ウェブライダー、株式会社SPJは、12月12日(火)より、推敲・校閲支援ツール『文賢(ブンケン)』への機能追加・サービス向上を目的とした、共同研究プロジェクトを開始いたします。 AI(機械学習やディープラーニングなど)の技術を使用し、文章校...

最新の人工知能アルゴリズムをSNSでお届けします

Leave a Reply

*