본문 바로가기

Artificial Intelligence/Natural Language Processing

Mecab-ko 설치하기

mecab-ko소개

mecab-ko은 오픈 소스 형태소 분석 엔진인 MeCab을 사용하여, 한국어 형태소 분석을 하기 위한 프로젝트입니다. 말뭉치 학습과 사전 목록 일부는 21세기 세종계획의 성과물을 사용하였습니다.

mecab-ko-dic은 21세기 세종계획 모든 현대 말뭉치에서 50문장씩을 추출하여 학습에 이용하였습니다. (총 23,615 문장) 

mecab-ko은 아파치 라이센스 2.0에 따라 소프트웨어를 사용, 재배포 할 수 있습니다.

설치 및 사용

Anaconda 환경상에서 설치하는 과정입니다.

$ pip install konlpy
$ sudo apt-get install curl
$ bash <(curl -s https://raw.githubusercontent.com/konlpy/konlpy/master/scripts/mecab.sh)

(tf1.11) globus@ubuntu:~$ python
Python 3.6.0 |Continuum Analytics, Inc.| (default, Dec 23 2016, 12:22:00)
[GCC 4.4.7 20120313 (Red Hat 4.4.7-1)] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> from konlpy.tag import Mecab
>>> mecab = Mecab()
Traceback (most recent call last):
File "/home/globus/anaconda3/envs/tf1.11/lib/python3.6/site-packages/konlpy/tag/_mecab.py", line 107, in __init__
self.tagger = Tagger('-d %s' % dicpath)
NameError: name 'Tagger' is not defined
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "", line 1, in
File "/home/globus/anaconda3/envs/tf1.11/lib/python3.6/site-packages/konlpy/tag/_mecab.py", line 112, in __init__
raise Exception('Install MeCab in order to use it: http://konlpy.org/en/latest/install/')
Exception: Install MeCab in order to use it: http://konlpy.org/en/latest/install/

다음과 같은 오류가 난다

원인을 해결하려면 시스템에도 Mecab를 설치해줘야한다.

$ auto make --version
$ apt list auto

mecab-ko 설치

$ tar zxfv mecab-0.996-ko-0.9.2.tar.gz 
$ cd mecab-0.996-ko-0.9.2 
$ ./configure 
$ make 
$ make check 
$ make install

mecab-ko-dic 다운로드

mecab-ko-dic 다운로드 페이지 에서 mecab-ko-dic의 최신 버전을 다운 받습니다.

mecab-ko-dic 설치

tar.gz를 압축 해제하시고 일반적인 자유 소프트웨어와 같은 순서로 설치할 수 있습니다. 기본으로 /usr/local/lib/mecab/dic/mecab-ko-dic에 설치됩니다.

$ tar zxfv mecab-ko-dic-2.1.1-20180720.tar.gz 
$ cd mecab-ko-dic-2.1.1-20180720
$ ./configure  
$ make 
$ make install
반응형
LIST