mecab-ko소개
mecab-ko은 오픈 소스 형태소 분석 엔진인 MeCab을 사용하여, 한국어 형태소 분석을 하기 위한 프로젝트입니다. 말뭉치 학습과 사전 목록 일부는 21세기 세종계획의 성과물을 사용하였습니다.
mecab-ko-dic은 21세기 세종계획 모든 현대 말뭉치에서 50문장씩을 추출하여 학습에 이용하였습니다. (총 23,615 문장)
mecab-ko은 아파치 라이센스 2.0에 따라 소프트웨어를 사용, 재배포 할 수 있습니다.
설치 및 사용
Anaconda 환경상에서 설치하는 과정입니다.
$ pip install konlpy
$ sudo apt-get install curl
$ bash <(curl -s https://raw.githubusercontent.com/konlpy/konlpy/master/scripts/mecab.sh)
(tf1.11) globus@ubuntu:~$ python
Python 3.6.0 |Continuum Analytics, Inc.| (default, Dec 23 2016, 12:22:00)
[GCC 4.4.7 20120313 (Red Hat 4.4.7-1)] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>> from konlpy.tag import Mecab
>>> mecab = Mecab()
Traceback (most recent call last):
File "/home/globus/anaconda3/envs/tf1.11/lib/python3.6/site-packages/konlpy/tag/_mecab.py", line 107, in __init__
self.tagger = Tagger('-d %s' % dicpath)
NameError: name 'Tagger' is not defined
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "", line 1, in
File "/home/globus/anaconda3/envs/tf1.11/lib/python3.6/site-packages/konlpy/tag/_mecab.py", line 112, in __init__
raise Exception('Install MeCab in order to use it: http://konlpy.org/en/latest/install/')
Exception: Install MeCab in order to use it: http://konlpy.org/en/latest/install/
다음과 같은 오류가 난다
원인을 해결하려면 시스템에도 Mecab를 설치해줘야한다.
$ auto make --version
$ apt list auto
mecab-ko 설치
$ tar zxfv mecab-0.996-ko-0.9.2.tar.gz
$ cd mecab-0.996-ko-0.9.2
$ ./configure
$ make
$ make check
$ make install
mecab-ko-dic 다운로드
mecab-ko-dic 다운로드 페이지 에서 mecab-ko-dic의 최신 버전을 다운 받습니다.
mecab-ko-dic 설치
tar.gz를 압축 해제하시고 일반적인 자유 소프트웨어와 같은 순서로 설치할 수 있습니다. 기본으로 /usr/local/lib/mecab/dic/mecab-ko-dic에 설치됩니다.
$ tar zxfv mecab-ko-dic-2.1.1-20180720.tar.gz
$ cd mecab-ko-dic-2.1.1-20180720
$ ./configure
$ make
$ make install
'Artificial Intelligence > Natural Language Processing' 카테고리의 다른 글
Ubuntu 16.04 Server에서 CUDA 9.0 + CUDNN 7.1 + Anaconda 설치 (1) | 2019.01.30 |
---|---|
Ubuntu 16.04 Server 에서 NVIDIA Driver 설치 (0) | 2019.01.30 |