꼬꼬마 한국어 형태소 분석기
결합 조건 표

꼬고마에서 사용하는 결합 조건은 [1]을 기본으로 정의하였고, [2]에 나와 있는 어문 규정과 조사, 어미등의 결합 조건을 위해 자체적으로 정의한 조건을 추가하였다.

구분 조건 설명 적용여부
음운 조건 ㅣ겹
ㅣ겹모음 'ㅑ,ㅕ,ㅛ,ㅠ,ㅒ,ㅖ'
not yet
모음
마지막 음절이 종성을 가지지 않음
☞ '는','를'과 같이 모음으로 끝나는 체언에 붙는 조사의 결합 제약을 위해 사용
yes
자음
마지막 음절이 종성을 가짐
☞ '은','을'과 같이 모음으로 끝나는 체언에 붙는 조사의 결합 제약을 위해 사용
yes
양성
마지막 음절이 양성 모음을 가짐
☞ 어미 '아'와 같이 양성 음절 결합 제약을 위해 사용
ex) 잡/VV + 아/ECS ... O
ex) 먹/VV + 아/ECS ... X
yes
음성
마지막 음절이 음성 모음을 가짐
☞ 어미 '어'와 같이 음성 음절 결합 제약을 위해 사용
ex) 집/VV + 어/ECS ... O
ex) 잡/VV + 어/ECS ... △
yes
'ㄱ',...,'ㅎ'
끝음절의 종성
yes
'ㅏ',...,'ㅣ'
끝음절의 중성
not yet
어미 조건 사오
선어말 어미 '-사오-'
not yet
사옵
선어말 어미 '-사옵-'
not yet
시오
선어말 어미 '-시오-'
not yet
선어말 어미 '-오-'
not yet
으라
선어말 어미 '-으라-'
not yet
으리
선어말 어미 '-으리-'
not yet
으시
선어말 어미 '-으시-'
not yet
선어말 어미 '-었-'이 부착됨
yes
선어말 어미 '-겠-'이 부착됨
yes
어말 어미 '-아'로 종결됨
☞ 어말 어미 '아'가 축약된 경우, '아야', '아도'와 같은 것에 대한 결합을 가능하도록 함.
ex) 가:{[가/VV + 아/ECS]#(XPV)&(아)} + 도:{[도/ECD]#(EM)@(아)} = 가도:{[가/VV+아도/ECS]#(XPV)}
yes
'-려'로 끝나는 어미
☞ '려'로 끝나서 다음에 '하+어미'형태의 준말이 오는 것을 가능하도록 함.
ex) 뛰려거든 -> 뛰+려+거든 [뛰+려고+하+거든]
yes
자음 조건
모음으로 끝나는 용언의 어간과 어미 'ㄴ'이 결합
☞ '인지'와 같이 '이+ㄴ지'로 'ㄴ지'와 같은 'ㄴ결합어미'를 처리하기 위해 사용
yes
용언의 어간 마지막 음절의 종성이 'ㄹ'임
☞ '려무나'와 같이 일부 어미의 경우 용언의 어간 마지막 음절에 종성이 없거나 'ㄹ'인 경우에만 결합가능한 조건을 처리하기 위함
모음으로 끝나는 용언의 어간과 어미 'ㄹ'이 결합
☞ '일지'와 같이 '이+ㄹ지'로 'ㄹ지'와 같은 'ㄹ결합어미'를 처리하기 위해 사용
yes
모음으로 끝나는 용언의 어간과 어미 'ㅁ'이 결합
☞ '임에지'와 같이 '이+ㅁ에도'로 'ㅁ에도지'와 같은 'ㅁ결합어미'를 처리하기 위해 사용
yes
모음으로 끝나는 용언의 어간과 'ㅂ'이 결합
☞ 'ㅂ니다'와 같은 어미를 생성하기 위한 것.
ㅂ이 추가된 경우는 반드시 뒷 어미에 'ㅂ'이 와야 함
yes
어간 불규칙 활용 -ㄹ
자음 'ㄹ'이 탈락함
yes
-ㅂ
자음 'ㅂ'이 탈락함
yes
-ㅎ
자음 'ㅎ'이 탈락함
yes
-ㅅ
자음 'ㅅ'이 탈락함
☞ 'ㅅ'뷸규칙에 의해서 'ㅅ'이 탈락한 어간 뒤에는 첫음절에 자음이 없는 어미만 올 수 있으므로 이를 지정하기 위해 사용
부+으면
부:{[붓/VV]#(XPV)&(-ㅅ)+으면:{[으면/ECD]#(V)@(-ㅅ)}
yes
용언 조건
'하'로 끝나는 용언
yes
가다
'가'로 끝나는 동사
not yet
오다
'오'로 끝나는 동사
not yet
문장 성분 조건 체언
체언으로 사용됨
yes
관형어
관형어로 사용됨
yes
부사어
부사어로 사용됨
yes
서술어
서술어로 사용됨
yes
기타 EC
연결어미
☞ 보조적 연결어미는 어절간 결합시 보조적 연결어미가 오는 것이 선호되기에 이를 지정하기 위해서 사용
~지+않다.
지:{[지/ECS]#(V,EP)&(EC)} + 않:{[않/VXA]#(XPV)%(EC)}
yes
생략
일부 표제어가 생략되었음을 나타냄
☞ 일부 표제어가 생략된 경우에는 앞에 반드시 생략을 유도한 다른 부분이 와야 함. 이를 지정하도록 하기 위해서 사용하는 조건
yes
F
어절의 끝에만 위치하는 형태소
☞ 보조사 '는'과 같은 일부 형태소의 경우 어절의 끝에만 위치할 수 있다. 이같은 형태소는 띄어쓰기 없이 다른 형태소와 결합할 수 없도록 처리하기 위함이다.
yes
ENG
영문을 소리나는 대로 읽은 말
yes
References
  1. 심광섭, 양재형, "인접 조건 검사에 의한 초고속 한글 형태소 분석기", 정보과학회논문지 : 소프트웨어 및 응용 제31권 제1호 pp.89-99, 2004. 1
  2. 표준국어대사전 (http://stdweb2.korean.go.kr/main.jsp)
Copyright ⓒ 2009 Team 꼬꼬마(KKMA). All rights reserved.
꼬꼬마 세종 말뭉치 활용 시스템은 현재 세종 말뭉치 2010년 배포판을 이용하고 있습니다.