최윤 / 강원대학교 / 한국어 연어 구성의 의미 제약 연구 – 구문 슬롯별 부정 의미 어휘의 분포와 의미 전환을 중심으로 / 2026 신진연구자지원사업(인문사회) / 58,534 / 36개월 / 2026 신진연구자지원사업(인문사회)
연구목표
본 연구의 목표는 한국어 연어 구성에서 구문 슬롯이 요구하는 의미적 제약을 대규모 말뭉치 분석을 통해 경험적으로 규명하고, 부정 의미 어휘의 의미·통사적 변화 현상을 구문문법적 관점에서 체계적으로 설명하는 것이다.
자연 언어에서 어휘들은 무작위적으로 결합하지 않으며, 특정한 표현 환경에서 반복적으로 함께 나타나는 어휘 결합이 존재한다. 한국어에서 ‘노래가 죽인다’, ‘무섭게 잘한다’, ‘케이크를 조진다’, ‘무대를 찢었다’와 같은 표현에서는 본래 부정적·파괴적 의미를 지닌 어휘가 긍정 평가, 정도 강조, 또는 본래와 전혀 다른 행위 의미로 전환되는 현상이 관찰된다. 예를 들어 ‘노래가 죽인다’에서 타동사 ‘죽이다’는 ‘생명을 빼앗다’라는 기본 의미에서 벗어나 ‘매우 훌륭하다’는 긍정 평가 의미로 사용되며, 이때 통사적으로도 타동사에서 형용사적 가치 평가 기능으로 변화한다. ‘무섭게 잘한다’에서 ‘무섭다’는 ‘두려움을 느끼게 하다’라는 기본 의미를 넘어 정도의 극단성을 나타내는 강조 의미로 기능하며, ‘케이크를 조진다’에서 ‘조지다’는 파괴·폭력 의미에서 ‘먹어치우다’라는 전혀 다른 행위 의미로 전환된다.
주목할 점은 이러한 의미 전환이 개별 어휘 차원에서 독립적으로 일어나는 것이 아니라, 특정한 형태·통사적 구조를 가진 연어 구성 속에서 체계적으로 유도되며, 의미적 변화와 함께 통사적 기능 변화도 수반된다는 사실이다. 이는 연어적 결합 관계, 구문적 형식-의미 대응, 어휘 의미의 전환이 동시에 작용하는 현상으로서, 연어·구문·의미의 상호작용을 통합적으로 탐구할 수 있는 학술적 가치가 높은 연구 대상이다. 그러나 기존 연구는 주로 개별 어휘의 의미 확장이나 은유적 사용의 관점에서 접근해 왔으며, 특정 구문 구조가 슬롯별 어휘 선택에 미치는 체계적 제약과 그것이 의미·통사적 변화를 어떻게 야기하는지에 대한 경험적 연구는 충분히 축적되어 있지 않다. 특히 대규모 말뭉치를 활용하여 구문 슬롯별 어휘 분포 패턴을 정량적으로 분석하고, 이를 바탕으로 의미 제약의 일반 원리를 도출하려는 시도는 상대적으로 드문 편이다.
본 연구는 구문문법(Construction Grammar) 이론과 말뭉치 기반 연어 분석 방법론을 결합하여, 다음 네 가지 핵심 연구 문제에 답하고자 한다. 첫째, 부정 의미 어휘가 의미·통사적 변화를 일으키는 연어 구성의 형태·통사적 패턴을 추출하고 그 빈도와 연어 강도를 측정한다. 둘째, 각 구성 패턴의 슬롯별 의미적 제약을 분석하여, 출현 어휘들이 공유하는 의미 자질과 슬롯 간 의미적 관계를 규명한다. 셋째, 동일한 부정 의미 어휘가 구성에 따라 의미 전환이 일어나거나 일어나지 않는 조건을 밝힌다. 넷째, 다수의 구성 패턴에서 반복적으로 관찰되는 슬롯별 의미 제약의 공통 경향을 도출하고 일반화 가능성을 탐색한다.
분석 대상은 [AdvP(-게)] + [VP], [NP+JKO] + [VP], [NP(food)] + [VP], [NP-이/가] + [VP]의 네 가지 구성 패턴이다. 이들은 형태·통사적으로 명확히 정의되어 말뭉치에서 자동 추출이 가능하면서도, 정도 강조, 긍정 평가, 이질적 행위 의미로의 전환 등 다양한 유형의 의미 전환을 포괄적으로 보여주는 구성들이다. 연구는 3개년에 걸쳐 말뭉치 구축 및 패턴 추출(1차년도), 슬롯별 의미 자질 분석 및 구문문법적 기술(2차년도), 의미 제약의 일반화 및 이론 모델 구축(3차년도)의 순서로 단계적으로 수행한다. 본 연구는 이들 패턴을 중심으로 분석을 수행하되, 연구 과정에서 유사한 의미 전환 특성을 보이는 추가 패턴을 발견하고 분석 범위를 확장할 가능성을 열어둠으로써, 한국어 연어 구성의 의미 제약에 대한 일반적 원리를 탐색하는 것을 지향한다.
기대효과
본 연구는 한국어 연어 구성과 의미 전환 현상에 대한 이해를 심화시키고, 구문문법 연구의 경험적 기반을 강화하는 데 기여할 것으로 기대된다.
이론적 측면에서, 본 연구는 연어 분석과 구문문법을 통합한 새로운 연구 모델을 제시한다. 기존 연구에서 연어는 주로 어휘 공기 관계의 차원에서, 의미 전환은 개별 어휘의 의미 확장 차원에서 각각 독립적으로 다루어져 왔다. 본 연구는 연어를 구문의 실현으로 접근함으로써, 형식-의미-제약이 통합된 구문 단위에서 어휘 선택과 의미 해석이 어떻게 이루어지는지 체계적으로 설명할 수 있다. 특히 구문 강제(construction coercion) 개념을 활용하여, 부정 의미 어휘가 구성에 따라 긍정 평가, 정도 강조, 또는 이질적 행위 의미로 전환되는 메커니즘을 밝힘으로써, 어휘 의미와 구문 의미의 상호작용에 대한 이론적 이해를 심화시킬 수 있다. 또한 다수의 구성 패턴에서 반복적으로 관찰되는 슬롯별 의미 제약의 공통 경향을 도출하여, 한국어 구문문법 연구에 경험적으로 검증된 일반화를 제공한다.
방법론적 측면에서, 본 연구는 조사 결합형 패턴을 추출 기준으로 설정하고 Python 기반 자동 추출을 수행하는 절차, Utagger 4.0의 의미번호를 활용한 동형이의어 구분 및 의미 자질 분석 방법, MI-score, t-score, log-likelihood ratio 등 다양한 통계 지표를 활용한 연어 강도 측정 방법 등을 통합한 체계적 연구 방법론을 확립한다. 정규표현식 기반 자동 추출과 수작업 검증을 결합한 절차는 재현 가능하고 객관적인 연구 수행의 모델을 제시하며, 유사한 현상을 연구하는 후속 연구에 실질적으로 활용될 수 있다.
자료적 측면에서, 본 연구는 기존 말뭉치와 웹 기반 자료를 포함한 대규모 분석을 통해 한국어 연어 구성의 실제 사용 양상을 정량적으로 밝히고, 형태의미분석이 완료된 말뭉치, 슬롯별 어휘 목록, 의미 자질 분류 체계, 연어 강도 데이터 등을 체계적으로 정리한 데이터베이스를 구축한다. 연구 종료 후 온라인으로 공개될 이 데이터베이스는 한국어학, 사전 편찬, 한국어 교육, 자연언어처리 등 다양한 분야의 후속 연구에 기초 자료를 제공할 것이다.
실용적 측면에서, 사전 편찬에서는 의미 전환 용법을 구성 정보와 함께 기술하는 방법론을 제시할 수 있으며, 한국어 교육에서는 구성 패턴별 의미 기능과 슬롯별 제약을 체계적으로 제시하여 학습자의 이해를 돕는 교육 자료 개발의 기초를 제공한다. 자연언어처리에서는 감성 분석 시스템에서 부정 의미 어휘의 맥락 의존적 의미 판별에 구성 패턴 정보를 활용함으로써 의미 중의성 해소의 정확도를 향상시킬 수 있다. 또한 부정 의미 어휘의 긍정적 맥락 사용은 영어, 일본어 등 다른 언어에서도 관찰되는 현상으로, 본 연구의 구성 기반 분석 방법론은 비교언어학적 연구를 위한 분석 틀로도 활용될 수 있다.
연구요약
본 연구는 한국어 연어 구성에서 구문 슬롯이 요구하는 의미적 제약을 대규모 말뭉치 분석을 통해 경험적으로 규명하고, 부정 의미 어휘의 의미·통사적 변화 현상을 구문문법(Construction Grammar) 이론의 관점에서 체계적으로 설명하는 것을 목적으로 한다.
한국어에서 ‘노래가 죽인다’, ‘무섭게 잘한다’, ‘케이크를 조진다’, ‘무대를 찢었다’와 같은 표현에서는 부정적·파괴적 의미를 지닌 어휘가 특정 연어 구성 속에서 긍정 평가, 정도 강조, 또는 본래와 전혀 다른 행위 의미로 전환된다. 본 연구는 이러한 의미 전환이 개별 어휘의 독립적 변화가 아니라 구문 구조에 의해 체계적으로 유도되는 현상임에 주목하고, 구문 슬롯별 의미 제약의 양상과 조건을 밝히고자 한다.
연구 내용은 다음과 같다. 첫째, 부정 의미 어휘가 의미·통사적 변화를 일으키는 연어 구성의 형태·통사적 패턴을 말뭉치에서 추출하고, 각 패턴의 빈도와 통계적 연어 강도를 측정한다. 둘째, 각 구성 패턴의 슬롯별 출현 어휘를 의미 자질에 따라 분류하고, 슬롯 간 의미적 관계를 규명한다. 셋째, 동일한 부정 의미 어휘가 구성에 따라 의미 전환이 일어나는 경우와 일어나지 않는 경우를 비교하여, 전환의 구조적·의미적 조건을 밝힌다. 넷째, 다수의 구성 패턴에서 반복적으로 관찰되는 슬롯별 의미 제약의 공통 경향을 도출하고, 구문문법적 이론 모델로 정식화한다.
분석 대상은 [AdvP(-게)] + [VP], [NP+JKO] + [VP], [NP(food)] + [VP], [NP-이/가] + [VP]의 네 가지 구성 패턴이다. [AdvP(-게)] + [VP]는 부사어 자리에 부정 의미 어휘가 출현하여 정도 강조 기능을 수행하는 구성이고, [NP+JKO] + [VP]는 서술어 자리에 파괴·변화 의미 동사가 출현하여 긍정 평가·성취 의미로 전환되는 구성이다. [NP(food)] + [VP]는 음식명과 파괴·폭력 동사가 결합하여 ‘먹어치우다’라는 이질적 행위 의미를 나타내는 구성이며, [NP-이/가] + [VP]는 서술어 자리의 부정 의미 동사/형용사가 형용사적 긍정 평가 기능으로 출현하는 구성이다. 이들 패턴은 형태·통사적으로 명확히 정의되어 말뭉치에서 자동 추출이 가능하면서도, 의미 전환의 다양한 유형을 포괄적으로 보여준다는 점에서 연어·구문·의미의 상호작용을 통합적으로 탐구하기에 적합한 연구 대상이다.
연구 방법으로, 본 연구는 국립국어원 『모두의 말뭉치』(문어·구어·신문)와 웹 기반 수집 자료를 Utagger 4.0으로 형태의미분석하여 말뭉치를 구축한다. Utagger 4.0은 형태소 태그뿐만 아니라 『표준국어대사전』 기반의 의미번호까지 부여하여, 동형이의어 구분 및 의미 자질 분석에 필수적인 정보를 제공한다. 구성 패턴의 추출은 조사 결합형 패턴을 기준으로 정규표현식을 정의하고, Python 코드를 통해 자동화된 방식으로 수행함으로써 분석의 객관성과 재현성을 확보한다. 추출된 어휘 쌍에 대해 MI-score, t-score, log-likelihood ratio 등의 지표로 연어 강도를 측정하여 통계적으로 유의미한 연어 구성을 선별하고, 의미번호 정보를 활용하여 슬롯별 의미 자질을 분류·분석한다. 이를 바탕으로 각 구성 패턴을 구문문법의 형식-의미-제약 틀에서 기술하고, 구문 강제(construction coercion) 개념을 활용하여 어휘의 본래 의미나 통사적 특성이 구문의 요구에 따라 재해석되는 의미 전환 메커니즘을 설명한다.
연구는 3개년에 걸쳐 단계적으로 수행한다. 1차년도에는 형태의미분석 말뭉치를 구축하고 구성 패턴을 추출하여 기초 데이터베이스를 마련하며, 통계적 연어 강도 측정을 통해 유의미한 연어 쌍을 선별한다. 2차년도에는 슬롯별 출현 어휘의 의미 자질을 정밀 분석하고, 의미 전환 조건을 규명하며, 각 구성 패턴을 구문문법적으로 기술한다. 3차년도에는 구성 유형 간 비교를 통해 의미 제약의 일반 원리를 도출하고 이론 모델을 구축하며, 사전 편찬·한국어 교육·자연언어처리 등에의 응용 방안을 제시한다. 본 연구는 네 가지 패턴을 중심으로 분석을 수행하되, 유사한 의미 전환 특성을 보이는 추가 패턴으로 분석 범위를 확장할 가능성도 열어둔다.
키워드
연어, 연어 구성, 구문, 구문문법, 구문 강제, 의미, 의미 제약, 의미 전환, 의미 자질, 부정 의미, 부정 의미 어휘, 슬롯, 어휘 분포, 연어, 연어 강도, 말뭉치, 말뭉치 분석, 형태분석 말뭉치, 형태의미분석 말뭉치, 정규표현식, 파이썬, 아카이브, 아카이빙
collocation, collocational construction, construction, Construction Grammar, construction coercion, meaning, semantic constraint, semantic shift, semantic feature, negative meaning, negative meaning vocabulary, slot, lexical distribution, collocation, collocation strength, corpus, corpus analysis, morphologically analyzed corpus, morpho-semantic analyzed corpus, regular expression, Python, archive, archiving