남신혜 / 한국어 화행별 국지문법의 개발과 거대언어모델을 활용한 자동 주석 기법 개발 연구 / 2025 신진연구자지원사업(인문사회)

남신혜 / 경희대학교 / 한국어 화행별 국지문법의 개발과 거대언어모델을 활용한 자동 주석 기법 개발 연구 / 4.9천만원 / 24개월 / 2025 신진연구자지원사업(인문사회)

연구목표:

  1. 연구 목표
    O 본 연구는 국지문법(Local Grammar) 이론을 한국어 화행 분석에 적용하여 화행별 국지문법 패턴을 개발하고, 거대언어모델(LLM)을 활용하여 이를 자동 주석하는 기법을 개발하는 것을 목표로 한다. 이를 통해 국지문법 기반의 한국어 코퍼스화용론 연구 분야의 토대를 마련하고 한국어 코퍼스언어학 연구의 자동화 가능성을 탐색하고자 한다.
  2. 연구의 필요성
    O 국지문법 연구의 필요성 : 국지문법은 특정 의미를 실현하는 언어적 패턴을 연구하는 방식으로, 기존의 문법 이론이 포괄하지 못한 부분을 설명하는 데 유용하다. 특히, 특정 담화 기능을 실현하는 문법 패턴을 분석하는 데 강점이 있어, 국외에서는 평가, 정의, 예시 등과 같은 표현 연구에서 활발히 활용되어 왔다. 그러나 한국어학에서는 국지문법 연구가 거의 이루어지지 않았으며, ‘Local Grammar’에 대한 통일된 번역조차 존재하지 않는 상황이다. 이에 본 연구는 한국어 담화 및 화행 분석에 국지문법을 도입하여 국지문법 기반 한국어 코퍼스화용론 연구라는 새로운 연구를 수행하고자 한다.
    O 국지문법과 화행 연구의 연관성 : 국지문법은 특정 화행의 실현 패턴을 분석하는 데 적합하며, 이는 화행 이론과 잘 맞아떨어진다. 실제로 영어 및 중국어를 대상으로 한 연구에서 국지문법을 활용하여 특정 화행을 실현하는 표현들을 분석하고 유형화하는 연구들이 진행되었다. 특히, 중국어 감사 화행 연구(Ren & Guo, 2020)와 다언어 사과 화행 연구(Su, 2023) 등은 국지문법이 영어뿐 아니라 다양한 언어에서 화행 분석에 유용함을 입증하였다. 한국어는 공손 표현이 발달하고, 의존명사나 보조용언과 같은 복합 구성이 많아 국지문법을 적용하기에 적절한 언어로 판단된다.
    O 거대언어모델을 활용한 코퍼스언어학 연구의 가능성 : 국지문법은 코퍼스언어학적 연구의 주요한 토대가 될 수 있다. 최근 거대언어모델을 활용하여 코퍼스 분석 절차를 자동화하려는 탐색적 연구가 시도되고 있다. 국외의 선행 연구들은 거대언어모델을 사전 집필 도구, 코퍼스 분석 도구, 자동 주석 도구 등으로 활용하는 가능성을 탐색하고 있으나, 특히 코퍼스 자동 주석 분야는 한국어 코퍼스언어학에서는 아직까지 미개척의 분야로 남아 있어 본격적인 연구가 필요하다.
    O 한국어 구문 연구에 대한 국지문법 적용 가능성 : 한국어에서 다단어 구성에 대한 연구는 기존에도 수행되어 왔으나, 대부분 형태소 분석이나 어절 단위의 태깅에 의존하여 국지문법적 접근은 이루어지지 못하였다. 본 연구는 국지문법을 적용하여 한국어에서 특정 화행을 실현하는 언어적 패턴을 정교하게 기술하고, 이를 자동화하는 방안을 제안하고자 한다.

기대효과:

  1. 학문적 기여도
    O 본 연구는 국내 한국어학 연구에서 본격적으로 논의되지 않은 국지문법 기반 코퍼스화용론 연구를 소개하고 발전시키는 데 기여한다. 이를 통해 한국어학 연구의 지평을 넓히고, 이후 관련 연구들이 파생될 기틀을 마련할 수 있다.
    O 특히, 연구 수행 과정에서 국지문법 이론 정리, 한국어 화행별 국지문법 개발, 거대언어모델 기반 자동 주석 연구 등의 목표를 달성하고, 이를 논문으로 발표할 예정이다. 국지문법 이론을 소개하는 논문은 후속 연구자들에게 기초 자료로 활용될 것이다. 한국어 화행별 국지문법 개발 연구는 한국어 화행 분석의 새로운 연구 분야를 개척한다는 의의가 있다. 거대언어모델 기반 화행 자동 주석 연구는 인공지능을 활용한 코퍼스 주석 작업의 자동화 가능성을 제시한다는 점에서 의의가 있다.
  2. 사회적 기여도
    O 본 연구는 실제 언어 사용 데이터를 분석하여 한국어 화자의 언어 사용 양상을 구체적으로 기술하는 데 기여한다. 국립국어원과 같은 기관에서도 한국어 사용 실태 조사를 수행하는 것에서 알 수 있듯이, 한국어 사용 실태에 대한 자국민들의 관심은 생각보다 크다. 이러한 점에서 본 연구도 사회적으로 의미 있는 자료를 제공할 수 있을 것이다.
    O 연구의 2차년도에서는 거대언어모델을 활용한 자동 주석 기법을 개발하여, 이를 법률 판결문, 회의록, 기업 보고서, 연설문 등의 다양한 사회적 텍스트 분석에 응용할 수 있도록 한다. 이를 통해 일반 사용자들도 필요에 따라 텍스트를 분석하고 정보를 효과적으로 추출할 수 있는 역량을 갖추는 데 기여할 것이다.
  3. 인력 양성 방안
    O 본 연구자가 지도하고 있는 대학원생들이 학생연구원으로 연구에 참여할 것이다. 본 과제를 통해서 학생연구자들에게 연구비 지원이 가능할 뿐만 아니라 실제 연구 수행 경험을 통해 연구 역량을 키울 수 있도록 한다.
    O 연구 과정에서 대학원생 스터디 모임을 확장하여 외부 전문가 초청 워크숍 및 학술 발표회를 조직할 예정이다. 이를 통해 학생 연구자들의 연구 활동을 독려하고, 연구 네트워크를 구축하는 기회를 제공한다.
  4. 교육 및 후속 연구와의 연계 방안
    O 교육과의 연계 : 본 연구를 학부 교육과 연계하기 위해 학부생 인턴을 연구에 참여시킬 계획이다. 특히, 2차년도 연구에서 진행될 인간 주석자의 주석 데이터 수집 과정에 관심 있는 학부생들을 참여시키며, 이를 대학의 ‘독립심화학습’ 과정과 연계하여 학습 기회를 제공할 수 있다.
    O 후속 연구와의 연계 : 연구 결과물로 <한국어 화행 주석 코퍼스>가 구축될 것이며, 이는 국내 최초의 화용론적 주석 코퍼스로 자리 잡을 것이다. 이를 통해 후속 연구들이 활발히 진행될 수 있도록 한다. 또한, 거대언어모델을 활용한 코퍼스 자동 주석 연구의 최적 프롬프트 템플릿을 개발하여, 향후 인공지능을 활용한 다양한 연구에서 참고할 수 있도록 할 것이다.

연구요약:

  1. 연구 목적
    O 본 연구는 국지문법(Local Grammar) 이론을 한국어 화행 분석에 적용하여 한국어 화행별 국지문법 패턴과 주석 세트를 개발하고, 거대언어모델(LLM)을 활용하여 이를 자동으로 주석하는 기법을 연구하는 데 목적이 있다. 국지문법은 특정 의미를 실현하는 언어적 패턴을 탐색하고 기술하는 접근법으로, 기존의 일반 문법적 분석이 다루기 어려운 담화 기능을 보다 구체적으로 설명하는 데 강점을 가진다. 특히, 영어와 중국어를 비롯한 외국어를 대상으로 한 연구에서는 국지문법을 적용하여 여러 화행을 실현하는 언어적 패턴을 분석하고 유형화하는 시도가 이루어졌지만, 한국어학에서는 아직 본격적인 연구가 진행되지 않은 상태이다. 따라서 본 연구는 국지문법을 한국어 화행 연구에 적용함으로써 한국어 코퍼스화용론 연구의 새로운 방향을 개척하고, 국지문법을 기반으로 한 한국어 화행 주석을 자동화할 수 있는 기법을 개발하고자 한다.
  2. 연구 내용
    O 연구 목적을 실현하기 위해 본 연구는 세 가지 목표를 설정한다. 첫째, 국지문법 이론을 한국어학 연구에 적용하고, 이를 통해 기존의 문법 연구가 포착하지 못했던 한국어 화행의 구조적 특성을 보다 정밀하게 분석할 수 있는 토대를 마련한다. 둘째, 국지문법을 활용하여 한국어 화행별 국지문법 패턴을 개발하고, 이를 기반으로 주석 세트를 구축하여 특정 화행이 실현되는 방식과 그 과정에서 사용되는 기능적 요소를 보다 체계적으로 설명할 수 있도록 한다. 셋째, 거대언어모델을 활용하여 한국어 화행 주석의 자동화 가능성을 탐색한다. 기존의 코퍼스화용론 연구에서는 수작업으로 말뭉치에 주석을 부착하는 과정이 필수적이었으나, 본 연구에서는 인공지능을 활용하여 이 과정을 자동화함으로써 연구의 효율성을 극대화하는 방안을 제시하고자 한다.
  3. 연구 방법
    O 본 연구는 크게 두 개의 연구 단계로 구성된다. 1차년도 연구에서는 한국어 화행별 국지문법 패턴을 개발하는 것이 핵심이며, 2차년도 연구에서는 거대언어모델을 활용하여 한국어 화행 주석을 자동으로 부착하는 기법을 개발하는 데 집중한다. 이를 위해 국지문법 이론을 정리하고 한국어에 적용할 수 있는 방법론적 토대를 마련하는 작업이 수행된다. 국외에서는 이미 국지문법을 활용한 다양한 연구가 진행되어 왔으며, 특히 영어, 중국어 등의 언어에서 특정 화행을 실현하는 국지문법 패턴을 분석하고 이를 유형화하는 연구가 활발하게 이루어졌다. 따라서 본 연구에서는 국외 연구의 주요 성과를 정리하고, 이를 바탕으로 한국어에 적용할 수 있는 시사점을 도출하는 과정이 필요하다.
    O 다음으로, 실제 한국어 화행별 국지문법 패턴을 분석하는 작업이 진행된다. 이를 위해 다양한 유형의 코퍼스를 활용하여 한국어 화행을 실현하는 언어적 패턴을 발견하고 이를 유형화한다. 분석 대상이 되는 말뭉치는 일상대화 말뭉치, 국회회의록 말뭉치, 메신저 말뭉치 등으로 구성되며, 각각의 코퍼스를 통해 특정 화행이 실현되는 방식과 구조를 분석하는 작업이 이루어진다. 이를 통해 감사, 사과, 지시와 같은 대표적인 한국어 화행을 실현하는 국지문법 패턴과 그 기능 요소를 정리하고, 이를 기반으로 한국어 화행 주석을 위한 체계를 확립할 계획이다.
    O 마지막으로 거대언어모델을 활용한 자동 주석 기법 개발을 위해서는 최신 GPT 모델을 사용하며 프롬프트엔지니어링의 방법을 사용할 것이다. 주석 자동화의 성능을 평가하기 위해서는 인간 주석자의 주석 결과와 비교하여 성능을 통계적으로 평가할 것이다.

키워드:

국지문법, 한국어 화행, 거대언어모델, 코퍼스화용론, 자동 주석

Local Grammar, Speech Acts in Korean, LLM, Large Language Model, Corpus Pragmatics, Automatic Annotation

댓글 남기기