이민행 / 독일어 디지털 의미론 연구 / 2024년도 저술출판지원사업

이민행 / 연세대학교 / 인문학 / 독일어 디지털 의미론 연구 / 2024년도 저술출판지원사업 예비선정

연구목표:

본 저술연구는 네 가지의 상이한 디지털 의미자원에 포함된 다양한 의미적인 정보들을 통합하여 코퍼스 하나로 통합하여 구축한 다음에 의미정보들을 효율적으로 검색하고 추출하는 방안을 제시하는 것을 연구목표로 설정한다. 여기서 말하는 의미자원 네 가지 의미자원은 Mannheim의 독일어 연구소(IDS)에서 개발한 E-VLABU, 튀빙엔대의 전산언어학과에서 구축한 GermaNet, Saarland대에서 개발한 SALSA 코퍼스를 기반으로 하여 웹상에서 검색이 가능하도록 변환한 FrameSQL 코퍼스 및 의미역(semantische Rollen) 정보를 부착하여 네덜란드 Groningen대에서 구축한 PMB 코퍼스이다. 이 가운데 E-VALBU와 GermaNet은 어휘의미론적인 주제를 다루는데 있어 유용하고, SALSA와 PMB는 문장의미론적인 주제와 깊이 관련된다.
이 네 가지 디지털 자원은 담고 있는 의미정보가 각기 다르고 다양하기 때문에, 이 정보들을 모두 사용할 수 있다면 독일어 의미론의 연구와 교육에 있어 매우 높은 활용도를 기대할 수 있다.
여러가지 의미정보들을 통합하여 구축하게 될 독일어 의미코퍼스는 ICGS (Integrated Corpus of German Semantics)로 명명한다. 코퍼스 ICGS의 구축을 위해 네 가지 언어자원을 통합하는 과정에 활용하고자 하는 언어처리 도구는 Stuttgart대에서 개발한 코퍼스 작업대 (corpus workbench, 이하 CWB)이다. 이 도구는 이미 오래전 부터 독일어와 영어 뿐만 아니라 전세계적으로 여러 언어의 코퍼스 구축에 쓰이고 있다. 더 나아가 이 도구를 이용하여 구축한 코퍼스들은 cqpweb이라는 웹기반 검색 플랫폼에 담을 수 있어 웹상에서도 검색이 가능하다. 때문에 교수자와 학생들이 수업시간에 이 코퍼스들에 직접 접근할 수 있다.

기대효과:

본 저술 연구의 기대효과를 열거하면 다음과 같다.
▸ 국내 독어학계의 의미론 연구방법론의 확대에 기여
▸ 국내 관련학회에서의 발표를 통한 지식 확산에 기여
▸ 독일어 교육과 독어학, 특히 의미론 교육을 위한 언어자료 확보에 기여
▸ 독일어의 어휘의미론 및 문장의미론 연구와 관련한 새로운 지식창출
▸ 독일어 의미역 정보 부착 코퍼스 확보 (웹 사이트 개설 공개)
▸ 독일어 프레임 의미론 코퍼스 확보 (웹 사이트 개설 공개)
▸ 독일의 관련 연구기관과의 학문적 교류 활성화
▸ 독일 및 국제 언어학 관련 학회에서의 발표 기회 증가
▸ 독일 유명 국제학술지에 논문 게재 기회 증가

연구요약:

본 연구의 일차적인 연구내용은 독일어 의미론 연구자와 독어학 개론 혹은 독일어 의미론 강의담당자에게 여러모로 쓸모가 있는 독일어 통합 의미정보 코퍼스 ICGS의 구축 방법론과 이 코퍼스로부터 연구와 교육에 필요한 데이터를 효율적으로 추출해 낼 수 있는 검색언어에 대해 상세하게 풀이하고 정리하는 것이다.
더 나아가 다음 단계의 연구내용은 제1 단계에서 구축한 통합 코퍼스를 활용하여 의미론적인 주제연구를 수행하는 방법론을 제시하는 것이다.
여기서 다루는 주제연구의 사례는, “독일어 변동동사 부류의 의미적 특성에 대한 연구”, “독일어 어휘의미망 GermaNet의 활용”, “독일어의 상해(Cause_harm) 프레임에 대한 연구” 및 “독일어의 의미역 틀과 의미 부류의 상관관계에 대한 연구” 등이다.
연구의 제3 단계에서는 네 가지 의미정보 코퍼스로 용례로 쓰인 독일어 문장들을 모두 추출하여 구구조 트리뱅크와 의존구조 트리뱅크로 구축한다. 이렇게 구축된 트리뱅크들은 독일어 의미론을 넘어 통사론이나 중급 수준이상의 독일어 교육에 활용될 수 있다.
마지막 제 4단계에서는 최근들어 세간의 화제가 되고 다양한 목적으로 널리 사용되고 있는 ChatGPT를 활용하여 CWB기반의 코퍼스나 트리뱅크들을 생성할 때 필요한 여러가지 파이썬 스크립트들을 작성할 수 있는지, 이 코드들에 포함된 함수들은 어떤 기능을 수행하는 지에 상세하게 기술할 예정이다.
이런 과정을 통해 독어학 연구자들이 좀 더 수월하게 파이썬 코딩에 익숙해 지는 환경을 제공하려 한다. “ChatGPT와 동행하는 언어학 연구”라는 주제의 장절에서 코딩과 연관된 내용에 대해 논의한다.

키워드:

디지털 의미론, 코퍼스, 코퍼스 작업대, 독일어 어휘의미망, 의미역, 프레임 의미론, E-VALBU(디지털 결합가 사전), 챗GPT, cqpweb

Digital semantics, Corpus, CWB(corpus workbench), GermaNet, Semantic roles, Frame semantics, E-VALBU, ChatGPT, cqpweb

Leave a Comment