장원재 / 근대 한일 어휘의 품사 대응에 관한 대조연구–단어 정렬 병렬코퍼스의 확장 구축을 통하여- / 2025 중견연구자지원사업

장원재 / 계명대학교 / 근대 한일 어휘의 품사 대응에 관한 대조연구–단어 정렬 병렬코퍼스의 확장 구축을 통하여- / 4.8천만 / 24개월 / 2025 중견연구자지원사업

연구목표:

현대 한국어와 일본어에 공통 어휘가 상당수 존재하는 것은 한일 각각의 언어에 오랜 세월 중국과의 교류 및 어휘 유입의 결과이기도 하지만, 근대 이후의 신문명 어휘교류 결과도 무시할 수 없는 현상이다. 宮島(1967, 1994)의 조사에 따르면 공통적으로 한중일의 현대어 성립시기가 유럽어보다 늦은 19세기 후반 이후라는 사실에서도 근대, 공통 어휘, 신문명 어휘는 관련성이 깊다. 어휘 교류가 적었던 19세기 말 이전에는 공통 어휘가 적고 다른 형태와 쓰임의 한자어가 상당히 존재하였다는 보고에서도 이를 뒷받침해 준다.
한자어의 생성과 교류를 통해 한국어와 일본어의 공통 어휘가 정착하는 과정에서는 동일한 쓰임의 어휘가 있는 반면, 자국어의 어휘체계에 맞게 그 쓰임이 서로 다른 어휘도 상당수 존재하는데 일본어는 ‘木造の家と、煉瓦の家と並び’와 같이 명사 표현인데 반해 한국어는 ‘木造 집이 甓造 집과 相接고’와 같이 동사 표현으로 대응하는 예도 그중 하나이다.
이 현상은 林八龍(1995), 金恩愛(2003) 등에 의하면 현대어에 있어서 일본어는 명사지향적인 표현을 사용하는 반면 한국어는 동사(형용사)지향적인 표현을 사용한다는 특징을 보인다고 보고하고 있다. 단, 필자의 지식으로는 근대어에 대한 연구가 지금까지 없었기 때문에 그 실태를 파악할 수가 없다. 또한 위의 예 중에는 현대어는 형용사나 동사로 사용하지 않는 ‘木造하다’ 등의 예가 보이며 이는 현대어와는 다른 시점의 분석이 요구되어 진다. 2음절 한자어의 결합력과 전요소(木)와 후요소(造)의 구조에 따른 ‘+하다’의 결합 가능성도 시야에 넣어 분석할 필요가 있기 때문이다.
위의 주제를 연구하기 위해서는 동질의 자료를 선정해야 함은 언급할 필요가 없다. 지금까지 다양한 방법으로 몇 가지 자료를 선정해 보았지만, 여전히 해결하기 쉽지 않은 문제가 한일 조사자료의 등가성 문제이다. 한일 근대 자료는 성립 시기의 차이, 그리고 매체, 장르, 문체가 현대어와 같이 정립되어 있지 않아 문제 해결이 쉽지 않다. 이를 소홀히 하면 조사 결과가 언어에 따른 차이인지, 시기나 문체의 다름에 따른 차이인지 판단하기 어렵기 때문이다.
이 문제점을 조금이나마 해결하기 위해서는 동일한 내용에 대해 유사한 문체로 번역한 자료가 연구 대상으로 적합하다고 판단하여 근대 시기에 제3국 또는 일본에서 출판한 원전에 대해 한국어로 번역된 문헌을 대상으로 병렬코퍼스를 구축한 바가 있다.
본 연구는 기존에 구축한 단어 정렬 코퍼스를 약 2배로 확장하여 필자의 앞선 연구에서 구축량 부족으로 충분히 다루지 못했던 근대 한일 어휘의 서로 다른 품사 대응 패턴을 분석하고, 이들 패턴들의 통시적 변화 과정을 고찰하고자 한다.
병렬코퍼스 확장에 관해서는 기존의 한일, 근대, 단어 정렬 병렬코퍼스는 구축된 바가 없기에 첫 구축이라는 의의를 지니고 있지만, 소규모(조사, 조동사를 제외한 자립어 총 29,193단어수)라는 구축량의 제약으로 다양한 주제로의 분석이 쉽지 않은 한계점도 알 수 있었다.
한국어와 일본어에 있어서 서로 다른 품사의 대응에 관해서는 표현 구조(론)의 관점에서 임팔용(1995)의 ‘일본어의 명사표현’과 ‘한국어의 동사 표현’에 대한 논의을 들지 않을 수 없다. 한일 대조연구에 있어서 표현구조(론)라는 흥미로운 영역의 주제를 제시했기 때문이다. 이후 이에 대해 한층 연구를 심화시킨 것이 金恩愛(2003)과 金恩愛(2009)이다. 명사의 문(文) 성분(주어, 목적어, 수식어, 술어)과 그 종류(단순어, 파생어 및 복합어/명사적, 형용사적, 부사적 명사 등)를 상세하게 상호 분석하고 있으며, 한국어의 대응 유형을 기술하고 있다. 실례(대역 소설)를 바탕으로 망라적으로 조사한 의의를 갖고 있다고 판단하며 본 연구에서도 방법론을 차용하여 분석하도록 한다. 단지 이상의 앞선 연구들은 그 수도 적을 뿐만 아니라 현대어, 구어체를 대상으로 한 연구들이며 근대어에 관해서는 해당 논문을 찾을 수 없었다. 근대어 연구의 첫 시도로 의의를 지니고 있겠다.
본 연구의 목적은 다음과 같다.
① 단어 정렬 코퍼스를 기존의 2배로 확장하여 구축한다.
② 확장된 코퍼스에서 한일 간의 서로 다른 품사 대응 어휘를 망라하여 추출하고, 추출한 한일 어휘에 대해 대응 패턴 분류와 어구성면의 특징을 분석한다.
③ ②의 분석 내용을 바탕으로 근대 대역 사전과 한・일 양국의 통시코퍼스를 활용하여 변화 과정을 고찰한다.

기대효과:

1)단어 정렬 병렬코퍼스의 고도화
병렬코퍼스의 단어 정렬 방식은 단일 언어 내에서는 田中・山本(2014), 北崎(2015)와 같은 연구들이 보이나, 다른 언어 간에는 유현경, 황은하(2010)에 의하면 대부분이 문장 정렬 방식으로 단어 정렬 방식은 전무하다고 한다. 특히 근대 한일 간에는 그 경향이 더욱 강하다. 지난 프로젝트에서 처음으로 단어 정렬 방식을 시도하면서 많은 시행착오를 겪으며 구축 진행하였다. 지난 구축 경험을 살려 본 프로젝트에서는 단어 정렬 병렬코퍼스의 구축량을 약 2배 규모로 확대함과 동시에 기구축 데이터를 통합하고 정제화하여 병렬코퍼스를 고도화하고자 한다.
2)한국, 일본 디지털 인문학에의 공헌
본 연구에서 구축되는 교과서, 계몽서, 역사서는 소규모이지만 번역 자료, 그리고 전자 자료로서의 의의를 가지고 있다. 예를 들어 4종 자료 중 『自助論』은 Samuel Smiles의 Self_Help의 번역서로 한중일 각국에서 많은 번역가에 의해 번역되었다. 나라별, 번역가별의 번역어 이동(異同)은 다방면에서 흥미로운 재료이다. 이를 활용하여 한국어학, 일본어학의 언어학은 물론, 역사학, 문헌학, 개념학, 번역학 연구에도 확장 가능하며 구축의 파급효과는 크다고 판단된다. 전미경(2005), 김효전(1996, 2008), 황미정(2008), 노연숙(2009) 연구 등을 통해 알 수 있다. 향후 웹 검색시스템을 통해 일본어와 한국어의 대응어를 상호 검색할 수 있도록 하여 타학문 분야에도 기여하고 싶다.
3)융합 교육 및 융합 학문 연구자의 배출
최근 다양한 언어자원(언어연구용 코퍼스 포함)이 구축되고 공개됨에 따라 타학문과의 융합을 통해 새로운 연구 방법론 및 연구 영역이 확장되고 있다. 융합 연구를 위해서는 습득해야 할 타학문의 또는 융합함으로서의 지식과 기술을 교수할 필요가 있다. 초등교육과 중등교육의 코딩교육이 의무화되면서 대학에서도 융합 교과목을 개발해야 함은 말할 필요도 없다. 본 연구를 기획하고 진행하면서 습득한 지식과 기술, 그리고 본 데이터를 활용하여 융합 교과목을 개발하거나 학부생 및 대학원생을 보조연구원으로 참여하게 함으로써 융합 학문 후속세대를 양성할 수 있는 기회로 삼고자 한다.

연구요약:

1) 단어 정렬 코퍼스의 확장 구축(←연구목적①)
필자가 대조 연구를 수행하기 위해 기존의 구축 병렬코퍼스 번역자료는 a.『フレデリック大王七年戦史』(澁江保, 1896)-『普魯士國厚禮斗益大王七年戰史』(유길준, 1908), b.『高等小学読本』(1888)의 일부-『國民小學讀本』(1895)의 일부, c.『新編博物学』(原田長松等編, 1901)-『新編博物学』(이필선, 1907), d.自助論(畔上賢造, 1906)-自助論(최남선, 1918)이다. 각각의 자료를 전자화하여 문장 정렬 방식으로 정렬한 다음, 각 자료에서 500문장을 추출하여 총 2000문장을 대상으로 단어 정렬 방식으로 구축한 바가 있다. 구축량을 늘리는 이유는 번역 문장 자체가 생략되었거나, 번역어가 생략된 경우가 많았기 때문이다.
실제 한일 간의 어휘 대응을 빈도순으로 살펴보면 고빈도 어휘 대응은 1음절 한자어가 많거나, 거의 대부분이 한일 간 동일 대응이다. 본 연구에서는 동일한 대응 유무와 관계없이 서로 다른 품사 대응 패턴을 안정적으로 추출하고 유의미한 결과를 도출하기 위해서는 그 양이 충분하지 않다고 판단한다. 이에 기구축 만큼의 구축량(1749문장)을 목표로 한다(총합계 구축량은 3749문장).

2) 한일 어휘의 품사 대응 분석(←연구목적②)
가. 1)에서 확장 구축한 단어 정렬 병렬코퍼스에서 품사 정보 및 어종 정보를 이용하여 일본어의 [名詞+の+名詞]표현을 모두 추출한다.
나. 일본어의 [名詞+の+名詞]에 대응하는 한국어 표현을 다음과 같이 크게 분류하여 전체의 대응 현황을 파악하고, 현대어의 앞선 연구와 비교한다.
a. 일본어와 동일한 패턴(명사+의+명사). b. 명사 사이에 조사가 생략된 패턴(명사+_+명사). c. 그 외(명사+하는+명사)
다. 위의 c 패턴에 관해서는 [名詞+の]의 명사를 [명사적 명사], [동사적 명사], [형용사적 명사], [부사적 명사]로 분류하고, 한편으로는 [단순어]와 [파생어 및 복합어]로도 나누어 상호 교차 분석한다. [파생어 및 복합어]는 구성요소에 따라 대응 패턴이 달라질 수 있기 때문에 분석 틀로서 시야에 넣을 필요가 있다.
라. [名詞+の]의 명사가 현대어에는 [+하다/+する]가 되지 않는 명사들은 다음의 어구성면을 조사하여 어떤 구조의 단어들이 특징적으로 나타나는지를 조사한다. 어구성면은 2음절 한자어의 ‘전요소(A)+후요소(B)’의 어휘적・문법적 관계를 石井(1989), 野村(2013), 장원재(2023c)를 참조하여 주술관계, 목술관계, 수식관계(연용수식, 연체수식), 병렬관계(유의관계, 반의관계) 등으로 분류하고 분석한다.

3)근현대 통시적 분석(←연구목적③)
이상의 조사에서 추출한 품사 대응 어휘에 대해 우선 19세기 이후 한국, 중국, 일본에서 발행된 한영, 중영, 일영의 대역 사전 조사를 통해 해당 단어의 등재 유무 및 의미(동명사 기술 유무) 등을 확인한다. 다음으로 1860년 이후 해당 단어의 통시적 용례 조사(의미, 용법, 문체, 장르)는 이미 공개된 통시코퍼스를 대상으로 한다. 일본어는 국립국어연구소 일본어역사코퍼스(日本語歴史コーパス, CHJ) 중에서 근대 이후의 잡지코퍼스를, 한국어는 세종계획, 홍윤표(2012), 한국사데이터베이스(한국 근현대잡지자료 및 신문류)를 대상으로 한다. 한일 간의 통시적 흐름의 비교를 위해 조정빈도(PMW)를 사용한다.

키워드:

근대, 한자어, 단어 대응, 병렬코퍼스, 단어 정렬, 통시적, 품사, 어구성, 한일, 대조어휘

early-modern era, sino-japanese/korean words, word correspondence, parallel corpora, word alignment, diachronic, parts of speech, word structure, japanese/korean, contrastive lexicology

댓글 남기기