김준수 / 인문학 / 한국어 음운체계와 자료 전산화 방안 연구: 일제강점기 일본인 대상의 한국어 학습서를 중심으로 / 2024년도 인문사회학술연구교수(A유형)

김준수 / 서울 시립대학교 / 인문학 / 한국어 음운체계와 자료 전산화 방안 연구: 일제강점기 일본인 대상의 한국어 학습서를 중심으로 / 2024년도 인문사회학술연구교수(A유형) 예비선정

연구목표:

본 연구의 목표는 일제강점기에 일본인을 위해 간행된 한국어 학습서의 말뭉치를 구축하고 한글·가나 표기의 대응 양상을 전산화하는 것이다. 이를 바탕으로 통계적 기법을 활용하여 일제강점기의 한국어 음운 체계의 특징을 검토해 보는 데에도 목표가 있다.
그동안 일제강점기 한국어 학습서는 일제강점기라는 특수성을 고려하지 않고 개화기 한국어 학습서와 묶어서 연구하는 경향이 있었다. 또한 일제강점기 한국어 학습서에 등장하는 한글 표기와 가나 표기의 특징을 검토하는 작업도 드물었으며, 당시 한국어 음운에 관심을 기울인 연구도 많지 않다. 또한 개별 자료를 다룬 것은 몇몇 연구가 있으나 60여 종의 일제강점기 한국어 학습서를 망라하여 다룬 연구는 희소하다.
또한 일제강점기 한국어 학습서가 방대한 분량임에도 어휘 수집에 잘 활용되지 않았는데, 이는 자료가 전산화되어 있지 않아 접근하기 어려웠기 때문이다. 그러므로 이 연구에서는 학습서를 전산화하고, 이를 바탕으로 일제강점기 한국어 음운 체계를 살펴보고자 한다.

기대효과:

먼저 학문적으로는 일제강점기의 한국어 음운 체계를 밝힐 수 있는 성과를 얻을 수 있을 것이다. 또한 일제강점기 한국어 학습서가 전산화되어 공개된다면 표기나 어휘의 검색과 분석이 용이해질 뿐만 아니라 선행 연구들과 함께 후속 연구를 도모할 수도 있다. 근대와 개화기 시기의 한국어 학습서를 다룬 연구들을 종합하여 한글·가나 표기의 변천 등에 대한 공동연구를 진행할 수도 있을 것이다. 또는 구축된 말뭉치를 공개하여 사전 편찬 작업이나 일본어학 연구에 도움을 줄 수도 있을 것이다.
사회적으로는 대중들에게 일제강점기 한국인의 생활상을 널리 알릴 수 있을 것이다. 일제강점기의 한국어 학습서는 체신(遞信), 경찰 등의 다양한 목적을 가지고 간행되었기 때문에 일제강점기의 한국인의 사회적·문화적 양식을 잘 보여 준다. 연구에 관련된 강의나 발표를 통하여 대중들에게 일제강점기의 사회·문화상을 널리 알릴 수 있을 것이다. 마지막으로 온라인 말뭉치 공개를 통해 대중들이 일제강점기의 한국인 학습서의 내용에 쉽게 접근할 수 있게 된다면 일제강점기와 관련된 콘텐츠 확산에 일조할 수 있을 것이다.

연구요약:

연구 내용과 방법에 대해서 설명하자면 첫째, 일제강점기 한국어 학습서를 목록화하고 발굴·수집할 것이다. 선행 연구에 제시된 60여 종을 중심으로 내용이 중복된 학습서를 배제하거나 여러 판본을 비교하는 작업을 통해 목록을 다시 구성할 것이다. 또한 본문을 확인할 수 있는 자료의 소장처를 확인하고 이를 수집할 것이다.
둘째, 한글 표기가 나타나는 한국어 학습서을 대상으로 말뭉치를 구축할 것이다. 대략 24,000페이지에 해당하는 분량을 말뭉치로 구축하여 말뭉치 프로그램이나 웹사이트상에서 검색할 수 있게 할 것이다. 띄어쓰기는 현대 어법에 맞게 하는 등의 말뭉치 입력 기준을 정립할 것이며, 추후 한·일 병렬 말뭉치 구축 방안도 구상해 볼 것이다.
셋째, 한글과 가나 표기가 나타나는 학습서에 나타나는 표기 유형을 분류하고 전산화할 것이다. 특정 음운 현상을 반영하거나 반영하고 있지 않은 한글 표기와 가나 표기를 통해, 어떤 환경에서 음운 현상이 반영되는지를 기술 통계를 활용하여 제시할 것이다.
넷째, 한글과 가나가 병기된 학습서에 나타나는 모음 대응 양상을 전산화할 것이다. 한국어 단모음 하나에 여러 개의 일본어 단모음이 대응되는 경우, 그 환경을 데이터화하고 통계적 기법을 활용하여 환경별 유의미한 차이를 검증해 낸다면 한국어 모음의 성격을 밝힐 수 있을 것이다.
다섯째, 가나 표기만 나타나는 학습서를 대상으로 한글 복원 작업을 할 것이다. 가나 표기가 전사(轉寫)적인지, 전자(轉字)적인지를 검토하고, 복원된 한글을 통해 학습서의 어휘, 내용, 반영된 지역어 등을 확인해 볼 수 있을 것이다.
여섯째, 한국어 음성·음운 등에 대한 일본어 기술을 번역할 것이다. 관련 기술의 배경을 살펴보고 타당성을 검증해 볼 것이다. 이를 바탕으로 근대·개화기 일본어 학습서의 기술이나 다른 외국인 학자들의 기술을 비교·대조해 볼 수 있을 것이다.
일곱째, 학습서의 서지 사항이나 편찬자 정보 등을 검토할 것이다. 서지 사항을 분석하여 책의 체재를 밝힌다면 학습서 간의 영향 관계를 더 쉽게 파악할 수 있을 것이다. 또 편찬자의 한국어 수학에 대한 정보를 알 수 있다면 중앙어에서 잘 보이지 않은 형태소나 어휘들이 어느 지역어에서 비롯되었는지도 파악하기 쉬울 것이다.

키워드:

일제강점기 한국어 학습서, 한글 표기, 가나 표기, 일제강점기의 음운 체계, 일제강점기의 음운 현상, 한국어 학습서 말뭉치 구축, 표기 자료의 전산화

The Japanese colonial period’s Korean Text Book for Japanese, Hangeul transcription, Katakana transcription, Korean phonological system in the Japanese colonial period, Corpus construction of Korean Text Book, Computerizing materials of transcription

Leave a Comment