정채연 / 야담 시맨틱 데이터 구축 및 활용 방안 – “계서잡록”을 중심으로 / 2026 석사과정생연구장려금지원사업

연구목표
(한글 2000자 이내)
본 연구의 목적은 『계서잡록』 텍스트 내부에 존재하는 다양한 문맥 및 서사 정보를 기계가 읽고 이해할 수 있는 시맨틱 데이터로 설계 및 구축하고, 이를 인물과 사건, 공간 등이 얽힌 지식 그래프로 정리하는 데 있다. 나아가 구축된 데이터를 기반으로 서사 및 서술 방식에 대한 정량적, 정성적 분석을 시도하여 그 활용 방안을 깊이 있게 탐구하고, 연구의 최종 결과물을 웹 플랫폼으로 공유함으로써 데이터 기반 고전서사 분석이 지닌 새로운 가능성과 학술적 효용성을 증명하고자 한다.
AI 시대를 맞이하여 전문성과 신뢰성을 갖춘 인문학 데이터셋 확보가 학계의 중요한 과제로 대두되고 있다. 고전서사 분야, 그중에서도 야담 연구에 있어서 데이터베이스 설계 논의가 점차 활발히 전개되고 있으나, 기존의 연구 성과는 대부분 이론적인 설계 단계에 머물러 있거나 특정 유형의 이야기에만 국한된 부분적인 데이터를 구축하는 수준에 그치고 있다. 방대한 분량의 야담집 한 권을 온전히 데이터화하여 학계와 대중에 공개한 사례는 아직 찾아보기 어렵다. 데이터 설계 단계에서는 미처 예상하지 못했던 다양한 변수들이 실제 구축 과정에서 발생하기 마련이므로, 범용적이고 표준적인 데이터베이스 모델을 확립하기 위해서는 연구자가 직접 텍스트를 다루며 구축의 전 과정을 겪어낸 경험과 실증적인 데이터가 반드시 필요하다.
이에 본 연구는 조선 후기 야담집 편찬의 효시이자 후대 야담집 형성에 큰 영향을 미친 이희평의 『계서잡록』을 연구 대상으로 삼는다.
본 연구는 구축된 데이터를 활용하여 다음과 같은 두 가지 질문을 중점적으로 해명하고자 한다. 첫째, 지식 그래프를 통해 드러나는 『계서잡록』의 당파적 인물 네트워크는 어떠한 구조를 지니는가에 대한 규명이다. 기존 선행연구에 따르면 편찬자 이희평은 서사 내에 노론으로서의 당파성을 강하게 투사한 것으로 평가받고 있다. 본 연구는 인물 노드 간의 관계와 각 인물에게 부여된 서사적 평가를 네트워크 그래프로 시각화한다. 이를 통해 작가의 정치적 정체성이 작품 내 인물들의 위계 설정과 중심 및 주변부 배치에 어떻게 구체적이고 체계적으로 작용하고 있는지를 정량적이고 시각적인 데이터로 입증할 것이다. 둘째, 현실성과 기이성이 데이터 속에서 어떻게 교섭하고 있는가에 대한 분석이다. 『계서잡록』에는 현실적인 사건과 기이성을 가진 요소들이 융합되어 서사가 전개되는 특징을 보인다. 기이성을 속성으로 지닌 노드와 현실성을 띤 인물, 사건, 장소 사이의 연결망을 면밀히 파악함으로써, 당대 사대부 계층의 어떠한 현실적 결핍과 정치적 욕망이 기이성을 호출하여 사건을 해결하고 서사를 이끌어가는지 파악한다. 아울러 이러한 교섭 양상이 특정한 지리적 공간 정보와 어떻게 결부되어 나타나는지 그 빈도와 패턴을 통계적으로 밝혀낼 것이다.
기대효과
(한글 2000자 이내)
본 연구는 『계서잡록』의 서사 정보를 체계적인 데이터로 전환하고 분석함으로써 학술적, 방법론적, 그리고 사회·교육적 측면에서 다음과 같은 다각적이고 깊이 있는 파급 효과를 지닌다.
첫째, 데이터 기반 야담 연구의 강력한 기초 자원을 제공하고 고전문학 연구의 방법론적 확장을 도모한다. 문학 텍스트를 정형화된 데이터로 다루는 작업은 텍스트 전체의 경향성을 파악하는 거시적 조망을 가능하게 함과 동시에, 인물 간의 호칭 변화나 특정 소재의 등장 빈도 등을 면밀히 추적하는 미시적인 독해를 더욱 용이하게 만들어준다. 본 연구가 최종적으로 제공할 원문 텍스트 및 한글 번역, TEI 가이드라인을 준용하여 정밀하게 태깅한 데이터 문서, 지식 그래프 정보 등은 그 자체로 의미가 있는 기초 자원이다. 이는 단순한 어휘 빈도 추출을 넘어, 기존의 직관적 해석에 주로 의존하던 야담 연구를 실증적이고 데이터 기반의 영역으로 확장하는 데 기여할 것이다. 야담 연구자들은 공개된 데이터를 바탕으로 각자의 학술적 관심사에 맞춘 다양한 후속 연구를 편리하고 효율적으로 진행할 수 있다.
둘째, 연구 대상의 확장을 통한 한국 야담의 거시적 전승 양상 규명에 기여한다. 본 연구에서 확립한 야담 데이터베이스의 표준 모델을 바탕으로, 향후에는 『계서잡록』에 존재하는 수많은 이본의 데이터를 추가로 구축하여 비교 문헌학적 연구의 지평을 넓힐 수 있다. 나아가 『동패락송』, 『계서야담』 등 『계서잡록』과 내용상, 계보적으로 거리가 가까운 다른 야담집들로 연구 대상을 점진적으로 확장해 나갈 수 있다. 여기에 근대 야담 아카이브와의 연결성까지 모색한다면, 조선 후기부터 근대에 이르기까지 야담 서사가 어떻게 전승되고 변이되었는지 그 양상을 거시적이고 통시적으로 확인하는 연구를 수행할 수 있을 것이다.
셋째, 웹 프로토타입 구축을 통한 고전 서사의 대중적 활용 가능성을 제시한다. 본 연구에서는 일차적으로 원문 텍스트와 연구자가 미리 수행한 시각화 결과를 직관적으로 확인할 수 있는 웹페이지를 프로토타입 형태로 제시한다. 향후 이를 고도화하여 사용자가 직접 간단한 분석까지 진행할 수 있는 본격적인 야담 플랫폼으로 구축한다면, 고전 텍스트에 대한 대중의 접근성을 크게 높여 교육적 목적으로 활용될 수 있을 뿐만 아니라 현대 콘텐츠 창작자들의 아이디어 수집을 위한 원천 소스로도 유용하게 쓰일 수 있을 것이다.
연구요약
(한글 2000자 이내)
◇ 연구 목표: 본 연구는 조선 후기 야담집 『계서잡록』을 시맨틱 데이터로 구조화하고 이를 xml 문서와 지식 그래프로 구현하여 데이터 기반 고전서사 분석이 가진 연구 가능성을 증명하는 데 있다. 기계가 문맥과 관계를 이해할 수 있도록 데이터를 설계 및 구축하고, 이를 공유하여 ‘멀리서 읽기’와 ‘꼼꼼히 읽기’ 연구를 모두 도울 수 있는 표준 모델을 수립하고, 데이터로 학계에 기여하고자 한다.
◇ 연구 내용: 본 연구는 조선 후기 야담집 편찬의 효시이자 후대 야담집 형성에 큰 영향을 미친 『계서잡록』을 연구 대상으로 한다. 이는 계서 이희평이 편찬한 4책 약 240화 분량의 야담집으로, 선본으로 인정되는 권1 성대본, 권2 익선재본, 권3 이희평본과 완질본인 일사본을 기반으로 연구를 수행한다. 구축된 시맨틱 데이터와 지식 그래프를 바탕으로, 본 연구는 다음과 같은 연구 질문을 규명하고자 한다. 첫째, 지식 그래프를 통해 드러나는 『계서잡록』의 당파적 인물 네트워크는 어떠한 구조를 지니는가? 편찬자 이희평이 투사한 노론으로서의 당파성을 확인하기 위해 인물 노드 간 관계와 평가를 시각화하여 그의 정치적 정체성이 어떻게 작용하는지 입증할 것이다. 둘째, 현실성과 기이성은 시맨틱 데이터 속에서 어떻게 교섭하는가? 기이성을 속성으로 지닌 노드와 현실적인 인물, 사건, 장소 등과의 관계를 파악하여 당대 사람들의 어떠한 결핍과 욕망이 기이성을 호출해 서사를 전개하는지 그 패턴의 결부 양상을 통계적으로 밝혀낼 것이다.
◇ 연구 방법: 설정한 연구 목표를 달성하기 위해 다음의 4단계 추진 전략을 바탕으로 연구를 수행하고자 한다.
① 기초 데이터 정비 단계: 선행연구를 자세히 조사하고, 『계서잡록』 이본을 파악하여 문헌학적 토대를 공고히 한다. 특히 연구 대상이 되는 주요 선본을 대조하여 신뢰도 높은 텍스트를 마련하고 검수한다.
② 온톨로지 설계 및 DB 구축 단계: 선행 모델을 참조하여 온톨로지를 설계하고, 직접 데이터를 구축하는 과정에서 수정하는 과정을 반복한다. 설계된 온톨로지를 기반으로 데이터베이스를 입력하고, TEI 가이드라인을 준수하여 xml 태깅을 수행한다.
③ 그래프DB 구현 및 서사 분석 단계: 구축된 데이터를 기반으로 분석을 수행한다. 데이터를 그래프DB(neo4j)로 변환하고, 쿼리를 활용하여 유의미한 연구 질문을 생성한다. 역사 데이터, 지리 정보 등 연관 데이터와 연결하고, 이를 통해 네트워크 그래프, 지도 시각화 등을 수행한다.
④ 웹 프로토타입 개발 및 연구 성과 공유 단계: 연구 결과를 직관적으로 전달할 수 있도록 프로토타입으로 웹을 개발하여, 앞선 DB 활용 방안과 맞닿은 시각화 결과 및 데이터셋을 공유한다.
키워드(Keyword)
(한글 250자 이내)
계서잡록, 야담, 시맨틱 데이터, 지식 그래프, 디지털 인문학, 온톨로지, 확장성 마크업 언어, 텍스트 인코딩 이니셔티브
키워드
(영어 500자 이내)
Gyeseojaprok, Yadam, Semantic Data, Knowledge Graph, Digital Humanities, Ontology, XML, TEI

댓글 남기기