함형석 / 산스크리트 문헌 연구를 위한 디지털인문학: 진실의 집대성 텍스트 인코딩을 통한 8세기 인도 지성사 재구성 / 2024년도 공동연구지원사업

함형석 / 전남대학교 / 인문학 / 산스크리트 문헌 연구를 위한 디지털인문학: 진실의 집대성 텍스트 인코딩을 통한 8세기 인도 지성사 재구성 / 2024년도 공동연구지원사업 예비선정

연구목표:

본 프로젝트는 디지털 인문학의 방법론을 활용하여 산스크리트 문헌 분석의 도구를 개발하고, 이를 통해 문헌에 대한 거시적 분석과 비판적 독해의 장점을 결합함으로써, 고전 문헌 읽기의 새로운 가능성을 제시한다. 구체적으로는 8세기를 대표하는 인도불교 논사인 샨따락쉬따(Śāntarakṣita, 725-788)의 저작 『진실의 집대성』(Tattvasaṅgraha)과 그의 제자 까말라쉴라(Kamalaśīla, 740-795)의 주석 『진실의 집대성 주해』(Tattvasaṅgrahapañjikā)에 담긴 참조정보를 분석한다. 이 분석의 목표는 8세기 인도불교도들이 활동하던 인도 지성계의 네트워크를 재구성하는 것이다. 이를 통해 본 프로젝트는 디지털적 전환이 빠르게 이루어지고 있는 국제적인 학술 경향성에 발맞추며, 더 나아가 그것을 선도할 수 있는 디지털 인문학과 전통적 고전학의 성공적인 결합의 사례를 제시하고자 한다.
불교학을 선도하는 유수의 국제적 연구그룹들은 현재 인터넷상에서 연구를 수행할 수 있는 다양한 연구 플랫폼들을 경쟁적으로 선보이고 있다. 이는 크게 연구자료를 종합하여 연구자들에게 제공하는 <그레틸>(GRETIL)과 같은 데이터 플랫폼과 <그레틸>에서 수집한 산스크리트 문헌 빅데이터를 활용하여 문헌 간 상호연관성을 분석하여 시각화해주는 <붓다넥서스>(BuddhaNexus)와 같은 분석 플랫폼으로 구분된다. 데이터 플랫폼은 연구자들이 디지털 환경 속에서 기존 방식의 문헌 분석 작업을 지속할 수 있도록 자료를 제공하는 데 그치지만, 분석 플랫폼의 경우, 개인 연구자가 상상할 수 없는 차원에서 문헌을 조망할 수 있게 해주어 인도 문헌에 대한 ‘멀리서 읽기’(distant reading)의 시대를 열었다고 할 수 있다.
하지만 <붓다넥서스>가 보여주는 문헌들 간의 상호연관성은 고도로 추상화된 것이어서 연구자들은 두 문헌 혹은 문헌군들 간의 관계가 어떠한 성격의 것인지, 또는 어떠한 근거에서 관계가 설정된 것인지에 대한 구체적인 정보를 파악할 수 없다. 이와 같은 문제는 <붓다넥서스>의 분석 도구가 <그레틸>의 데이터에 기반하여 구축되었다는 사실에서 기인한다. <그레틸>이 보유하고 있는 데이터는 기존에 출판된 산스크리트 문헌을 연구자 개개인이 문서 편집기를 이용해 전사한 ‘단순 텍스트 파일’(plain text file)이다. <그레틸>이 2019년도부터 TEI 가이드라인을 준수하여 텍스트 인코딩(text encoding)한 파일을 제공하고는 있지만, 파일들에는 여전히 아무런 분석정보가 포함되어 있지 않은 상황이다.
한 문헌의 상호텍스트성(intertextuality)을 온전한 모습으로 조망하기 위해서는 <붓다넥서스>가 그려내는 문헌 단위의 이미지를 확대하여 그것을 챕터, 문단, 문장, 단어 단위에서 관찰할 수 있어야 한다. 다시 말해, 연구자들에게는 자유롭게 ‘확대’(zoom-in)와 ‘축소’(zoom-out)가 가능한 문헌에 대한 입체적인 지도가 필요하며, 그와 같은 도구의 출현과 함께 ‘멀리서 읽기’의 거시적 안목을 ‘꼼꼼히 읽기’(close reading)의 세심함과 결합할 수 있는 지평이 열리게 된다.
본 프로젝트는 이와 같은 통합적 문헌 독해의 가능성을 가장 잘 보여줄 수 있는 문헌으로 『진실의 집대성』과 『진실의 집대성 주해』를 선택하였다. 두 문헌은 8세기 인도불교도의 입장에서 인도철학 전반을 비판적으로 고찰하는 것을 목적으로 하고 있기 때문에, 이들이 담고 있는 방대한 참조정보를 통해 우리는 8세기 인도지성계의 네트워크를 광범위하고도 자세하게 그려낼 수 있다. 본 공동연구팀은 두 문헌에 내재한 상호텍스트성을 데이터화하고 시각화하는 방식으로 디지털 인문학적 방법론을 산스크리트 고전 문헌에 구체적이고 적극적으로 적용하여 디지털 환경 속에서 실현할 수 있는 문헌 독해 방법론의 전범을 보여주고자 한다. 그리고 이를 통해 국제 불교학계에서 국내의 불교학계가 주요한 연구주체로서 도약할 수 있는 발판을 구축하고자 한다.

기대효과:

본 프로젝트는 산스크리트 문헌에 대한 TEI 기반 텍스트 인코딩을 통해 8세기 인도 지성사를 재구성함으로써 고전학과 디지털 인문학이 시너지효과를 창출해 낼 수 있는 실질적인 방법론을 제안한다. 이와 같은 작업으로부터 기대되는 유기적이며 연쇄적인 기대 효과는 다음과 같다.

① 신뢰할 수 있는 데이터세트의 구축과 공유를 통한 연구기반 확충
본 프로젝트의 일차적인 목표는 『진실의 집대성』과 『진실의 집대성 주해』에 등장하는 모든 참조정보를 기록한 데이터세트를 만들고 그것을 학계에 공개하는 것이다. 해당 데이터세트는 향후 학계의 공유자원이자 관련 문헌들에 대한 창조적 후속 연구의 기초자료로 기능할 것이다.

② 국내외 학자들과의 협업을 위한 발판 마련
본 프로젝트는 인문학 정보 인코딩의 국제적 표준으로 자리 잡은 TEI 가이드라인을 준수하면서도 인도 고전문헌에 대한 선도적 디지털 인문학 프로젝트들과 호환되는 방식의 인코딩 스키마에 따라 데이터세트를 구축한다. 또한 프로젝트 진행 단계별로 세계적인 연구그룹들과의 지속적이고도 긴밀한 교류를 통해 그들의 연구현황을 파악하고 공동연구팀의 성과를 공유할 것이다. 이를 통해 추후 본 프로젝트의 결과물과 해외 연구집단의 데이터를 결합시키면서 보다 효율적으로 국제적 협업을 도모할 수 있을 것이다.

③ 연구 작업의 효율성 제고 및 연구성과 누적을 위한 디딤돌 마련
본 프로젝트에서는 『진실의 집대성』과 관련된 연구성과들을 종합하는 플랫폼을 구축함으로써 연구사 검토에 대한 연구자들의 생산성을 높일 것이다. 본 프로젝트의 공동연구팀이 각자의 전문영역에 속하는 연구사를 정리하고 이를 학계 전체가 참고할 수 있는 형식으로 공개하는 일은 『진실의 집대성』 연구에 대한 기준점을 학계에 제시하는 일이라고 할 수 있다. 본 프로젝트의 결과물을 통해 연구자들은 기존의 연구성과를 한 곳에서 종합적으로 파악할 수 있으며, 이를 토대로 『진실의 집대성』과 관련 문헌들에 대한 지식을 축적해나갈 수 있게 될 것이다.

④ 다각적 교육 프로그램 제공을 통한 학문 후속세대 양성
본 프로젝트의 데이터 분석 결과는 고전 인도학은 물론 인문학 다방면에 걸쳐 활용될 수 있는 실용적인 작업 모델을 제안하게 될 것이며, 이는 특히 미래의 학계를 이끌 학문 후속세대에게 영감을 줄 것으로 기대된다. 본 공동연구팀은 프로젝트의 작업내용을 공개하는 연차별 워크숍을 통해 후속세대 연구자들을 위한 다각적인 교육의 장을 마련할 것이다. 이를 통해 학문후속세대 연구자들의 적극적 참여를 독려하여 그들의 학술 역량과 국제적 감각을 고양시킬 수 있다.

연구요약:

본 프로젝트는 8세기에 작성된 『진실의 집대성』(Tattvasaṅgraha)과 『진실의 집대성 주해』(Tattvasaṅgrahapañjikā)에 내재한 참조정보를 바탕으로 두 문헌이 관계 맺고 있는 인물과 서적의 네트워크를 시각적으로 구현하고, 이를 비판적 문헌 독해에 기반하여 분석한다. 이를 위한 본 프로젝트의 연구는 크게 세 가지 내용으로 요약된다.

① 참조정보에 대한 TEI 텍스트 인코딩 (18개월)
② 데이터 시각화를 통한 문헌의 네트워크 멀리서 읽기 (6개월)
③ 데이터 기반의 문헌 독해 방법론 탐색 (12개월)

① 참조정보에 대한 TEI 텍스트 인코딩
디지털 환경 속에서 한 문헌이 다른 문헌과 맺는 관계를 세밀하고도 종합적으로 표현하기 위해서는 연구자들이 해당 문헌 속에 등장하는 참조행위와 그것의 식별을 통해 얻을 수 있는 정보를 구조화된 형태로 기록하여 데이터화해야 한다.
본 프로젝트에서는 TEI 가이드라인에 입각하여 산스크리트 논서 문헌군 데이터화를 제안한 함형석(2023)의 방안을 표준적인 스키마(schema)로 삼는다. 이를 토대로 『진실의 집대성』과 『진실의 집대성 주해』 전반에 걸쳐 언급된 인물과 서적의 이름, 그리고 인용된 문장에 대해 그 출처와 피참조된 개체를 다루는 저자의 태도를 인코딩 한다.

② 데이터 시각화를 통한 문헌의 네트워크 멀리서 읽기
『진실의 집대성』과 『진실의 집대성 주해』의 참조정보에 대한 데이터세트가 완성되면 문헌 속에서 참조정보만을 추출해낼 수 있게 된다. 파이썬(Python)의 라이브러리인 판다스(Pandas)를 사용해 해당 데이터세트를 가공하면 문헌의 참조정보들을 표(table) 형식으로 열람할 수 있게 되는데, 이는 문헌에 대한 통계적 분석 및 시각화(visualization)를 가능하게 해준다.
본 프로젝트에서는 대표적인 디지털 인문학 프로젝트들을 참조하여 구축한 데이터세트의 성격을 가장 잘 보여줄 수 있는 시각화 방안을 모색하고, 각 방안이 함축하고 있는 새로운 지식을 읽어낼 수 있는 ‘멀리서 읽기’ 독법을 개발한다.

③ 데이터 기반의 문헌 독해 방법론 탐색
데이터세트의 구축과 이에 기반한 데이터 시각화는 연구자들로 하여금 낯선 차원과 맥락에서 문헌을 조망할 수 있게 해주며, 문헌에 대해 새로운 질문을 던질 수 있게 해준다.
본 프로젝트는 축적된 데이터가 야기하는 질문들이 과연 문헌에 대한 기존의 해석적 연구의 관점에서 유효한 것인지 검증하며, 그러한 질문들은 어떠한 방식으로 답해져야 하는가에 대해 탐구한다. 이와 더불어 데이터 기반의 멀리서 읽기와 문헌에 대한 비판적 읽기의 장점이 모두 드러날 수 있는 연구방법론에 대해 고찰하고자 한다.

본 프로젝트의 구체적인 실행 계획은 다음과 같다.
1차년도에는 표준안으로 채택한 스키마에 기반한 텍스트 인코딩을 공동으로 실습하여 작업의 과정을 체계화하고, 각 공동연구원의 전문성을 살려 문헌의 개별 챕터들을 인코딩한다. 또한 해외연구소 방문을 통해 국제적인 선도그룹의 문제의식과 작업방식을 배우고 협업가능성을 타진한다.
2차년도에는 구축한 데이터의 정합성(consistency)과 무결성(integrity)을 검토하고 검증하는 작업을 수행한다. 이때 공동연구팀이 보유한 문헌의 필사본과 티벳어 번역본을 참조하여 문헌 속의 인용문들에 대한 비판교정본을 작성한다. 이후 완성된 데이터세트를 다양한 방식으로 시각화하며 문헌에 대한 멀리서 읽기의 가능성을 탐색한다. 또한 국제학술대회에 참석하여 본 프로젝트의 성과를 보고하고 향후 계획에 대해 발표한다.
3차년도에는 공동연구원들이 그간의 작업을 통해 얻게 된 문제의식을 개별적인 연구를 통해 탐구한다. 연구진의 데이터세트를 깃허브(github)를 통해 학계와 공유하며, 다음 단계의 연구를 위해 시범적으로 데이터베이스를 설계하고 구축한다. 또한 본 프로젝트와 협업가능성이 가장 높은 <사릿>(SARIT)의 연구책임자를 초청하여 그간의 작업을 평가하고 향후 진행할 프로젝트를 기획한다.

키워드:

인도불교철학, 디지털 인문학, 디지털 고전학, 진실의 집대성, 텍스트 인코딩, 상호텍스트성, 데이터 시각화, 지성사, 네트워크

Buddhist Philosophy, Digital Humanities, Digital Classics, Tattvasaṅgraha, Tattvasaṅgrahapañjikā, TEI, Text Encoding, Intertextuality, Data Visualization, Intellectual History, Network

Leave a Comment