이병주 / 공군사관학교 / 대가(大家)의 탄생: 문학비평장의 지식 전이 양상과 학맥(學脈) 분석 / 2026 신진연구자지원사업(인문사회) / 51,660 / 36개월 / 2026 신진연구자지원사업(인문사회)
연구목표
본 연구의 궁극적 목적은 1960년대 이후 한국 문학비평장에서 ‘대가(大家)’의 지위가 형성되고 확산되는 과정을 디지털 인문학 방법론으로 실증하는 것이다.
한국 현대문학비평 연구는 오랫동안 개별 비평가의 사상적 궤적을 추적하는 해석학적 방법에 의존해왔다. 이러한 연구 전통은 비평가의 텍스트를 깊이 있게 독해한다는 장점이 있으나, ‘왜 특정 비평가가 대가로 인정받게 되었는가’라는 구조적 질문에는 답하기 어렵다. 김윤식, 김현, 김우창, 백낙청, 유종호와 같은 비평가가 ‘대가’로 평가받을 수 있었던 것은 단순히 그들의 비평이 뛰어났기 때문만이 아니라, 서구 이론의 수입 독점, 문예지 편집권 장악, 학맥(學脈)의 제도적 재생산이라는 복합적 메커니즘이 작동한 결과일 수 있다. 만약 개인의 텍스트를 정밀하게 분석하는 방법만으로 비평장 전체의 구조적 역학을 파악하기 어렵다면, 네트워크 분석과 텍스트마이닝을 결합한 디지털 인문학의 방법론을 적용하는 것은 어떨까. 본 연구는 이러한 물음을 바탕으로 기획되었다.
본 연구의 1차적인 목표는 세 비평가(김현, 김우창, 백낙청)의 전집 텍스트를 TEI P5 기반 XML 데이터로 구축하여, 인용·평가·개념 사용 양상을 기계 가독형으로 구조화하는 일이다. 비평가의 전집 텍스트를 수작업으로 태깅하는 것은 현실적으로 불가능에 가깝다고 할 수 있으므로, LLM 기반 자동 태깅 파이프라인을 설계·검증하여, 인문학 텍스트의 디지털 데이터 구축에서 AI 활용의 실용성과 한계를 밝히고자 한다. 특히 비평 텍스트에 특화된 감성 사전을 별도로 구축하여, 일반 감성 사전이 포착하지 못하는 비평 언어의 특수성을 반영할 것이다.
2차적으로 《문학과지성》, 《세계의문학》, 《창작과비평》의 목차 정보, 주요 문학상의 수상자·심사자 관계, RISS 박사학위논문의 지도교수-지도학생 관계를 데이터베이스화하고 네트워크 분석을 수행하여, 비평가의 ‘게이트키핑(gatekeeping)’ 권력을 매개 중심성 등 정량적 지표로 측정하는 것이다. 이를 통해 편집권·심사권·학맥이라는 세 축이 비평적 권위의 재생산에 어떻게 기여하는지를 실증적으로 규명할 수 있을 것으로 기대된다.
최종적인 목표는 비평문을 통해 시기별(1960년대/1970년대/1980년대/1990년대 등) Word2Vec 모델을 구축하고, 핵심 비평 개념의 의미장 변화와 비평 논쟁의 양상을 데이터 기반으로 규명하여, 후속 연구자들이 활용할 수 있는 디지털 연구방법론의 실제 모델을 제시하는 것이다. 이때 저작권료가 합의된다면, 구축된 데이터를 바탕으로 비평가의 시각을 담을 수 있는 교육용 챗봇을 공개할 예정이다.
기대효과
본 연구의 기대효과는 학술적 측면과 활용 측면에서 다음과 같이 제시할 수 있다.
첫째, 한국 현대문학비평 텍스트에 대한 체계적 XML 데이터 구축이라는 점에서, 후속 연구의 기반 인프라를 제공할 수 있을 것으로 기대된다. 비평 텍스트를 TEI P5 기반으로 구조화하여 인용·평가·개념 사용 양상을 기계 가독형 데이터로 구현한 사례는 아직까지 존재하지 않는다. 본 연구를 통해 구축된 데이터는 후속 연구자들이 비평 텍스트를 정량적으로 분석하는 데 있어 기초 자료로 활용될 수 있을 것이다. 이때 저작권 문제가 우려될 수 있다. 이는 본 연구가 연구비 지원을 받아 진행되야하는 가장 큰 이유이기도 하다. 연구비를 활용하여 저작권료를 합의하거나 국립중앙도서관을 통한 제한적 공개 또는 분석 결과와 메타데이터만을 공개하는 방식을 고려한다면 이 문제는 충분히 해결 가능할 것으로 보인다.
둘째, ‘대가의 탄생’이라는 질문에 네트워크 분석 및 텍스트마이닝을 활용하여, 구조적으로 분석함으로써, 한국 문학비평사 연구에 새로운 패러다임을 제시할 수 있다. 기존 연구의 경우 개별 비평가의 사상적 깊이에 집중하는 데 머무르고 있었다면, 본 연구는 비평장의 구조적 조건(편집권, 학맥, 심사권)과 개인의 지적 탁월성이 어떻게 상호작용하는지를 실증적으로 보여준다는 점에서 의의가 있다. 문예지 목차·문학상 심사·학맥 관계를 정량적 지표로 측정하는 것은, 그동안 암묵적으로만 인식되어 온 비평장 내부의 권력 구조를 가시화하는 작업이라고 할 수 있다. 또한 학위논문의 참고문헌들을 활용하여, 인용양상 및 지식의 전파 양상까지도 파악할 수 있을 것으로 기대한다.
셋째, LLM 기반 자동 태깅 파이프라인의 설계·검증은 인문학 텍스트의 디지털 데이터 구축에서 AI 활용의 실용성과 한계를 밝히는 방법론적 기여가 될 것이다. 특히 비평 텍스트에 특화된 감성 사전 구축과 confidence 기반 분류 체계의 경우, 비평 연구에 국한되지 않고 역사 사료, 철학 텍스트 등 다른 인문학 텍스트에도 확장 적용할 수 있다는 것을 고려할 때, 디지털 인문학 방법론 전반에 기여할 수 있을 것으로 기대된다. 아무리 LLM이 텍스트의 맥락을 파악한다고 하더라도, 비평 언어의 아이러니나 모호성을 완벽하게 처리하기는 어렵다. 본 연구에서 설계하는 이중 태깅 파이프라인은 이러한 한계를 투명하게 밝히고, AI와 연구자의 협업 모델을 구체적으로 제시한다는 점에서 후속 연구자들에게 실질적인 참고가 될 수 있을 것이다.
넷째, 구축된 메타데이터(목차 DB, 서지 DB, 인명 DB)를 공개하여 후속 연구를 촉진하고자 한다. 문예지 목차 데이터베이스의 경우, 1960년대 이후 한국 문학장의 전체적인 지형을 파악하는 데 있어 기초 자료로 활용될 수 있으며, 학맥 데이터베이스의 경우에는 한국 인문학계의 지적 계보를 추적하는 연구에도 활용 가능할 것으로 보인다. 더불어 Notion 기반 시각화 웹사이트를 통해 비평가 프로필, 네트워크 그래프, 문학상 타임라인 등을 제공함으로써, 연구자뿐만 아니라 대학 교육 현장에서도 활용할 수 있는 교육 자료를 구축할 수 있을 것이다.
끝으로 최근 국문학계에서 주목하고 있는 디지털 인문학 연구의 가장 큰 문제점은 이를 실제 연구에 적용하고 교육할 수 있는 인력이 부족하다는 것이다. 국문학적 문제의식이 부족한 상태에서 단순히 ‘기술적 분석’만을 적용하는 경우가 적지 않으며, 연구 과정에서 활용된 코드를 공개하지 않는 경우도 빈번하다. 본 연구는 TEI/XML 데이터 구축, LLM 기반 태깅, 네트워크 분석, Word2Vec 모델링이라는 일련의 디지털 연구방법론을 한국 문학비평사라는 구체적인 연구 대상에 적용하고, 그 과정과 코드를 공개한다는 점에서 디지털 인문학 교육의 토대를 마련할 수 있을 것으로 기대된다.
연구요약
본 연구는 1960년대 이후 한국 문학비평장에서 비평 텍스트와 제도적 활동을 디지털 인문학 방법론으로 분석하여, ‘대가(大家)’의 학술적 권위가 형성·재생산된 메커니즘을 실증하는 것을 목적으로 한다. 본 연구의 1차적인 목표는 주요 비평가(김현, 김윤식, 유종호, 백낙청, 김우창 등)의 전집(40권 이상) 텍스트를 TEI P5 기반 XML 데이터로 구축하여, 인용·평가·개념 사용 양상을 기계 가독형으로 구조화하는 일이다. 2차적으로 문예지 목차·문학상 심사·학맥(學脈) 관계를 데이터베이스화하고, 지적 계보 네트워크(서구 이론가→한국 비평가→한국 작가)와 제도적 사회 네트워크(비평가-잡지-대학-문학상)의 이중 네트워크를 구축하여, 비평가의 게이트키핑(gatekeeping) 권력을 정량적 지표로 측정하는 것이다. 최종적인 목표는 시기별 Word2Vec 모델을 통해 핵심 비평 개념의 의미장 변화를 규명하고, Graph RAG 기반 비평가 지식 프로토타입을 완성하여 후속 연구자들이 활용할 수 있는 디지털 연구방법론의 실제 모델을 제시하는 것이다.
한국 현대문학비평 연구는 오랫동안 개별 비평가의 사상적 궤적을 추적하는 해석학적 방법에 의존해왔다. 이러한 연구 전통만으로는 ‘왜 특정 비평가가 대가로 인정받게 되었는가’라는 구조적 질문에 답하기 어렵다. 서구 이론의 수입 독점, 문예지 편집권 장악, 학맥의 제도적 재생산이라는 복합적 메커니즘을 규명하기 위해서는, 개별 텍스트의 해석을 넘어서는 방법론이 필요하다고 할 수 있다. 본 연구는 이러한 물음을 바탕으로 기획되었다.
연구는 6개 과제를 3개년에 걸쳐 단계적으로 수행한다. 1차 년도(2026.06~2027.05)에서는 데이터 인프라를 구축한다. 전집 텍스트를 TEI P5 기반 XML 데이터로 구축하되, LLM 기반 이중 태깅 파이프라인을 설계하여 인용·평가·개념을 자동 태깅한다. 비평가의 전집을 수작업으로 태깅하는 것은 현실적으로 불가능에 가깝다고 할 수 있으므로, 1차 태깅은 LLM을 통해 자동 처리하고 confidence 기반으로 연구자 검증 범위를 축소하는 방식을 채택한다. 동시에 문예지 목차, 문학상 수상·심사, 학맥 관계, 박사논문 참고문헌의 메타데이터를 병렬 수집하여 후속 분석의 기반을 마련한다. 2차 년도(2027.06~2028.05)에서는 1차연도 데이터를 기반으로 이중 네트워크를 구축하고, 매개 중심성·근접 중심성·HITS 알고리즘으로 비평가의 게이트키핑 권력을 측정한다. 시기별(1960/1970/1980년대/1990년대 등) Word2Vec 모델을 구축하여 비평 개념의 통시적 의미 변화를 추적하며, Notion 기반 시각화 웹사이트를 구축한다. 3차 년도(2028.06~2029.05)에서는 비평가의 저작권료 지급을 완료하고, 페르소나 프롬프트를 설계하여 Graph RAG 기반 지식 프로토타입을 완성하고 모델 고도화와 검증 및 데이터 공개를 수행한다.
본 연구의 학술적 기여는 한국 문학비평 텍스트의 최초 체계적 XML 데이터 구축, 네트워크 분석을 통한 비평장의 구조적 시각화, 통시적 의미 변화 추적으로 요약할 수 있다. 3년간 학술 논문 최소 3편, 공개 데이터셋, Graph RAG 프로토타입을 산출할 것이다.
키워드
디지털 인문학, 문학비평, TEI/XML, 네트워크 분석, Graph RAG, 학맥 분석, 대규모 언어모델(LLM), 지식 그래프
Digital Humanities, Literary Criticism, TEI/XML, Network Analysis, Graph RAG, Academic Lineage, Large Language Model (LLM), Knowledge Graph