유은순 / 가톨릭대학교 / 트랜스포머 기반 언어 모델을 활용한 문학 사조 혼재 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

연구요약문
연구목표
(한글 2000자 이내)
본 연구의 목적은 서로 다른 문학 사조가 단일 텍스트 내부에서 어떻게 공존하고 분포하는지를 분석할 수 있는 방법론을 구축하는 데 있다. 이를 위해 트랜스포머 기반 딥러닝 언어 모델인 Sentence-CamemBERT를 활용하여 19세기 프랑스 소설 스탕달(Stendhal)의 『적과 흑』(Le Rouge et le Noir)과 귀스타브 플로베르(Gustave Flaubert)의 『보바리 부인』(Madame Bovary)에 나타난 낭만주의와 사실주의의 혼재 양상을 정량적으로 가시화하고, 그 결과를 질적 해석과 통합하고자 한다.
19세기 프랑스 소설은 낭만주의에서 사실주의와 자연주의로 이어지는 흐름 속에서 전개되었으나, 개별 작품들은 단일 사조로 환원되기 어려운 복합적 미학 구조를 보여준다. 『적과 흑』은 주인공의 열망과 사회 현실에 대한 관찰이 교차하는 서사를 통해 낭만주의적 정념과 사실주의적 인식이 중첩되는 양상을 보여준다. 『보바리 부인』 역시 사실주의적 재현 속에 낭만주의적 욕망을 내면화한 주인공을 제시함으로써 서로 다른 미학적 경향이 공존하는 텍스트로 평가된다. 그러나 기존 연구는 주로 면밀한 텍스트 분석에 기반한 질적 해석에 머물러 있어, 사조적 특징이 텍스트 내부 어느 지점에서 강화되거나 약화되는지, 그리고 어떠한 분포와 변화를 보이는지를 체계적으로 검토하는 데 한계가 있었다. 이에 본 연구는 언어 모델 기반 임베딩을 활용하여 소설 내부에서 서로 다른 사조적 경향이 어떻게 분포하고 이동하는지를 계량적으로 분석하고자 한다. 본 연구의 구체적인 목표는 다음과 같다.
첫째, 낭만주의와 사실주의에 충실한 전형적 텍스트를 선정하고, 언어 모델 기반 임베딩을 통해 문학 사조 앵커 벡터(literary movement anchor vectors)를 구축한다. 이를 통해 『적과 흑』과 『보바리 부인』에 나타난 사조 혼재의 분포와 변화 양상을 분석하기 위한 참조 축(reference axis)을 마련한다.
둘째, 분석 대상인 두 소설을 챕터 단위로 임베딩한 뒤 각 챕터의 벡터와 사조 앵커 벡터 간의 의미적 거리를 코사인 유사도로 측정한다. 그리고 그 결과를 사조 맵(literary movement map)으로 시각화하여 챕터 단위의 사조 경향과 분포, 시계열적 변화 양상을 검토한다.
셋째, 사조 맵을 기반으로 서로 다른 미학적 경향이 강화되거나 약화되는 구간을 식별하고, 챕터 내부 임베딩 벡터의 분산(variance)을 통해 사조적 경향의 변동 정도를 분석한다. 나아가 챕터 간 서사적 전환이 나타나는 구간과 변동성이 높은 챕터를 중심으로 질적 해석을 수행함으로써 정량 분석과 질적 해석을 통합한다.
기대효과
(한글 2000자 이내)

학문적 기대효과 : 인공지능 기반 문학 연구 방법론 구체화

전통적인 질적 비평에 의존해 왔던 문학 사조 연구에 트랜스포머 기반 딥러닝 언어 모델을 활용한 정량적 분석을 도입함으로써, 문학적 통찰을 데이터에 기반하여 재검토할 수 있는 연구 방법을 마련한다. 특히 질적 연구가 사조의 혼재를 대표적인 장면이나 단락을 중심으로 논의해 온 것과 달리, 본 연구는 텍스트 전체에 걸쳐 나타나는 사조 혼재의 분포와 변화 양상을 계량적으로 분석함으로써 단일 사조로 환원되지 않는 복합적 미학 구조를 보다 체계적으로 조망할 수 있는 분석 틀을 제공한다.

사회적 기대효과 : 인공지능 시대 인문학의 역할 재정립

본 연구는 기술과 인문학적 해석이 상호 보완적인 관계를 형성할 수 있음을 보여줌으로써, 인공지능 시대에 문학 연구의 역할과 가능성에 대한 인식을 확장하는 데 기여한다. 나아가 문학이 인공지능 모델과 데이터 자원을 통해 지속적으로 연구 지평을 갱신할 수 있는 영역임을 환기시키고 인문학의 사회적 가치에 대한 이해를 심화하는 계기를 제공한다.

교육적 기대 효과 : 디지털 인문학 교육 모델 설계

최근 대학의 인문학 교육은 인공지능 기술과의 융합을 적극적으로 모색하는 방향으로 빠르게 전환되고 있다. 본 연구에서 구축한 코퍼스와 언어 모델 기반 데이터, 그리고 재현 가능한 분석 절차는 인공지능 시대에 부합하는 교육 자료로 활용될 수 있다. 또한 전통적인 독해와 데이터 분석을 융합한 디지털 문학 교육 모델로 확장될 수 있다.
연구요약
(한글 2000자 이내)
본 연구의 목적은 서로 다른 문학 사조가 단일 텍스트 내부에서 어떻게 공존하고 분포하는지를 정량적으로 분석하기 위한 통합적 방법론을 제안하는 데 있다. 이를 위해 트랜스포머 기반 딥러닝 언어 모델를 활용하여 스탕달의 『적과 흑』과 플로베르의 『보바리 부인』에 나타난 낭만주의와 사실주의의 혼재 양상을 정량적으로 가시화하고, 그 결과를 질적 해석과 결합하는 통합적 분석 절차를 구축한다. 이는 기존 질적 연구가 대표적 장면이나 단락을 중심으로 사조의 혼재를 논의해 온 경향을 보완하고, 텍스트 전체에 걸쳐 나타나는 사조적 경향의 분포와 변화 양상을 체계적으로 파악하기 위한 시도이다. 본 연구는 다음과 같은 절차로 수행된다 : 첫째, 각 사조의 미학적 특성을 대표하는 전형적 작품 10편씩 총 20편으로 앵커 코퍼스를 구축한다. 작품 선정 과정에서는 문학사적 대표성과 작가 간 균형을 고려하여 특정 작가에 편중되는 것을 방지한다. 분석 대상 텍스트는 프로젝트 구텐베르크에서 제공하는 프랑스어 원서를 활용하며, 특수 기호와 주석 등 분석에 불필요한 요소를 제거하는 전처리 과정을 거친다. 둘째, 전처리된 소설은 챕터 단위로 분할한 뒤 중첩 슬라이딩 윈도우(overlapping sliding windows) 방식으로 세분화하여 서사 흐름의 단절을 최소화하고 의미 변화를 연속적으로 포착한다. 그리고 프랑스어 말뭉치를 기반으로 사전 학습된 트랜스포머 언어 모델 Sentence-CamemBERT를 활용하여 슬라이딩 윈도우 단위로 임베딩을 생성하고, 이를 집계하여 챕터별 대표 벡터를 산출한다. 셋째, 사조의 전형적 작품들의 임베딩을 기반으로 낭만주의와 사실주의 앵커 벡터(anchor vector)를 구축한다. 앵커 벡터는 사조의 평균 문체를 도출하기 위한 기준이 아니라 두 소설이 서로 다른 미학적 경향 가운데 어디에 가까운지를 판단하기 위한 참조 축이다. 넷째, 소설의 각 챕터 벡터와 앵커 벡터 간 코사인 유사도를 측정하여 의미적 거리를 산출하고, 그 결과를 사조 맵으로 시각화한다. 사조 맵은 텍스트 내부에 나타나는 미학적 경향의 분포와 서사 전개에 따른 이동을 좌표 공간에 보여줌으로써 사조 혼재를 분포와 변화의 관점에서 조망하게 한다. 마지막으로 정량 분석과 질적 해석을 결합한 통합적 접근을 수행한다. 챕터 간 사조 전환 구간을 식별하고, 해당 지점에서 나타나는 서사적 특징에 대한 질적 해석을 진행한다. 또한 각 챕터를 구성하는 윈도우 벡터와 앵커 간 유사도의 분산을 측정하여 챕터 내부의 사조적 안정성과 변동성을 평가한다.
키워드(Keyword)
(한글 250자 이내)
디지털 인문학, 딥러닝 언어 모델, 문학 사조, 텍스트 임베딩, 정량적 분석
키워드
(영어 500자 이내)
Digital Humanities, Deep Learning Language Models, Literary Movements, Text Embedding, Quantitative Analysis

댓글 남기기 응답 취소