연구목표
(한글 2000자 이내)
정보기술의 급격한 발전과 사회적 확산은 인문학 학술 환경과 연구 방식, 매체와 인지 과정의 전환을 촉발했다. 적지 않은 수의 인문학 연구자들은 디지털 기술을 인문학 연구 활동에 도입했고, 그로 인해 발생된 ‘디지털 인문학’의 학술적 적실성에 대한 논쟁은 아직까지도 치열하게 전개되고 있다. 본 연구는 인공지능과 로보틱스 중심의 또다른 사회 재편을 앞둔 현 시점에서 인문학 연구자들의 정보기술 인식과 수용 서사를 검토함으로써, 디지털 시대 인문학 학술 커뮤니케이션의 변화와 향후 전망을 이해하고자 한다.
‘디지털 인문학’의 등장에 따라 어떠한 디지털 기술이 인문학 연구에 사용되었고, 근거하는 주요 학문 분야나 이론이 무엇인지 규명하는 연구도 활성화되었다. 하지만, 이러한 논의는 디지털 인문학 연구에 반영된 인문학 내 정보기술 담론이 어떻게 변하고 학문적 기제로 작용했는지를 충분히 다루지 않았다. 본 연구는 이러한 연구사적 공백을 토대로 인문학 연구자들의 지식과 당대적 인식이 내포된 학술문헌 텍스트에 문맥 기반 동적 워드 임베딩(Dynamic Contextualized Word Embedding)을 적용해 연구자들의 정보기술 인식의 의미적인 구조의 변화를 세밀하게 추적한다.
구체적으로 본 연구는 다음과 같은 세부 목표를 중심으로 진행한다. 첫째, 정보기술 담론의 핵심 기표로서 ‘digital’의 언어적 분포와 의미적 양상은 시기별로 어떻게 변하는가? 둘째, 역사, 문학, 철학 등 인문학 내 세부분야 별로 의미적인 차이가 발생하는 시기가 존재 하는가? 셋째, 도출된 정량적인 지표는 실제 디지털의 인문학의 학술사적 맥락과 어떻게 교차하는가? 이를 통해 본 연구는 언어적 분포의 변화를 통해 정보기술 발전이 인문학적 사유에 개입하는 과정을 실증해보고자 한다 .
기대효과
(한글 2000자 이내)
‘디지털’의 분포의미론적 구조의 변화를 토대로 인문학 내 정보기술 담론 변화를 포착하려는 본 연구는 다음과 같은 기대효과를 창출할 수 있다.
첫째, 본 연구는 디지털인문학의 학문사적 궤적을 설명하는 새로운 관점을 제공할 수 있다. 어떤 기술을 활용하며 그것이 새로운 인문학적 해석방식으로 적합한지 논의를 넘어 실제 인문학 연구자들의 텍스트에 반영된 정보기술 사회 인식과 학술적 실천의 맥락을 조망하도록 논의를 확장할 수 있다.
둘째, 연구자들의 지적 맥락이 담긴 1차사료로서 학술문헌 텍스트의 활용성을 제기한다. 매년 수십만 건 이상 발행되는 대규모 학술 텍스트를 딥러닝 기반 자연어처리 기법으로 분석하면서, 디지털 학문사 및 텍스트 기반 학술 커뮤니케이션 연구의 가능성을 모색한다.
셋째, 인문학 학술 커뮤니케이션의 변화를 진단하고 가치를 제고하는 데 이용할 수 있다. 인문학 연구자들이 당대적 맥락과 어떻게 상호작용하는지 규명함으로써, 가까운 미래에 예정된 인공지능과 로보틱스 중심의 전면적인 사회 재편 속에서 인문학의 학문적 제고와 변화상 예측에 활용할 수 있다.
넷째, 오픈 사이언스를 실천하며 연구의 투명성, 재현성을 확보할 것이다. 분석에 사용한 데이터 처리와 분석 코드는 github나 google drive 등에 부록 형식으로 공유해서 접근성을 높여 동일한 연구 프레임워크를 쉽게 따라할 수 있도록 인프라를 구축할 것이다.
연구요약
(한글 2000자 이내)
본 연구는 인문학 학술문헌 텍스트에서 자연어처리 기법으로 ‘digital’과 의미적으로 유사한 단어들의 분포 변화를 분석하여 ‘디지털’ 전환에 대한 인문학 연구자들의 인식과 학술적 실천의 양상을 규명하는 데 목표를 둔다. 시기·학문분야별 특성을 의미 공간에 반영하고, 정밀하게 변화를 추적하기 위해 본 연구는 문맥 기반 동적 워드 임베딩(Dynamic Contextualized Word Embedding)을 활용한다. 연구는 다음과 같은 단계로 수행한다.
- 데이터셋 구축 및 임베딩 모델 학습
글로벌 학술 데이터베이스인 OpenAlex API를 활용하여 ‘digital’과 ‘computational’이 포함된 인문학 학술텍스트 약 19만 건을 수집하고 발행연도와 세부분야를 라벨링한다. 레이블은 Dynamic Contextualized Word Embedding에 차이값으로 의미공간에 직접 반영해서, 기존의 정적 임베딩 모델이나 일반적인 문맥 기반 모델이 포착하기 어려운 미세한 담론 변화를 반영한다. - 통사·의미론적 변화 측정(전체/세부분야별로 비교)
구축된 모델을 바탕으로 ‘digital’과 ‘computational’ 간 유사도 변화를 산출해서 의미적인 결합과 분리 지점을 정량화한다. 섀넌 엔트로피나 젠슨-섀넌 분산, 평균 내적 거리 등의 지표를 이용해 주변 단어의 분포적 변화를 측정하고 통사적 분포와 교차 대조해서 ‘digital’ 인식의 의미적인 구조의 변화를 식별한다. - 디지털 인문학의 학문사적 맥락-양적 변곡점과 교차 검토
정량적인 변곡점은 디지털인문학 관련 선행 연구, 디지털인문학 관련 학술 단체 설립 및 연구비 지원 사업 시행 등의 정성적 맥락과 비교 검토한다.
키워드(Keyword)
(한글 250자 이내)
디지털 인문학, 인문학 연구자, 디지털 인식, 문맥 기반 동적 워드 임베딩
키워드
(영어 500자 이내)
digital humanities, humanities researchers, digital engagement, dynamic contextualized word embedding