최유식 / 국가유산 안내문에 대한 디지털 인문학적 접근 : 시대별 · 지역별 주제 변천과 앞으로의 과제 / 2025년도 (A유형) 인문사회학술연구교수 예비선정

최유식 / 전남대학교 / 국가유산 안내문에 대한 디지털 인문학적 접근 : 시대별 · 지역별 주제 변천과 앞으로의 과제 / 2억 / 60개월 / 2025년도 (A유형) 인문사회학술연구교수 예비선정

연구목표:

본 연구는 국가유산 안내문(이하 ‘안내문’)이 시대별·지역별로 변해 온 과정을 조사하고, 이를 바탕으로 안내문을 개선하기 위한 향후 과제를 제시한다. 연구대상인 안내문은 현장에서 국가유산의 역사·문화적인 배경과 보존가치를 해설하는 판(板) 형태의 공공시설물이다. 안내문은 태생적으로 언어와 역사·지리 등 다양한 영역으로부터 영향을 받음에도 불구하고 관련 선행연구는 단일 시·군·구만을 대상으로 언어학의 문법 분석에 편중되어 왔으며, 역사지리학적 고찰은 매우 부족했다.

선행연구의 한계를 학제간(學際間) 연구로 보완하기 위해 본 연구에서는 방법론으로 디지털 인문학, 구체적으로는 GIS(Geographic Information System)와 말뭉치 언어학(Corpus Linguistics)을 채택한다. 전자는 공간정보, 후자는 텍스트정보를 탐구한다. 또한 두 분야는 모두 전통적인 수작업으로 다루기 어려웠던 빅 데이터를 신속하고 정확히 읽고 분석하는 테크닉, 더불어 정성적·정량적 연구방법을 포괄하는 최근의 연구성과로 학자들의 비상한 관심을 끌고 있다.

연구의 바탕이 될 안내문 자료는 총 세 가지로 나뉜다. 첫째, 1985년과 1993년 사이에 국가유산청의 전신인 문화재관리국 문화재연구소에서 안내문을 전수조사한 『문화재 안내문안집』 총 11권과 둘째, 2013년 문화재청에서 조사한 국가지정문화재 및 국가등록문화재 소속 안내문 2,568건, 그리고 셋째, 지금부터 본 연구에서 조사할 2026년 5월 말의 최신현황이다.

연구의 목표는 총 세 가지로, 첫 번째는 문헌사적 관점에서 전국 안내문의 시대별 변천사를 사상 최초로 정리하는 것이다. 우리나라의 안내문은 수십 년 동안 재질, 어휘, 설치 위치 등 다양한 시행착오를 겪으며 발전해 왔고 현재도 전국 곳곳에서 실시간으로 개선되고 있으나 지금까지의 선행연구에서는 그 수천 건에 달하는 역대 안내문의 역사를 시계열적으로 돌아본 연구가 전무했다. 안내문이 사람들에게 여러 가지 스토리(국가유산의 의의)를 설명하는 동안 정작 그 스토리텔러(안내문)의 의의는 학계의 관심에서 멀어져 있었다. 따라서 본 연구는 3번에 걸친 전국 단위의 조사(1993년, 2013년, 2026년)을 바탕 자료로 삼아 국가유산의 역사(스토리)보다 이를 해설하는 안내문(스토리텔러)의 역사를 최초로 규명하고자 한다.

두 번째 목표로는 지리학적 관점에서 안내문의 지역성을 규명한다. 본 연구는 전국 데이터를 시·도별 말뭉치로, 필요에 따라 시·군·구별로도 세분함으로써 안내문이 한 지역의 특성을 어떻게 반영하고 또 새롭게 창조하는지를 밝혀내고자 한다. 대부분의 지리적 현상들이 그렇듯이 안내문 역시 공간상에서 무작위로 배치되어 있지 않다. GIS 전자지도는 그 분포의 패턴을 포착함으로써 연구자의 추론이나 일반 상식에 부합하는, 혹은 배치되는 새로운 발견을 얻을 수 있다. 본 연구에서는 비록 통념을 깨는 연구결과라 할지라도 의미 있는 발견으로 인정하고, 각종 사료를 참조함으로써 그 원인을 정성적으로 탐구한다.

마지막 세 번째 목표로는 언어학적 관점에서 국문·영문 안내문의 언어적 차이를 분석한다. 정부는 일찍부터 1986년 아시안게임, 1988년 올림픽을 맞아 해외로부터 방문한 외국인들을 안내문의 중요한 독자층으로 의식하고 있었다. 이에 따라 같은 국가유산을 두 언어로 해설하는 과정에서 안내문은 문장의 길이와 전문용어의 비중, 독자의 관심분야를 다르게 상정한다. 특히 국가유산청의 현행 가이드라인은 영문 안내문을 작성할 때 국문의 기계적인 직역을 지양하고 있으므로, 이른바 ‘내수용’과 ‘해외용’ 메시지가 서로 다를 것은 자명하다. 본 연구에서 GIS와 말뭉치 언어학을 통한 국문·영문 분석이 완료되면 후속연구에서 국내의 안내문과 해외의 유사사례를 비교하는 장기적인 밑바탕이 마련될 것이다.

기대효과:

본 연구는 첫째로 안내문 정책의 결산과 집행에 근거자료로 활용할 수 있다. 연구를 시작할 2025년은 전국 단위 조사가 이루어진 지 이미 10년이 지난 시점이므로 자료의 최신화와 정책의 결산이 시급하다. 안내문의 학술적 의의는 해외 선행연구를 통해 정립되었을 뿐 국내에서는 학술적인 뒷받침이 미비한 채로 지난 수십 년 동안 정책이 집행된 결과 시행착오가 많았다. 연구의 공간적 틀을 제공할 행정구역도 최근 대구광역시의 군위군 통합, 강원·전북특별자치도의 출범으로 큰 변화가 있었다. 무엇보다도 『국가유산기본법』에 따라 수십 년 만에 ‘문화재’라는 명칭이 2024년 5월부터 ‘국가유산’으로 변경되면서 새로운 체제가 형성되었다. 따라서 본 연구는 문화재 시대를 마감하고 국가유산 시대를 여는 첫 안내문 연구로서 빅 데이터를 통해 30여 년의 안내문 역사를 결산한다.

둘째, 최종 산출물을 공유함으로써 안내문 연구의 저변을 확장할 수 있다. 본 연구로 산출될 최종 산출물은 두 세트의 .txt와 .xlsx 파일, 말뭉치 언어학의 분석결과인 .xlsx, GIS 분석결과인 .fgdb, 그리고 지도 파일은 .tif 이미지로 총 다섯 종류이다. 본 연구는 진행기간 동안 수시로 이들 연구결과를 정리해서 여러 편의 논문을 학술지에 투고하고 학회에서 발표함으로써 연구성과를 확산하고 연구공동체를 활성화한다. 이 논문과 발표자료 말미에는 본 연구에서 수집하고 가공한 자료를 열람할 수 있는 저자의 이메일 혹은 위키 주소를 게시할 계획이다. 이를 통해 본 연구는 결과를 투명하게 공개함과 동시에 후속연구자들이 ‘안내문 빅 데이터’를 조사하면서 다시금 똑같은 자료를 찾아 헤매는 수고를 절약하도록 돕는다.

셋째, 해외 학계에도 우리나라의 안내문과 그 학술적 의의를 알릴 수 있다. 우리나라의 안내문은 아시안게임과 올림픽을 맞아 『문화재 안내문안집』을 발행하던 1980년대 후반부터 외국인 독자들의 시선과 평가를 자국민의 감상만큼이나 중대하게 받아들여 왔다. 본 연구에서 분석될 영문 안내문은 그 맥락 아래서 작성된 우리나라의 영문 안내문을 해외의 유사사례와 비교할 수 있게 한다. 영국 런던의 블루 플라크(Blue Plaques), 미국 각 주의 노변표석(roadside markers)과 역사표석(historical markers)은 모두 국가유산의 가치를 작은 판 안에서 설명하는 공공사업이다. 우리나라의 안내문을 세계적 맥락 안에 위치시키는 일은 이들 간의 공통점과 차이점을 규명하는 일로부터 시작된다. 이제는 안내문에서 구사하는 영문 문법의 옳고 그름을 판단하던 언어학 선행연구에서 한 차원 더 나아가 세계 곳곳에 설치된 안내문의 문화적 맥락을 국가별로 비교해 볼 때가 되었다. 우리의 안내문 연구는 더 이상 국내에만 한정지을 것이 아니라 장기적인 안목으로 해외 학술지에도 논문을 투고함으로써 그 학술적 의의를 인접사례와 비교하고 논의를 확장할 필요가 있다.

연구요약:

1년차의 전반부에는 미가공 데이터(raw data)를 수집하고 후반부에는 텍스트 데이터 전산화를 시작한다. GIS에서 백지도 역할을 할 2026년 현재의 행정구역 셰이프파일(.shp)은 도로명주소 안내시스템에서 간단한 신청서를 작성하고 월별 현황을 내려받는다. 말뭉치 언어학으로 분석할 3종의 안내문 자료 중 시기상 가장 앞서는 『문화재 안내문안집』은 국가문화유산포털의 간행물 페이지에 게시된 스캔 파일을 입수한다. 그리고 두 번째 자료인 2013년도 원문은 현재 인터넷에 공개되어 있지 않으므로 정보공개 청구를 통해 입수해 놓은 상태다. 마지막으로 국가문화유산포털에 공개되어 있는 최신 안내문은 2024년 6월 말까지 등록된 것만을 조사대상으로 삼고 그 이후에 등록되는 안내문은 다루지 않는다.

2년차에는 1년차 후반부부터 시작해 온 텍스트 데이터 전산화를 이어서 수행한다. 가장 오랜 시간을 요구하면서도 시급한 과업은 『문화재 안내문안집』 총 11권 스캔 파일에 수록된 3,706건의 안내문을 이미지에서 텍스트로 전환하는 것이다. 본 연구는 인력과 시간을 많이 소모하는 수동 타이핑 대신 사진 등 이미지 파일 위의 글자를 컴퓨터가 자동으로 판독하는 OCR(Optical Character Recognition, 광학문자인식) 기술을 사용한다. 디지타이징이 완료된 안내문은 말뭉치 언어학 프로그램에 적합한 .txt와 GIS 프로그램과 잘 호환되는 .xlsx 파일의 이중 형태로 저장될 예정이다. 표의 구조를 갖는 .xlsx 파일에서 본 연구는 한 행에 한 안내문을 수록한다. 그리고 각 열에는 해당 안내문의 텍스트정보(본문), 시간정보(안내문의 설치년도, 국가유산의 지정년도), 공간정보(행정구역, 경·위도 좌표), 그 외 분석에 필요한 다양한 특성들(ID, 국가유산의 명칭과 종류)을 기록한다.

3년차에서부터 4년차 초반까지는 이전 단계까지 수집하고 가공했던 데이터를 시각화할 배경지도를 구축한다. 공간정보에는 1993년, 2013년, 2026년이라는 세 시점의 배경지도가 필요하다. 2026년의 최신판은 앞서 1년차 때 도로명주소 안내시스템에서 얻은 미가공 자료를 그대로 이용할 수 있다. 그러나 과거의 두 판은 행정구역 경계가 상당히 다르므로 국토정보플랫폼에 등록된 당시의 1:50,000 지형도를 GIS 환경에 불러와 정확한 시대별 현황을 시·군·구 단위로 복원할 필요가 있다. 이렇게 배경지도가 완성되면 각 안내문의 좌표를 그 위에 점으로 도식한다.

4년차 후반에서 연구가 마무리되는 5년차까지는 주로 분석이 이루어진다. 서로 분리된 채로 구축되어 오던 텍스트데이터와 공간데이터가 이 단계에서 연결되고 나면, 비로소 이렇게 통합된 데이터를 토대로 ‘시대별·지역별 주제 변천과 향후 과제’를 도출할 수 있다. 그 과정은 말뭉치 언어학 프로그램으로 안내문의 어휘를 분석한 뒤, 그 중 두드러지는 사례의 지리적 분포를 GIS 프로그램에서 전자지도로 시각화하고 지도를 출력하는 순서로 이루어진다. 말뭉치 언어학에서는 문장을 형태소 단위로 해체하고 연어(連語, collocation)와 키워드(keyword) 분석을 실시한다. GIS 프로그램은 커널 밀도(kernel density), 자기상관(autocorrelation) 등 다양한 통계측정법을 동원함으로써 안내문의 지리적 의의를 과학적 기반 위에서 규명하나, 결코 정량적 분석에 그치지는 않는다. 본 연구는 국가유산 선정과 관련된 정부 관보, 신문 기사, 연구보고서 등을 함께 참조함으로써 이 분석 결과가 나타나기까지 영향을 미친 역사·문화적 배경과 원인을 정성적으로 규명한다.

키워드:

국가유산 안내문, 디지털 인문학, GIS(지리정보시스템), 말뭉치 언어학, 공공언어

heritage interpretation text, Digital Humanities, GIS(Geographic Information System), Corpus Linguistics, public language

댓글 남기기