연구목표
(한글 2000자 이내)
● 연구 대상: 조선시대의 대표적 학술사 문헌인 『동유학안』.
● 1차 목표 – 팩토이드 기반 RDF 데이터 구축: 전통 지식 자원의 인물 관련 진술들을 팩토이드 단위로 해석하여 RDF로 설계·구축하되, 상충하는 기술들을 출처와 해석 과정의 투명성 보존 하에 병렬적으로 공존시키고 사료 층위와 해석 층위를 분리하여 기록함으로써 데이터의 과도한 사실화를 구조적으로 방지.
● 2차 목표 – 텍스트-데이터 연계 체계 수립: TEI-XML 디지털 판본을 제작하고 이를 RDF 팩토이드 데이터와 출처 추적 가능한 방식으로 연결하기 위해, 텍스트 앵커와 증거 지시자 간 안정적인 참조 체계를 설계. RDF-star 도입을 우선 검토하되 상호운용성을 위해 표준 실체화 표현과의 하이브리드 전략 병행.
● 양방향 참조 체계를 통해 구조화된 데이터와 원문 맥락 간의 즉각적 연동을 가능하게 하여 인물 지식 베이스의 탈맥락화 문제를 해결하며, 팩토이드 모델의 동아시아 학안류 문헌에 대한 최초의 체계적 적용으로서 전통 문헌학·사상사 연구를 디지털 집단전기학적 방법론으로 확장.
기대효과
(한글 2000자 이내)
● 사실화 문제의 구조적 해결: 팩토이드 방식의 이차 자료화를 통해 사료의 진술과 연구자의 해석을 명확히 분리 기록함으로써, 한국학 지식그래프 구축 과정에서 반복적으로 발생하는 사실화 문제(사료별 차이와 인코더의 해석이 생략된 채 트리플이 마치 확정된 사실인 것처럼 유통되는 현상)에 체계적으로 대응.
● 집단전기학적 비교 자료의 확보: 생몰·관직·학통·사승·지역·교유 등 다양한 범주의 정보를 동일 형식의 팩토이드로 축적하여, 집단 차원의 공통 특성과 관계망 구조를 비교 가능하게 하며, 상충 진술의 병존으로 학안류 문헌의 편찬적 성격과 가치 판단을 연구 대상으로 노출.
● 텍스트 원형 복원과 반증 가능성의 확보: TEI-XML 판본과 RDF 팩토이드의 증거 지시자 연결을 통해 사용자가 데이터에서 즉시 원문으로 복귀하여 문맥을 확인할 수 있게 함. 탈맥락화 위험을 제어하고 데이터 기반 연구의 반증 가능성을 보장하는 핵심 기제.
● 교육·전시·문화유산 인프라로의 재사용성: 팩토이드 모델은 인용과 해석의 관계를 데이터 구조로 학습시키는 인문 데이터 리터러시 교육의 사례로 기능. CIDOC CRM · Bio CRM 프로필의 활용으로 타 문화유산 지식그래프와의 연결 가능성 확대.
연구요약
(한글 2000자 이내)
연구 계획
● 텍스트 마크업 축: TEI-XML 인코딩을 편집학적 행위로 체계화. 텍스트 구조 분절, 증거 단위 설정, 전기·인명·인용·주석·서지 요소 집중 학습. 학안류 문헌 체제 맞춤 커스터마이징, 원형 전사·연구용 정규화 층위 병치, 팩토이드 참조용 텍스트 앵커·식별자 설계.
● 시맨틱 모델링 축: RDF, 온톨로지, SPARQL, 통제 어휘(SKOS), 출처 모델링(PROV-O), 사건·역할 개념(CIDOC CRM, Bio CRM) 단계 학습. 학안류 텍스트 반복 관계·사건 표현 최소 프로파일 정의 후 팩토이드와 결합.
● 변환·연동 축: TEI-RDF 연계 기술. XSLT·Python 파이프라인, RML 매핑 언어, URI 민팅, 지속 가능한 위치 지시 체계. 팩토이드 구축 반복 규칙화, 해석 개입 표현·대안 해석 병치·인코더 책임 기록을 편집 지침·예시로 문서화.
연구 내용
● TEI-XML 판본: 편·학안·인물 항목과 학파 서술의 이중 구조 위계적 포착. 인명·지명·관직·학파·저작 개체 표지 체계화, 식별자 기반 참조 설계.
● RDF 팩토이드: 인물·사건·관계를 사실로 단정하지 않고, 텍스트 특정 지점의 진술을 출처·책임 동반 주장 단위로 기록. 구성요소는 인코더, 출처 문서, 증거 지시자, 해석 결과. 관계형·사건형 진술로 분기, 사건형은 CIDOC CRM·Bio CRM 사건·역할 개념 제한 차용으로 구조화.
● 구현 전략: 실체화 전통 존중, RDF-star 우선 검토, 필요 시 두 방식 병치. TEI-RDF 연계는 1차-파생 RDF, 최소 앵커+독립 구축, 병렬 공진화 세 패턴 경쟁 가설로 설정, 증거 환원성·유지보수성·자동화·다중 편찬자 수용성 기준 비교. 인코더별 네임스페이스 또는 그래프 판본 분리로 해석 차이 공존 구조화.
추진 전략
● 파일럿 단계: 특정 구간 대상 TEI 규칙, 식별자, 팩토이드 유형, RDF-star 메타데이터 패턴, TEI-RDF 연결 패턴 동시 시험. 산출물: 파일럿 TEI-XML, 파일럿 RDF 그래프, 편집 지침 초안.
● 확장 단계: 확정 규칙 적용 범위 확대. 사승·학파·관직·저술·평가 팩토이드 유형 정규화, 통제 어휘 구축. 사건·역할 모델은 맥락 의존성 높은 진술에만 프로파일 방식 제한.
● 정식화 및 공개: 문서화·배포 형식·공개 패키지 정리. TEI 판본과 RDF 그래프 연결 유지 형태로 제공, RDF-star 중심 제공 기본, 필요 시 실체화 병치 포함. 플랫폼 독립적 학술 공동체 재사용 가능 데이터·지침 목표.
키워드(Keyword)
(한글 250자 이내)
동유학안, 집단전기학, 팩토이드, TEI, XML, RDF, RDF-star
키워드
(영어 500자 이내)
Records of Eastern Confucian Scholars, Prosopography, Factoid, TEI, XML, RDF, RDF-star