이윤정 / 홍익대학교 / 온톨로지 기반 문화정책 도메인 특화 LLM 및 RAG 시스템 개발에 관한 연구 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

연구요약문
연구목표
(한글 2000자 이내)
최근 대규모 언어모델(LLM)과 검색 증강 생성(RAG) 기술의 발전은 문화정책 분야의 혁신을 주도하고 있다. LLM은 방대한 데이터를 바탕으로 고차원적인 언어 처리와 추론을 수행하여 정책 시뮬레이션 및 의사결정 지원에 탁월한 가능성을 보여주며, RAG는 외부의 정확한 지식 베이스를 참조함으로써 LLM의 본질적 한계인 환각 현상을 억제하고 답변의 신뢰성을 담보한다. 이 두 기술의 결합은 방대한 정책 문헌과 데이터를 실시간으로 분석하여 증거 기반(evidence-based) 정책 수립을 가능케 하고 행정가와 이해관계자 간의 협업을 촉진하는 전략적 도구로 부상하고 있다.
그러나 문화정책 도메인은 예술적 가치와 사회, 경제적 효용이 혼재된 복잡성과 용어의 의미적 유동성으로 인해 단순한 AI 도입만으로는 한계가 있다. 이에 대한 해법으로 제시되는 온톨로지(ontology)는 도메인 지식을 체계적으로 구조화하여 AI가 개념 간의 맥락과 위계를 명확히 이해하도록 돕는 핵심 기반이다. 온톨로지와 결합한 LLM 및 RAG 시스템은 단순한 키워드 매칭을 넘어 ‘의미론적 추론’을 수행함으로써, 모호한 정책 용어의 맥락을 파악하고 데이터의 파편화 문제를 해결하여 전문가 수준의 심층적 분석을 제공한다.
궁극적으로 온톨로지 기반의 LLM-RAG 시스템은 문화정책의 데이터 분석 및 의사결정 체계를 획기적으로 첨단화할 것이다. 이 시스템은 각 정책 분야에 특화된 다중 AI 컨설턴트 역할을 하여 지역 문화 격차 해소와 같은 복합적 문제에 대해 구체적이고 실효성 있는 대안을 제시한다. 또한 비정형 텍스트와 정량적 지표를 융합 분석하여 정책의 성공 및 실패 패턴을 도출하여 직관이나 경험에 의존하던 기존 관행을 탈피하고 과학적 데이터에 근거한 객관적이고 투명한 정책 수립 프로세스를 확립하는데 기여할 것이다.

본 연구는 전술한 기술적 당위성을 바탕으로 온톨로지 기반 문화정책 도메인 특화 LLM 및 RAG 시스템(ONtology-driven LLM and RAG system specialized for the Cultural Policy Domain: 이하 CPD-ONLR)을 개발하는데 목적이 있다. 이를 통해 정책입안자, 정책결정권자, 행정 수행자, 관련 연구자 등이 문화정책 정보와 적용을 체계적으로 검색하고 관리할 수 있는 증거 기반 정보제공 체계를 마련하고자 한다. 구체적인 연구의 세부목표는 다음과 같다.

첫째, 문화정책 도메인 온톨로지 구축을 통한 지식의 표준화이다. 문화정책 분야에 산재한 비정형 텍스트와 이질적인 데이터를 체계적으로 통합하기 위해, 개념 간의 의미적 관계를 명시하는 고도화된 지식 그래프(knowledge graph)를 설계한다.
둘째, 신뢰성 있는 온톨로지 기반 LLM 및 RAG 시스템의 구현이다. 구축된 온톨로지를 문화정책 문헌에 특화된 지능형 질의응답 및 분석 시스템을 개발한다.
기대효과
(한글 2000자 이내)

학문적 기대효과
본 연구의 과정과 주요 결과는 문화정책과 AI 기술의 융합연구에 대한 선도적 모델을 제시하는 등 학문적으로 중요한 기초자료로 활용될 것이다. CPD-ONLR의 개발 과정은 문화정책학, 행정학, 데이터사이언스, 인공지능 등의 분야 등의 다학문적 접근과 융합연구를 촉진하여 추후 문화데이터 분석, 문화 거버넌스, AI 기반 정책연구 등 관련 분야 후속 연구에 핵심 자료를 제공할 것이다. 특히 본 연구에서 제시하는 문화정책 온톨로지 구축 방법, LLM과 RAG의 결합 등은 문화정책 연구의 새로운 학술 패러다임을 형성하는 데 기여할 것이다.
또한 구조화된 지식 그래프와 LLM의 유기적 결합은 모델 추론의 일관성을 높이고 잘못된 정보 생성을 억제할 수 있음이 보고되고 있으며, 본 연구는 이러한 첨단 기법을 문화정책 연구에 적용함으로써 AI 활용 사회과학 연구의 신뢰도를 제고할 것이다. 또한, 본 연구에서 구축된 문화정책 온톨로지는 방대한 문화정책 지식을 체계화하여 관련 학계에 표준화된 지식 인프라를 제공하고, 연구자들이 이를 활용하여 이질적인 문화정책 데이터를 비교하고 분석할 수 있게 하는 등 문화정책 연구의 이론적 기반 강화와 지식 축적의 선순환에 기여할 것으로 기대된다.
정책적 기대효과
본 연구에서 개발되는 CPD-ONLR은 데이터 기반 문화정책 수립을 위한 핵심 의사결정 지원도구로 활용될 것이다. 이는 문화정책 온톨로지와 관련 문서를 결합함으로써 정책입안자 및 정책결정권자는 방대한 법령, 백서, 연구보고서에서 정보와 근거를 즉시 확보하고 다양한 정책대안의 효과를 비교 및 분석할 수 있다. CPD-ONLR이 생성하는 답변에는 항상 출처가 명시되어 정책 판단의 신뢰성을 높일 수 있을 것이며, 이는 기존에 전문가 경험이나 정성적 분석에 의존하던 문화정책 평가 방식의 객관성을 강화하는데 도움이 될 것이다.
이와 같은 CPD-ONLR은 문화체육관광부, 한국문화관광연구원 등 주요 문화정책 기관에서 정책정보 조달 및 효과를 평가하고 의사결정을 내리는데 활용될 것이다. 이는 정책수립 단계에서부터 증거 기반 접근을 정착시켜 정책의 책임성과 투명성을 제고할 수 있다. 또한 본 CPD-ONLR이 제공하는 정보는 문화정책 법·제도 정비 및 중장기 계획 수립을 지원하고 국제기구의 문화정책 권고나 협약에 부합하는 정책설계가 가능해지는 등 정책적 활용 범위가 넓다. 이와 같이 본 연구는 국가 정책의 증거 기반 정책결정 문화조성에 기여하고, 정책담당자들이 복잡한 문화정책 환경에 선제적으로 대응할 수 있도록 도울 것이다.
연구요약
(한글 2000자 이내)
문화정책 온톨로지 구축
본 연구는 문화정책 도메인의 복합적 지식 구조를 체계화하기 위해 정책 및 현장 전문가로 구성된 이원화된 포커스 그룹 인터뷰(FGI)를 수행하여 핵심 클래스와 속성을 도출한다. 도출된 개념 모델은 Protégé 등을 활용해 법령, 백서, 지원사업 공고문의 구조적 특성을 반영한 온톨로지 스키마로 형식화되며, 정책 시나리오 기반의 인스턴스를 구축하여 추론의 논리적 정합성을 검증한다. 특히 중앙정부와 지자체 사업 간의 조건 차이 등 다양한 맥락을 인스턴스 수준에서 구별하고 일관된 추론 결과를 산출하는지 확인함으로써 향후 지능형 질의응답을 위한 견고한 지식 기반을 마련한다.
도메인 특화 LLM 파인튜닝 및 RAG 모듈 구현
구축된 온톨로지와 문화정책 코퍼스를 기반으로 LLaMA, Mistral 등 최신 LLM에 파라미터 효율적 파인튜닝(PEFT/LoRA)을 적용하여 도메인 특화 모델을 개발한다. 이 모델은 정책 문서의 고유한 서술 구조와 인과관계를 학습하여 근거 기반의 조건부 서술 능력을 갖추도록 최적화된다. 또한, 이미지, 공고문 등의 비정형 데이터와 최신 API 정보를 포괄하는 Agentic RAG 모듈을 구현하여, 판단형, 설명형, 복합형 등의 질의 유형에 따라 온톨로지 구조적 질의와 벡터 검색을 유연하게 결합하는 하이브리드 추론 경로를 운용한다. 이를 통해 환각 현상을 억제하고 최신성과 정확성이 담보된 투명한 정책 자문 서비스를 구현한다.
시스템 평가 및 검증
개발된 시스템(CPD-ONLR)의 실효성은 정량적·정성적 평가를 통해 입체적으로 검증된다. 정량적 차원에서는 RAG 평가 방법론을 준용하여 검색 모듈의 정밀도(precision), 재현율(recall), NDCG 지표와 생성 모듈의 문맥 적합성, 오정보 비율 등을 측정한다. 정성적 차원에서는 도메인 전문가가 참여하는 튜링 테스트 방식을 도입, AI 산출물과 전문가 보고서의 해석 깊이 및 타당성을 비교 분석함으로써 실무 현장에서의 활용 가능성과 신뢰성을 확보한다.
키워드(Keyword)
(한글 250자 이내)
문화정책, 증거기반 정책, 온톨로지, 검색 증강 생성, 대규모언어모델, 지식 그래프
키워드
(영어 500자 이내)
Cultural Policy, Evidence-based Policy, Ontology, Retrieval-Augmented Generation, Large Language Model, Knowledge Graph

댓글 남기기 응답 취소