김정연 / 한국연구재단 / 사회과학을 위한 데이터 시각화 : 이론, 방법, 교육 체계의 구축 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

김정연 / 한국연구재단 / 사회과학을 위한 데이터 시각화 : 이론, 방법, 교육 체계의 구축 / 2026 인문사회학술연구교수(A유형) / 190,000 / 60개월

접수과제정보
접수번호2026004046
연구요약문
연구목표
(한글 2000자 이내)
이 연구는 데이터화가 심화된 환경에서 사회과학 데이터를 시각적 정보로 전환하는 데이터 시각화 기법을 탐구한다. 정치사회 현상을 분석하기 위해 이론적 논의, 데이터과학 방법론, 디자인 기술을 총합하여 의미있고 분명한 방식의 데이터 시각화를 설명하는 것이 연구 목적이다. 현재 국내 사회과학 연구 분과에서는 데이터 시각화 연구의 필요성에 비해 학술적 축적이 충분히 이루어졌다고 평가하기 어렵다. 다수 연구에서 데이터 분석 결과는 대부분 텍스트와 표 중심으로 보고되며, 시각화는 보조적 표현 수단에 머무르는 경우가 많다.
본 연구는 데이터 시각화가 결과 전달을 넘어 분석의 일부로 기능한다는 점에 주목한다. 사회과학 데이터의 시각화는 사회적 맥락을 내포한 비교 장치로 작동하며(Long, 2013), 사회과학 연구에서 독립적 방법론으로 이해될 필요가 있다. 데이터 시각화는 추상적 데이터를 시각적 표현으로 전환함으로써 인간의 인지능력을 증폭시키고(Wu et al., 2021) 복잡한 현상 속에서 변화, 흐름, 관계의 양상을 직관적으로 인식하게 한다. 예를 들어, 유권자 선택 변화의 시각화는 단순 비율 비교가 아니라 개인과 집단의 변화 경로(flow)를 분석단위로 삼는다. 이는 사회 현상 분석에 있어 사후 표현의 의미를 넘어 전이(transition) 과정을 중심으로 개념화하는 방법론적 형태이다(Engebretsen, 2020).
이 연구는 양적 데이터를 그래픽 방식으로 표현하는 주요 기법을 소개하고, 데이터 시각화를 통해 새로운 추세를 발견하며 복합적 패턴을 식별하는 분석적 가능성을 논의한다. 대규모 시각화 데이터를 처리, 분석하는 과정에서 데이터 마이닝 기법의 적용을 시도한다. 나아가 데이터 리터러시 역량을 강화할 수 있는 교육자료를 개발하여 학문적·실용적 차원에서 데이터 시각화 연구의 확장을 도모한다. 이러한 빅데이터 시각화 연구는 인공지능 기술의 발전과 함께 진화하고 있는 연구 영역으로 평가할 수 있다.
본 연구의 주요 연구주제는 다음과 같다. 첫째, 사회과학 분야에서 데이터 시각화 기법의 이론적 기반과 응용 가능성을 검토한다. 정치사회 자료를 활용해 데이터 시각화의 적용에 관한 이론적 기반을 정리한다(Tufte & Graves-Morris, 1983). 둘째, 정치과정 분석의 핵심 질문들-불균형, 불평등, 대표성 등-을 표현하는 방법론으로서의 시각화 연구를 시행한다. 정치적 연합, 의제 설정, 여론의 변화 경로를 효과적으로 분석할 수 있도록 시계열 분석, 네트워크 분석, 지리적 시각화 등을 활용한 시각적 표현 기법을 연구한다(Healy & Moody, 2014). 셋째, 사회과학 데이터 시각화를 통한 연구 해석 방식의 혁신적 사례를 제시한다. 인터랙티브(interactive) 시각화와 디지털 환경에서의 시각화 스토리텔링이 통계적 의사결정 도구로서 가지는 정치적 함의를 검토한다.
종합하면, 사회과학연구에서 데이터 시각화 연구는 빅데이터의 복잡성을 완화하고(Chen, 2004), 정치사회 현상을 과정 중심으로 이해하도록 돕는 분석적 도구이다. 사회과학 연구의 주된 쟁점 의제인 이질성(heterogeniety), 분극화 등을 공간적 표현으로 드러내 정치사회적 변동성을 효과적으로 제시하게 한다. 또한, 전통적 사회과학연구에서 통계모델 결과의 재현성과 검증 가능성을 높여 실증 연구의 신뢰를 높인다. 인공지능 기반 데이터 분석이 확대되는 상황에서 데이터 시각화는 알고리즘 중심 분석의 불투명성을 완화하고, 해석 가능성을 확장하는 역할을 수행한다(Cairo, 2016). 본 연구는 데이터 시각화를 기술적 보조 수단이 아닌, 인공지능 시대 사회과학연구의 이론, 방법론, 교육의 층위에서 독립적 연구 영역으로 제시하고자 한다.
기대효과
(한글 2000자 이내)
본 연구는 사회과학 데이터 시각화의 이론적 기반을 체계화하고, 인터랙티브 시각화 기법을 활용한 실증적 연구를 수행함으로써 정치학을 포함한 사회과학 및 데이터과학의 학제적 접점을 강화하는 데 기여한다. 지원자는 연구 과정에서 정치, 공공 데이터, 정치행위자 활동 데이터, 소셜미디어 데이터 등 대규모 데이터셋을 활용하여 시계열, 네트워크, 공간 분석 기반의 시각화 모델을 개발한다. 이를 통해 정치사회 현상의 동태성과 구조를 분석하는 시각화 사례를 제시하고, 학술논문, 재현 가능한 시각화 분석 프레임워크, 인터랙티브 시각화 프로토타입, 교육 자료 등 구체적 연구 산출물을 도출한다.
본 연구는 인공지능 시대 데이터 기반 문제해결에 대한 사회적 요구에 부응하여, 데이터 시각화 연구를 통해 학문적 발전과 실질적 사회 기여를 동시에 추구한다. 학문적으로는 데이터 시각화를 정치과정연구의 독립적 분석방법론으로 정립하고, 정량·정성 분석의 융합적 연구를 촉진하는 계기가 될 것이라고 생각된다. 사회적으로는 데이터 리터러시 교육을 강화하고, 연구자, 정책결정자, 언론인 등이 데이터 기반 분석을 활용해 신뢰성 있는 정치 정보를 생산·활용·해석하도록 지원하는데 기여한다.
본 연구를 통해 도출된 성과는 사회과학 데이터 분석 및 시각화를 위한 오픈소스 라이브러리와 대시보드 형태로 공개하여, 연구자와 실무자가 쉽게 활용할 수 있도록 할 계획이다. 또한, 연구결과를 반영한 <사회과학 데이터 시각화 핸드북>을 출판하고, 온라인 교육 콘텐츠 및 GitHub 코드 튜토리얼을 제공하여 학습 및 실무 적용의 접근성을 높이고자 한다. 이 연구는 국내외 학술지 게재 및 학술대회 발표를 통해 연구 성과를 확산하고, 학문적 협업을 촉진하여 데이터 시각화 연구의 국제적 네트워크 구축에 데 기여할 것이다.
데이터 시각화 연구는 정치학, 사회학, 컴퓨터과학, 디자인, 미디어 연구 등과 결합하여 학제 간 연구를 촉진하고, 사회과학 연구 방법론을 확장하는 차원에서 차별성을 가진다. 본 연구는 머신러닝을 활용한 자동화된 정치사회 데이터 시각화 기법 개발, 여론 변화의 실시간 예측 모델 구축, 정책 영향력 분석 등으로 연구 범위를 확장할 수 있는 기반을 제공한다. 또한 효과적인 시각화 교육을 위한 전략과 도구를 제시함으로써 연구와 교육의 연계를 강화한다. 최종적으로, 본 연구는 데이터 시각화가 정치과정연구 및 정책 분석에서 실질적인 도구로 자리 잡을 수 있도록 기반을 마련하고, 데이터 기반 민주주의 의사결정 문화를 확산하는 데 일조할 것이라고 생각된다.
연구요약
(한글 2000자 이내)
1년차 연구는 사회과학 분야에서 데이터 시각화 기법의 개념과 이론적 토대, 응용 가능성을 검토한다. 정보 전달 수단을 넘어 분석 도구로서 데이터 시각화가 활용되는 방식을 논의하는 것을 목표로 한다. 특히, 미국을 중심으로 한 최신 연구 동향을 분석하고 계량적 분석과 해석 차원을 유기적으로 연결하는 방법론적 가능성을 탐구한다. 주요 사례로 미국 선거 분석에서 활용되는 인터랙티브 지도, 네트워크 분석 기반 시각화 등의 문헌을 검토하고, 이를 통해 정치적 선택과 연합, 변화 경로를 시각적으로 분석하는 접근법을 논의한다(Silver, 2012). 미국 선거의 경우 대통령 선거 뿐 아니라 상·하원 선거, 주지사 선거 등 다층적 구조를 지니고 있어 데이터 시각화가 선거 결과 해석과 전략 분석 측면에서도 필수적으로 다뤄지고 있다. 또한, 머신러닝 기반 자동화된 정치 데이터 시각화 기법에 대한 연구(Wu et al., 2021)를 검토하고, 이후 연차에서 수행되는 실증 연구와 기법 개발을 위한 이론적, 기술적 기반을 마련한다.
2년차 연구는 정치과정에서 불균형, 불평등, 대표성과 같은 핵심 질문을 분석, 표현하는 방법론으로서 데이터 시각화 연구를 수행한다. 본 연구에서는 정당, 정치행위자 관계, 정치적 이슈 경쟁, 여론 변화 경로를 효과적으로 분석할 수 있는 데이터 시각화 기법 개발을 목표로 한다. 시계열 분석, 네트워크 분석, 지리적 시각화 등을 다루며, 실제 대규모 데이터를 적용해 정치행위자 간 이슈 경쟁 구조와 여론 흐름을 분석, 탐색하기 위한 시각화 모델을 설계한다(Munzne, 2014). 구체적으로는, 시계열 시각화를 통해 선거 및 정치 이벤트에서 이슈 등장과 확산 양상을 탐색하고, 네트워크 시각화를 활용하여 정치행위자 간 이슈 연계 및 경쟁 구조를 분석한다(Kenski, 2006). 또한, 소셜미디어 데이터를 기반으로 지역별, 시간별 여론 변동 패턴을 시각화한다. 이 과정은 R 기반 데이터 분석 및 시각화 워크플로우를 구축함으로써 가능하다. 주요 패키지로 tsibble, fable, sf(Spatial Data), echarts4r, leaflet, tidygraph, igraph 등을 활용하고(Pedersen, 2020; Wickham & Sievert, 2009; Csardi & Nepusz, 2006), 머신러닝 기법과 결합하여 정치사회 데이터 시각화의 해석력을 제고한다.
3~5년차 연구는 인터랙티브 시각화와 디지털 환경에서의 시각화 스토리텔링이 정치사회 문제에 대한 인식과 의미 구성 과정에 미치는 영향을 분석하고, 시각화가 연구자 뿐 아니라 정책결정자와 시민에게 어떠한 해석 틀을 제공하는지 실증적으로 검토한다. R 기반 Shiny, leaflet, d3 등의 도구를 활용해 여론 및 소셜미디어 데이터 변화 패턴을 분석하고, 실제 정치사회 자료분석을 통한 시각화 사례를 구축한다. 본 연구에서는 인터랙티브 시각화의 학문적, 이론적 가치를 정리하고, 최적화된 기법을 개발한다(Borner & Polley, 2014). 그리고 사회과학 데이터 시각화 및 데이터 리터러시 교육 프로그램을 설계하여 연구 성과의 확산과 활용을 도모한다. 교육 프로그램은 데이터 수집·정제·분석, 시각화 기법(시계열, 네트워크, 공간 데이터 시각화 기법, 인터랙티브 시각화 도구 실습)으로 구성되며, 온라인과 오프라인 모듈을 포함한다. 연구자, 데이터 저널리스트 등 수요자 대상 맞춤형 콘텐츠를 개발하고, 실습 중심 커리큘럼을 운영한다.
종합하면 본 연구는 시각화 연구의 이론 정립, 분석 방법 개발, 인터랙티브 실증과 확산, 교육 연계 프로그램을 단계적으로 수행함으로써 사회과학 데이터 시각화가 연구 결과의 보조적 표현 수단이 아닌 독립적 분석방법론으로 기능할 수 있는 조건을 검토한다. 이를 통해 데이터 시각화가 사회과학 연구의 해석력과 설명력을 확장하는 방식과, 복합적인 사회 현상에 대해 투명하고 신뢰성 있는 데이터 기반 판단을 가능하게 하는 방법론적 기반을 제시하고자 한다.
키워드(Keyword)
(한글 250자 이내)
데이터 시각화, 정치과정 분석, 인터랙티브 시각화, 스토리텔링, 데이터 리터러시 교육
키워드
(영어 500자 이내)
Data visualization, Political Process Analysis, Interactive Visualization, Storytelling, Data Literacy Education
닫기

댓글 남기기