박아름 / 성균관대학교 / 한국어·독일어 혐오-대항 발화 데이터셋 구축과 인간-AI 협력 데이터 확장 모델 연구 / 2026 신진연구자지원사업(인문사회) / 75,780 / 36개월 / 2026 신진연구자지원사업(인문사회)
연구목표
본 연구의 목표는 온라인 공간에서 실제로 사용된 혐오 발화와 이에 대한 대항 발화를 개별 문장이 아닌 상호작용 단위로 재구성한 한국어–독일어 데이터셋을 구축하고, 이를 통해 대항 발화가 어떤 조건에서 사회적으로 효과를 발휘하는지를 실증적으로 규명하는 데 있다. 기존 혐오 발화 연구가 주로 발화의 탐지·분류나 삭제를 중심으로 이루어져 왔다면, 본 연구는 혐오 발화에 대한 대응으로서 대항 발화를 사회적 상호작용 속에서 작동하는 담화 행위로 재정의하고자 한다.
구체적으로 본 연구는 혐오 발화, 이에 대한 대항 발화, 그리고 그 이후에 이어지는 후속 반응을 하나의 연쇄적 흐름으로 보존한 실제 온라인 담화 데이터를 수집 및 구축한다. 이를 바탕으로 혐오 발화의 유형과 표적 대상에 따라 어떠한 대항 발화 전략이 ‘좋아요’, ‘싫어요’와 같은 대중의 사회적 평가 신호를 유도하는지를 언어별·맥락별로 비교·분석한다. 이를 통해 대항 발화의 효과가 단순히 발화 내용의 옳고 그름에 의해 결정되는 것이 아니라, 혐오 발화와의 관계 속에서 어떠한 방식으로 제시되고, 담화 흐름상 어느 지점에서 개입되며, 이후 대중의 반응을 통해 어떻게 수용되는지를 체계적으로 밝히고자 한다.
특히 본 연구는 대항 발화를 개별 발화의 존재 여부나 전략 유형의 나열로 파악하는 데 그치지 않고, 실제 온라인 상호작용 속에서 효과가 검증된 전략이 어떻게 구성되고 수용되는지를 추적한다는 점에서 기존 연구와 근본적으로 차별화된다. 실제 사용 발화에 기반한 대항 발화 데이터와 공감·지지·반대와 같은 사회적 평가 신호를 주석 체계에 통합하여 분석하는 접근은 대항 발화의 효과를 경험적이고 재현 가능한 방식으로 검증하려는 드문 시도이다.
나아가 본 연구는 이렇게 구축된 실제성 있는 데이터와 분석 결과를 토대로, AI가 인간을 대체하여 대항 발화를 자동 생성하는 방식이 아니라, 효과가 검증된 대항 발화 전략을 인간의 판단을 통해 선별하고 이를 AI가 확장하는 인간–AI 협력형 데이터 확장 모델의 가능성을 탐색한다. 이를 통해 번역이나 AI 생성에 의존해 실제성과 설득력을 약화시켜 온 기존 자동화 방식의 한계를 보완하고, 맥락과 언어·문화적 특수성에 민감한 책임 있는 AI 활용 모델을 제안하고자 한다.
궁극적으로 본 연구는 영어 중심으로 축적되어 온 기존 연구 관행에서 벗어나, 한국어를 출발점으로 독일어를 후속 비교 언어로 설정함으로써 언어·문화적 다양성을 반영한 대항 발화 연구의 새로운 기준을 제시한다. 본 연구에서 구축되는 데이터와 분석 틀은 향후 다른 언어로 확장 가능한 공통의 방법론적·데이터적 초석으로 기능하며, 혐오 발화 대응을 위한 학문적 연구와 사회적 실천을 연결하는 기초 연구로 자리매김하는 것을 목표로 한다.
기대효과
본 연구는 혐오 발화와 대항 발화를 개별 문장이나 전략 유형의 나열로 다루어 온 기존 연구 관행을 넘어, 대항 발화가 실제 온라인 상호작용 속에서 어떠한 조건 하에서 대중의 공감과 지지를 획득하는 담화 전략으로 작동하는지를 경험적으로 규명함으로써, 대항 발화 연구의 분석 단위와 질문 자체를 재구성하는 학술적 기여를 지닌다. 이를 통해 대항 발화는 규범적 당위나 윤리적 발언의 차원을 넘어, 사회적 상호작용 속에서 효과가 검증되고 평가되는 실천적 담화 행위로 재정의될 수 있다.
학문적으로 본 연구는 ‘혐오 발화–대항 발화–후속 반응’으로 이어지는 상호작용 단위를 기본 분석 틀로 설정하고, 여기에 공감·지지·비추천과 같은 사회적 평가 신호를 체계적으로 통합함으로써, 혐오 담화가 개인 간의 이자적 관계를 넘어 발화 목격자와 대중의 반응을 포함한 삼자적 사회적 상호작용 속에서 작동한다는 점을 실증적으로 분석할 수 있는 연구 기반을 제공한다. 이는 혐오 담화 연구의 초점을 발화의 ‘존재 여부’나 ‘유형 분류’에서, 담화가 어떻게 수용되고 어떤 사회적 반응을 조직하는가라는 문제로 확장하는 데 기여한다.
방법론적으로 본 연구는 실제 온라인 담화에서 수집된 발화를 맥락 단위로 보존한 데이터 구축, 사회적 평가 신호를 포함한 다층적 주석 체계, 그리고 정량·정성 분석을 결합한 분석 설계를 제시한다. 특히 본 연구에서 구축되는 한국어–독일어 대항 발화 데이터셋은 GitHub를 통해 투명하게 공개되며, 데이터 자체뿐 아니라 주석 가이드라인, 분석 기준, 중간 분석 결과와 같은 연구 과정의 산출물 역시 학술 논문으로 단계적으로 발표된다. 이는 후속 연구자들이 동일한 기준으로 데이터를 재사용·확장·비교할 수 있는 재현 가능한 연구 환경을 제공하며, 향후 다국어 혐오–대항 발화 연구를 위한 공통의 방법론적 기반으로 기능할 수 있다.
사회적 측면에서 본 연구는 혐오 발화를 단순히 삭제하거나 차단해야 할 대상으로 접근하는 관점을 넘어, 대중의 반응과 개입을 통해 완화되거나 전환될 수 있는 사회적 소통 문제로 재위치시킨다. 실제 온라인 담화에서 공감과 지지를 이끌어낸 대항 발화 전략을 체계적으로 분석한 연구 결과는, 교육 현장, 시민 사회, 미디어 리터러시 프로그램에서 책임 있는 디지털 시민성을 논의하는 데 실증적 근거로 활용될 수 있다. 나아가 이는 플랫폼 운영자와 정책 입안자에게도 혐오 대응을 검열 중심 정책에 한정하지 않고, 참여와 상호작용을 고려한 담화 환경 설계 및 정책 논의로 확장할 수 있는 분석적 근거를 제공한다.
아울러 본 연구는 인간의 판단과 해석을 중심에 두고 AI를 보조적으로 활용하는 인간–AI 협력형 데이터 확장 접근을 통해, 자동화 중심의 기술 적용이 지니는 실제성 및 신뢰도 문제를 비판적으로 검토한다. 이를 통해 AI가 언제 대항 발화의 효과를 확장할 수 있으며, 언제 오히려 설득력을 저해할 수 있는지를 경험적으로 검증함으로써, 책임 있는 AI 활용에 대한 구체적이고 실천적인 연구 사례를 제시한다.
종합하면, 본 연구는 혐오 발화 문제를 언어학적 분석, 사회적 상호작용 이해, 그리고 책임 있는 기술 활용이라는 관점에서 통합적으로 다루며, 학문적 연구 지형의 확장, 방법론적 기준의 제시, 그리고 디지털 시민성과 플랫폼 정책 논의에 기여할 수 있는 실증적 근거를 동시에 창출하는 기초 연구로서의 의의를 지닌다.
연구요약
온라인 공간에서 혐오 발화는 더 이상 혐오 발화자와 피해자 사이의 문제에 국한되지 않는다. 혐오적 발언은 플랫폼의 알고리즘 기반 추천 환경 속에서 이를 목격하는 다수의 이용자에게 반복적으로 노출되며, 사회적 태도와 규범 형성에 장기적인 영향을 미칠 수 있다.
기존 자연어처리 연구는 혐오 발화를 개별 문장 단위로 탐지·분류하고 삭제하는 기술적 대응에 주로 집중해 왔다. 이러한 삭제 중심 접근은 문제적 발화를 사후적으로 제거하는 데에는 기여할 수 있으나, 혐오를 가능하게 하고 강화하는 담화의 구조 자체를 변화시키는 데에는 한계를 지닌다.
본 연구는 이러한 문제의식에서 출발하여, 온라인 혐오 담화를 상호작용이라는 분석 단위로 재구성하고, 대항 발화가 실제 담화 환경의 어떠한 조건 하에서 대중의 공감과 지지를 획득하는지를 실증적으로 탐구한다.
이를 위해 본 연구는 유튜브 댓글을 대상으로 혐오 발화–대항 발화–후속 반응이 연결된 상호작용 단위를 수집·구축하고, 발화 유형, 표적 집단, 대항 발화 전략과 함께 지지·비추천과 같은 사회적 평가 신호를 통합적으로 주석한다. 이러한 설계는 대항 발화를 개별 발화나 전략 목록으로 다루는 기존 연구와 달리, 실제 온라인 상호작용 속에서 대항 발화가 어떻게 수용·평가되는지를 분석 가능하게 한다.
본 연구는 한국어를 1차 분석 언어로 설정하고, 이후 독일어로 확장하여 언어·문화적 맥락에 따라 혐오 담화와 대항 전략의 구성 및 수용 양상이 어떻게 달라지는지를 비교 분석한다.
또한 본 연구는 최근 확산되고 있는 번역·자동 생성 중심의 대항 발화 데이터 구축 방식이 지니는 실제성 및 신뢰도 문제를 비판적으로 검토하고, 이를 보완하는 인간–AI 협력형 데이터 확장 접근을 제안한다. AI는 대항 발화를 자동으로 생성하는 주체가 아니라, 실제 담화에서 효과가 확인된 전략을 조건으로 의미 기반 데이터 증강이나 대규모 언어모델의 텍스트 생성을 통한 데이터 확장을 지원하는 도구로 활용된다. 이렇게 확장된 데이터는 연구자의 검토를 통해 담화적 타당성과 실제성이 평가되며, 이를 통해 AI 활용이 언제 효과를 확장하고 언제 오히려 설득력을 저해하는지를 체계적으로 검증한다.
본 연구는 영어 중심으로 축적되어 온 혐오·대항 발화 연구 관행에서 벗어나, 한국어를 출발점으로 독일어를 병렬 비교함으로써 언어·문화적 다양성을 반영한 연구 설계를 제시한다. 나아가 상호작용 단위 데이터 구축, 사회적 평가 신호의 통합 분석, 인간–AI 협력형 데이터 확장이라는 방법론적 결합을 통해, 혐오 담화를 단순히 제거할 대상이 아니라 변화 가능한 사회적 소통 구조로 이해하는 새로운 연구 틀을 제안한다.
키워드
혐오 발화, 대항 발화, 담화 분석, 인간-AI 협력, 데이터 확장
Hate Speech, Counterspeech, Discourse Analysis, Human-AI Collaboration, Data Expansion