정혜윤 / 고려대학교 / 다국어 AI의 문화 적응력 향상을 위한 한국어-스페인어 무례 탐지 및 정중도 조절 연구 / 4.9천만원 / 24개월 / 2025 신진연구자지원사업(인문사회)
연구목표:
본 연구는 스페인어와 한국어의 무례 개념을 비교하고, 다언어 AI 모델이 이러한 문화적 차이를 반영하여 효과적으로 탐지 및 조절할 수 있도록 하는 방안을 탐색하는 것을 목표로 한다. 인간의 언어적 상호작용에서 무례(impoliteness)은 단순한 예의의 결여를 넘어, 사회적 체면(face)을 위협하고 대화의 흐름을 변화시키는 중요한 요소로 작용한다. 그러나 무례함의 개념과 허용 범위는 언어와 문화에 따라 차이를 보이며, 기존 AI 모델은 이러한 차이를 효과적으로 반영하지 못하는 한계를 가진다.
따라서 본 연구는 다음과 같은 세 가지 핵심 질문을 중심으로 진행된다.
● 스페인어와 한국어에서 무례함이 나타나는 방식은 어떻게 다른가?
● 사회적 맥락(대화 상대, 매체, 상황 등)에 따라 두 언어의 무례함은 어떻게 다르게 해석되는가?
● 다언어 AI 모델이 이러한 문화적 차이를 반영하여 적절하게 대응하려면 어떤 조정이 필요한가?
이를 위해, 본 연구는 무례 관련 이론적 연구를 바탕으로 한국어와 스페인어에서 나타나는 다양한 유형의 무례함을 분석하고, 이를 AI 모델 설계에 반영하는 방안을 제안한다.
기대효과:
본 연구는 한국어와 스페인어의 무례 개념을 비교하고, AI가 문화적 차이를 반영하여 무례를 탐지하고 조절할 수 있도록 하는 모델을 개발하는 것을 목표로 한다. 기존 연구들이 주로 영어 중심의 정중도 및 무례 연구에 초점을 맞췄던 것과 달리, 본 연구는 다국어 환경에서 AI가 맥락에 맞게 무례를 인식하고 조절할 수 있도록 학습하는 새로운 접근법을 제시한다.
본 연구를 통해 다국어 무례 표현을 체계적으로 분석한 최초의 데이터셋을 구축하고, AI가 문맥을 고려하여 무례를 탐지할 수 있도록 설계된 정교한 모델을 개발할 수 있다. 특히, 기존 연구에서 간과된 ‘거짓 무례(Mock Impoliteness)’ 및 ‘무의지적 무례(Unintentional Impoliteness)’를 포함한 7가지 무례 유형을 체계적으로 분석하여 AI 모델이 보다 정밀하게 무례를 탐지하고 학습할 수 있도록 한다.
실용적 측면에서 본 연구의 결과물은 공공기관, 고객 서비스, 온라인 커뮤니티, 교육 및 게임 산업 등 다양한 분야에서 AI 챗봇 및 대화형 AI의 정중도 조절 기능을 향상시키는 데 기여할 수 있다. AI가 단순한 무례 필터링을 넘어 문화적 맥락을 반영하여 정중한 응답을 생성할 수 있도록 설계됨으로써, 다국적 환경에서도 보다 자연스럽고 효과적인 AI 상호작용이 가능해질 것이다.
또한, AI 기반의 무례 탐지 및 조절 기능이 강화되면, 다문화 환경에서 발생할 수 있는 의사소통 오류 및 오해를 줄이고, AI 챗봇이 보다 윤리적이고 신뢰할 수 있는 방식으로 사용자와 소통할 수 있도록 지원할 수 있다. 본 연구는 궁극적으로 AI의 언어 적응력을 높이고, 윤리적 AI 개발을 위한 기초 연구로서 중요한 역할을 할 것으로 기대된다.
연구요약:
본 연구는 총 2개년에 걸쳐 진행되며, 1차년도에는 한국어와 스페인어에서 나타나는 무례 표현을 체계적으로 수집하고 분석하는 과정을 수행한다. 이를 위해 다양한 대화 환경에서 나타나는 무례를 반영할 수 있도록 SNS 댓글(X(Twitter), YouTube), 온라인 게시판, TV 토론, 영화 및 드라마 대사 등의 데이터를 확보하여 연구 대상 언어의 실제 사용 맥락을 반영한다. 수집된 데이터는 7가지 무례 유형(명시적 무례, 적극적 무례, 소극적 무례, 암시적 무례, 불충분한 공손, 거짓 무례, 무의지적 무례)으로 분류하여 분석되며, 이를 통해 무례가 언어적·문화적 차원에서 어떻게 형성되고 변형되는지를 탐구한다.
또한, 수집된 데이터에 대해 정중도 평가(Politeness Scale)를 적용하여 무례가 맥락에 따라 어떻게 다르게 해석되는지를 정량적으로 측정한다. 이를 위해 연구 참여자 또는 크라우드소싱 방식을 활용하여 각 발화에 대한 정중도 평가 점수를 부여하고, 이를 바탕으로 한국어와 스페인어에서 무례 표현이 어떤 패턴을 보이며, 특정한 사회적 맥락에서 어떻게 사용되는지를 비교한다. 이를 통해 두 언어에서 무례가 빈번하게 나타나는 유형과 맥락을 도출하고, 사회적 관계(예: 친밀한 관계 vs. 공식적 상황), 매체 유형(구어 vs. 문어), 대화 참여자 간 위계 관계 등이 무례 표현에 미치는 영향을 분석한다.
2차년도에는 1차년도에 구축한 데이터를 바탕으로 AI 모델을 활용한 무례 탐지 및 조절 연구를 진행한다. AI가 무례를 보다 정교하게 인식하고 문맥에 맞게 조정할 수 있도록 Transformer 기반의 자연어 처리 모델을 활용하여 정중-무례 감지 및 조절 모델을 학습한다. 특히, 단순한 단어 기반 필터링이 아닌 문맥을 고려한 정중-무례 변환 모델을 개발하여 AI가 무례를 보다 정확하게 이해하고, 상황에 적절한 대응을 할 수 있도록 설계한다.
AI 모델의 성능은 Precision, Recall, F1 Score 등의 평가 지표를 활용하여 정량적으로 측정하며, 무례를 탐지하는 AI의 성능이 인간 평가자의 판단과 얼마나 일치하는지를 비교한다. 또한, Lexical Diversity 및 Semantic Alignment 등의 지표를 활용하여 AI 모델이 다양한 맥락에서 무례를 어떻게 처리하는지를 분석한다. 이를 통해 AI 모델이 무례를 단순히 필터링하는 것이 아니라, 사회적·문화적 맥락을 고려하여 적절한 정중 표현으로 변환할 수 있는지를 평가한다.
키워드:
무례, 다국어 인공지능, 문화 적응력, 데이터기반, 스페인어-한국어 비교, 정중성 조절
Impoliteness, Multilingual AI, Cultural Adaptation, Data-driven, Spanish-Korean Comparison, Politeness Adjustment