홍정연 / 한국어 후설 모음 변별에 대한 음향음성학적 연구: F3 및 f0를 활용한 다차원 분류 모델링 기반의 ASR 성능 개선 방안 / 2026 박사과정생연구장려금지원사업

연구목표
(한글 2000자 이내)
이 연구는 현대 한국어의 후설 모음 공간에서 나타나는 음향적 밀집 및 합류 현상을 보충하기 위한 보상적 변별 요인으로서 F3(제3포먼트)와 f0(기본주파수)의 유의성을 객관적 수치로 검증하고자 한다. 현대 한국어 모음 체계 내에서 후설 단모음인 /ㅗ/, /ㅜ/, /ㅓ/는 조음 위치가 매우 인접하여 포먼트 공간상에서 변별력이 약화되고 있으나, 실제 발화 환경에서는 구별되고 있다. 이에 이 연구는 혀의 높낮이 및 앞뒤 위치와 관련된 F1, F2 외에도 원순성 자질을 반영하는 F3와 소리의 높낮이를 결정하는 f0가 보상적인 변별 기저로 작용함을 입증하고자 한다. 이를 통해 한국어 모음 체계에 대한 정밀한 분석 지표를 확립하고, 나아가 한국어의 음성학적 특성을 반영한 모음 변별 지도학습 모델을 제시함으로써 한국어 대상 정확도가 낮은 음성인식 기술의 실용적 개선안을 제시하고자 한다.
기대효과
(한글 2000자 이내)
이 연구의 결과는 학술적 측면에서 그동안 한국어 음성학 연구에서 배제되어 온 F3와 f0의 역할을 조명함으로써 한국어 모음 체계에 대한 다차원적이고 정밀한 기술을 가능하게 것이다. 특히 실험실 통제 데이터와 대규모 자연발화 말뭉치를 교차 분석하는 방법론은 국어학 연구가 전통적인 방식에서 벗어나 데이터 사이언스 기반의 정량적 연구로 확장되는 데 기여할 것으로 보인다. 기술적 측면에서는 입증된 변별 요인들을 특징값으로 활용한 분류 모델링 결과가 한국어 음성인식 및 합성 엔진의 식별력을 높이는 중요한 기술적 인프라로 활용될 수 있다. 이러한 기술의 고도화는 궁극적으로 시각 및 청각 장애인 등 STT(Speech To Text)나 TTS(Text To Speech) 기술이 삶의 질 향상에 직결되는 사회적 약자들을 위한 배리어 프리 음성 인터페이스 개발의 기초 자료가 될 것이다.
연구요약
(한글 2000자 이내)
이 연구는 포먼트 공간상에서 밀집 현상을 보이는 현대 한국어 후설 모음 /ㅗ/, /ㅜ/, /ㅓ/의 변별 기저에 F3와 f0의 보상적 작용이 존재한다는 가설하에 통제된 실험과 빅데이터 분석을 병행하여 이를 검증하고자 한다. 우선 자유 발화 녹음 실험을 통해 20-30대 성인 40명으로부터 수집한 자유 발화 데이터를 기반으로 F1, F2, F3 기반의 3차원 모음도와 f0의 유의미한 상관관계를 분석한다. 동시에 ‘일상 대화 음성 말뭉치 2024’에서 추출한 토큰들을 활용하여 통계적 분류 모델을 구축하고, 기존 F1, F2 모델 대비 F3, f0가 추가된 확장 모델의 분류 정확도가 얼마나 유의미하게 상승하는지를 정량적으로 평가한다. 최종적으로 실험실 데이터와 빅데이터 모델링 결과를 비교하여 두 실험 간 일치도를 확인하고, 현대 한국어 화자가 채택하는 보상적 변별 요인의 실질적 가중치를 도출함으로써 연구의 학술적 신뢰도와 일반화 가능성을 동시에 확보하고자 한다.
키워드(Keyword)
(한글 250자 이내)
제3포먼트(F3), 기본주파수(f0), 후설 모음, 보상적 변별 작용, 자연발화, 분류 모델링, 대용량 말뭉치, 음성인식 개선
키워드
(영어 500자 이내)
Third Formant, Fundamental Frequency, Back Vowel, Compensatory Distinctive Mechanism, Spontaneous Speech, Classification Modeling, Large-Scale Corpus, ASR Improvement

댓글 남기기