나수연 / 전남대학교 / Python을 활용한 중국어 신문 텍스트의 접속사 사용 양상 변화 – 『人民日報』(1946~2022) 코퍼스 분석 / 2026 인문사회학술연구교수(B유형) / 20,000 / 12개월

연구요약문
연구목표
(한글 2000자 이내)
본 연구는 『人民日報』(1946~2022)를 대상으로, 중국어 신문 텍스트에 나타난 접속사(連詞)의 사용 변화를 고찰한다. 접속사 선택 양상 변화를 바탕으로 신문 텍스트의 논리 관계 표지(인과·대조·양보·조건 등)의 시기별 빈도와 비중 변화를 정량 비교하고, 이러한 변화가 신문 레지스터(register, 문체) 변화의 유의미한 언어적 지표임을 실증적으로 검증하고자 한다.

서면어의 대중화(通俗化)·간결화 경향은 지속적으로 논의되어 왔으며, 1990년대 인터넷 보급과 2000년대 이후 모바일 환경 확산은 신문 텍스트에도 간결성·가독성에 대한 압력을 증대시켰다. 그러나 기존 연구는 이러한 문체 변화를 ‘쉬운 어휘 사용’이나 ‘문장 길이 단축’ 같은 거시 지표로만 설명해 왔으며, 텍스트의 논리 전개 방식이 어떻게 변화했는지는 충분히 다루지 못했다. 본 연구에서 접속사에 주목하는 이유는 세 가지이다. 접속사는 기능어로서 주제·사건 변화에 따른 내용어 분포의 변동 영향을 상대적으로 덜 받아, 신문 텍스트의 레지스터 변화 신호를 안정적으로 추적하는 데 유리하다. 또한 격식적·비격식적 변이형의 공존은 문체적 선택의 미세한 이동을 정량적으로 포착할 수 있게 하며, 폐쇄 부류라는 특성은 76년의 장기 코퍼스에 대한 전수 조사를 가능하게 해 분석의 완결성과 재현 가능성을 높인다. 따라서 접속사 분석은 신문 텍스트의 문체적 지향성 변화를 규명하는 데 유력한 실증 지표가 될 수 있다.

이에 본 연구는 다음의 다섯 가지 분석 축을 설정한다.
(1) 접속사 사용 빈도와 밀도의 장기적 추이를 확인하고, 문장 길이 변화라는 변수를 통제하여 접속사 사용의 변화 양상을 규명한다.
(2) 동일 의미·기능 범주 내에서 격식적 변이형과 비격식적 변이형의 선택 비중이 시기별로 어떻게 변화되는지 분석한다.
(3) 접속사를 의미 기능별(인과·전환·양보·첨가·선택 등)로 범주화하여 각 기능군의 분포 체계가 통시적으로 어떻게 재구성되는지 분석한다.
(4) 접속사별 공기어 분석을 수행함으로써 개별 기능어가 사용되는 통사적·의미적 환경의 변화를 추적한다.
(5) 언어 변화가 점진적으로 누적되는지, 혹은 특정 시기를 경계로 구조적 전환점이 나타나는지 탐색한다.

분석 범위는 문법 범주로서의 접속사(連詞)로 한정하며, 담화적 연결 기능을 수행하더라도 접속사로 분류되지 않은 표현은 제외한다. 자료는 CCL(北京大學中國語言學研究中心語料庫)에 수록된 『人民日報』(1946~2022) 텍스트를 주 코퍼스로 활용하고, 어휘 목록과 품사 태깅을 결합한 이중 필터 방식으로 추출 신뢰도를 확보한다. 76년간의 자료를 7개 시기로 구분하여 장기 시계열 분석을 수행하며, 공기어 결합 강도와 시기 간 분포 차이를 통계적으로 검정한다.
본 연구는 『人民日報』에서 접속사 사용의 추세, 변이형 이동, 기능군 재편, 사용 맥락 변화 및 전환점을 다각도로 분석함으로써, 신문 레지스터의 문체적 특성이 시대에 따라 어떻게 재편되어 왔는지 그 방향성과 구조적 특징을 밝히고자 한다. 또한 접속사 기반 분석이 레지스터 변이를 설명하는 실증적 지표로서의 타당성을 검증하고, 향후 관련 분야 연구의 정밀한 방법론적 기초를 제시할 것으로 기대한다.
기대효과
(한글 2000자 이내)
본 연구는 『人民日報』(1946~2022) 코퍼스를 기반으로 중국어 접속사의 통시적 변화 양상을 분석함으로써, 다음과 같은 기대효과를 갖는다.

∎ 학술적·이론적 기여
(1) 신문 레지스터 내부의 문체 변화에 대한 새로운 실증적 근거를 제공한다. 기존 논의가 주로 어휘 난이도나 문장 길이 등 거시 지표를 중심으로 이루어져 왔다면, 본 연구에서는 접속사 선택이라는 미시 지표를 통해 텍스트의 논리 전개 방식이 장기적으로 어떻게 조정되어 왔는지를 규명한다. 특히 양적 추세(빈도·밀도)와 질적 변화(공기어 결합 환경)를 연계하여, 변화의 전환 시점을 포함한 통시 기술의 틀을 제시한다.
(2) Biber의 레지스터 변이 이론과 馮勝利의 문체어법 관점을 참고하여 관찰된 변화를 해석함으로써, 중국어 문체 연구의 이론적 논의를 보완한다.
(3) 관영 매체 담화에서 접속사 선택이 장기적으로 어떻게 재편되는지를 언어학적으로 제시함으로써, 중국학·미디어 담화 연구·역사언어학 등 인접 분야에 활용 가능한 학제 간 근거 자료를 제공한다.

∎ 방법론적 기여
(1) 재현 가능한 코퍼스 분석 프로토콜을 정립한다. 어휘 목록과 품사 태깅을 결합한 이중 필터 추출, pmw 정규화, 분포 차이 검정(카이제곱)과 효과크기(Cramér’s V), 공기어 결합 강도(t-score) 및 시기 간 비교(log-likelihood), 층화 표본 검증(precision, recall, F1)을 포함하는 절차를 체계화한다. 이를 통해 후속 연구가 동일 절차를 재현하거나 다른 코퍼스로 확장할 수 있는 방법론적 기준을 제공한다.
(2) 접속사를 문장 길이에 종속된 변수가 아닌 독립적 논리 지표로 설정하고, 문장 길이 변인을 별도로 산출·비교한다. 이를 통해 간결화(외형적 변화)와 명시화(내적 선택)가 동일한 추세를 공유하는지, 서로 독립적으로 진행되는지를 분리하여 해석할 수 있는 분석 틀을 제시한다.
(3) BCC 신문 코퍼스 교차검증을 통해 단일 매체 편향을 완화하고 결과의 신뢰도를 강화한다.

∎ 교육적·응용적 기여
(1) 시기별 접속사 사용 양상과 대표 용례를 정리하여 읽기·작문 및 문법 교육에서 활용 가능한 자료로 제공한다. 기능군별 대표 접속사와 결합 환경은 교재 개발, 평가 문항 설계, 학습자 오류 지도에 근거 자료로 활용될 수 있으며, 시기별 빈도 변화 데이터는 신문 텍스트의 난이도 판별 및 학습자 수준에 따른 읽기 자료 선정에도 응용이 가능하다.
(2) 본 연구에서 정립한 분석 프로토콜과 정제된 데이터는 사설·평론·소셜 미디어 등 다른 장르 및 매체의 문체 분석으로 확장 적용할 수 있으며, 나아가 기계 번역의 문체 조율이나 생성형 AI의 시대·장르별 글쓰기 학습에 필요한 기초 자료로도 활용될 수 있다.

본 연구는 접속사 선택 변화의 장기 추세와 전환점을 근거 기반으로 제시하고, 그 결과를 연구·교육·응용에 재사용 가능한 형태로 정리함으로써 학술적·실용적 확산에 기여할 것으로 기대한다.
연구요약
(한글 2000자 이내)
본 연구는 『人民日報』(1946~2022)를 대상으로, 신문 텍스트에서 중국어 접속사(連词) 사용이 통시적으로 어떻게 변화했는지를 분석하여 접속사 선택 양상의 변화가 신문 레지스터(register) 변이의 유의미한 언어적 지표임을 실증적으로 검증하고자 한다. 신문 텍스트의 문체가 시대에 따라 변화해 왔다는 점은 널리 인정되지만, 그 변화의 구체적 양상과 방향은 충분히 규명되지 않았다. 기존 연구는 ‘쉬운 어휘 사용’이나 ‘문장 길이 단축’과 같은 거시 지표로 설명하는 데 치우쳐, 텍스트의 논리 전개 방식이 어떤 표지 선택을 통해 조정되는지는 상대적으로 충분히 다루지 못했다. 접속사는 문장 간 논리 관계를 명시화하는 핵심 기능어이며, 동일 기능에서도 격식적 변이형(예: 因此, 然而)과 비격식적 변이형(예: 所以, 不过)이 공존한다. 또한 기능어는 주제·사건 변화에 따른 내용어 분포의 변동 영향을 상대적으로 덜 받는 편이어서, 접속사 선택의 장기적 추이는 신문 텍스트의 문체적 변화를 설명하는 단서가 될 수 있다. 이에 본 연구는 접속사 사용의 추세와 변이형 이동뿐 아니라 기능군(인과·대조·전환·양보·첨가·선택 등) 분포, 공기어 결합 환경 변화, 그리고 구조적 전환점의 존재 여부 등을 다각도로 고찰한다.

이를 위해 다음과 같은 연구 질문을 설정하였다.
(1) 접속사 사용 빈도·밀도는 장기적으로 어떤 추세를 보이며, 문장 길이 변화와 어떤 관련을 갖는가?
(2) 격식적/비격식적 변이형의 선택 비중은 시간에 따라 어떻게 이동하며, 공기어 결합 환경 재편과 어떻게 연관되는가?
(3) 인과·전환·양보·첨가·선택 등 기능 유형별 분포는 통시적으로 어떻게 재편되는가?
(4) 변화는 점진적으로 누적되는가, 혹은 특정 시기를 경계로 구조적 전환점이 나타나는가?

상술한 연구 질문의 답을 하기 위한 세부적인 연구 방법은 다음과 같다.
(1) 분석 범위: 문법 범주로서의 접속사로 한정하며, 담화적 연결 기능을 수행하더라도 접속사로 분류되지 않은 표현은 제외한다.
(2) 자료: CCL(北京大學中國語言學研究中心語料庫)을 주 코퍼스로 활용하고, GitHub 공개 자료 및 BCC를 보조 자료로 사용해 핵심 결과를 교차검증한다.
(3) 분석 기간: 1946~2022년을 매체 환경 변화를 고려해 7개 구간으로 나눈다.(시기 구분과 그 기준에 대한 내용은 연구 내용 참고)
(4) 연구 방법: 접속사 추출은 어휘 목록과 품사 태깅을 결합한 이중 필터 방식을 적용하며, 층화표본으로 F1 0.90 이상을 목표로 신뢰도를 확보한다. 빈도는 백만 토큰당으로 정규화하고, 시기 간 분포 차이는 카이제곱 검정과 효과크기로 제시한다. 사용 맥락 변화는 공기어 결합 강도(t-score)와 시기 간 결합 패턴 차이(log-likelihood)로 확인한다.

본 연구는 신문 담화의 논리 관계 표지 전략이 시대별로 어떻게 변화했는지에 대한 실증적 근거를 제시함으로써, 중국어 문체 변화 논의에 실증적 근거를 제공하고 레지스터 변이 연구에 기여하고자 한다.
키워드(Keyword)
(한글 250자 이내)
인민일보, 접속사, 통시적 변화, 코퍼스 언어학, 레지스터 변이, 공기어 분석
키워드
(영어 500자 이내)
People’s Daily, Chinese conjunctions, diachronic change, corpus linguistics, register variation, collocation analysis

댓글 남기기