강조은 / 사용자의 한국어 유머 선호 기반 LLM 정렬 연구 / 2026 박사과정생연구장려금지원사업

연구목표
(한글 2000자 이내)
본 연구는 코스가드(Christine M. Korsgaard)의 자기 구성(self-constitution) 이론을 이론적 토대로 삼아, 인공지능의 기능적 산출이 인간 행위자의 반성적 승인 과정을 통해 규범적 행위로 전환되는 ‘행위 전유(appropriation of action) 구조’를 분석하고, 이를 통해 인공지능 시대의 책임 귀속 문제를 해명하는 철학적 모델을 정식화하는 것을 목표로 한다.
구체적으로 본 연구는 다음 세 가지 과제를 수행한다. (1)대체 제재를 위한 교정 범죄자 관리 프로파일링(Correctional Offender Management Profiling for Alternative Sanctions,이하 COMPAS) 사례 등에서 나타나는 형식적 결정권자와 실질적 결정 구조의 분리를 분석하여, 이러한 구조가 어떻게 ‘책임 공백(responsibility gap)’을 발생시키는지를 해명한다. (2)인공지능 행위자성에 대한 기존 논의에서 제시된 존재론적 접근과 기능주의적 접근을 비판적으로 검토하고, 이들 접근이 책임 귀속 문제를 충분히 설명하지 못하는 이론적 한계를 분석한다. (3) 칸트의 행위자성 개념을 바탕으로 코스가드의 자기 구성 이론을 재구성하여 ‘행위 전유 모델(Action Appropriation Model)’을 정식화하고, 이를 통해 인공지능이 매개된 행위 상황에서 책임이 어떻게 인간 행위자에게 귀속되는지를 철학적으로 정당화한다.
기대효과
(한글 2000자 이내)
본 연구는 다음과 같은 이론적·실천적 기여를 제공할 것으로 기대된다.
(1)이론적 차원: 본 연구는 인공지능 윤리 논쟁에서 지배적이었던 행위자성 인정 여부 중심의 논의를 규범적 행위자성의 구조 해명이라는 문제로 전환함으로써, 도덕철학과 기술 철학의 접면에서 새로운 분석 틀을 제시한다. 기능적 행위자성과 규범적 행위자성의 개념적 구분, 그리고 이 구분에 근거한 행위 전유 모델은 칸트 실천철학이 인공지능 윤리 문제에 독자적으로 기여할 수 있음을 보여주는 동시에, 기존 기능주의적 접근과 존재론적 접근이 공통적으로 남겨 온 이론적 공백을 메운다. 나아가 본 연구는 기술 윤리를 응용 윤리의 하위 영역으로 다루어 온 관행에서 벗어나, 이를 도덕철학의 핵심 문제로 재위치시키는 데 기여한다.
(2)실천적 차원: 본 연구가 제시하는 행위 전유 모델은 인공지능이 매개 된 의사결정에 관여하는 인간 행위자의 책임 귀속에 관해 철학적으로 정당화된 기준을 제공한다. 이는 미국의 알고리듬 책무성 법안이나 한국의 인공지능 기본법과 같은 제도적 논의가 이론적 근거를 결여한 채 진행되고 있는 현 상황에서, 법제화 및 윤리 정책 수립에 있어 규범적 기초로 기능할 수 있다. 특히 형사 양형, 의료 진단, 채용 심사 등 고위험 의사결정 영역에서 인간 행위자의 반성적 승인 의무를 이론적으로 정초함으로써, 책임 공백을 구조적으로 방지하기 위한 제도 설계의 철학적 근거를 제시한다.
연구요약
(한글 2000자 이내)
오늘날 인공지능은 형사 양형, 의료 진단, 채용 심사, 금융 신용 평가 등 인간의 삶에 직접적인 영향을 미치는 고위험 의사결정 과정에 광범위하게 도입되고 있다. 이 상황에서 제기되는 핵심 문제는 알고리듬 편향과 같은 기술적 문제에 그치지 않는다. 보다 근본적인 문제는 인간 행위자가 형식적으로는 최종 결정권자의 지위를 유지하면서도 실질적 판단의 상당 부분을 시스템의 산출 값에 의존하게 되는 구조, 즉 형식적 결정권자와 실질적 결정권자가 분리되는 구조에 있다. COMPAS 사례는 이를 전형적으로 보여준다. 이 알고리듬 기반 양형 보조 시스템에서 판사는 형식적으로 최종 결정을 내리지만, 실제 판단 과정에서는 알고리듬이 산출한 재범 위험 점수에 강하게 의존하게 된다. 그 결과 형식적 권한과 실질적 결정 구조 사이의 괴리가 발생하며, 이는 곧 책임 귀속의 공백으로 이어진다. 기존 인공지능 윤리 연구는 이 문제를 주로 인공지능의 도덕적 행위자성 인정 여부를 중심으로 논의해 왔다. 존재론적 접근은 자유의지나 자기의식과 같은 속성의 결여를 이유로 인공지능을 도덕적 행위자의 범주에서 배제하고, 기능주의적 접근은 행위자성을 기능적 능력의 집합으로 재정의함으로써 인공지능에 제한적 책임 귀속 가능성을 인정하고자 한다. 그러나 두 접근 모두 책임 귀속에 요구되는 규범적 근거를 충분히 해명하지 못한다는 공통된 한계를 지닌다. 이에 본 연구는 행위자성을 기능적 행위자성과 규범적 행위자성으로 구분하여 분석한다. 기능적 행위자성은 Floridi & Sanders 및 Dennett의 지향적 태도 이론에서 발전한 기술적(descriptive) 범주로서, 자율적으로 결과를 산출하는 시스템에 행위자성을 귀속하는 개념이다. 그러나 기능적 행위자성은 그 자체로 규범적 성격을 갖지 않는다. 따라서 본 연구는 규범적 행위자성은 칸트 윤리학의 내적 논리에서 도출하고자 한다. 칸트의 규범성은 준칙의 반성적 채택과 자기입법으로서의 자율성은 행위의 규범적 귀속을 가능케 하는 조건이며, 이 조건의 충족 여부가 책임 귀속의 핵심 기준을 제시하기에 가장 최선의 이론이기 때문이다. 코스가드는 이러한 칸트적 통찰을 계승하여, 행위자가 자신의 준칙을 반성적으로 승인함으로써 통일된 실천적 정체성을 구성할 때 비로소 행위의 저자(author)가 된다고 논증한다. 이 이론을 인공지능 매개 행위에 적용하면, 책임 귀속의 문제는 인공지능의 능력 보유 여부가 아니라 인간 행위자가 인공지능의 산출을 자신의 준칙에 따라 반성적으로 검토하고 그것을 자신의 행위로 전유하는가의 문제로 재구성된다. COMPAS 사례에서 핵심은 알고리듬의 편향 여부가 아니라, 판사가 알고리듬의 산출 값을 반성적 검토 없이 수용함으로써 자신의 규범적 행위자성을 사실상 포기하고 있는가에 있다. 본 연구가 제안하는 행위 전유 모델은 기능적 행위자성과 규범적 행위자성을 동일한 분석 틀 속에서 논의함으로써, 책임 공백이 발생하는 지점을 개념적으로 명확히 드러낸다. 책임 공백은 인공지능의 기능적 산출이 인간 행위자의 반성적 승인 과정을 거치지 않은 채 의사결정을 구조화하는 지점, 즉 기능적 행위자성이 규범적 행위자성으로 전환되지 않는 바로 그 지점에서 발생한다. 이러한 분석은 기술 윤리를 단순한 응용 윤리의 문제가 아니라 도덕철학의 핵심 문제로 재위치 시키며, 인공지능 관련 법제화 및 거버넌스 논의에 철학적으로 정당화된 책임 귀속 기준을 제공한다.
키워드(Keyword)
(한글 250자 이내)
인공지능 윤리, 행위자성, 도덕적 책임, 구성주의 윤리학, 코스가드, 반성적 승인, 행위 전유, 책임 공백
키워드
(영어 500자 이내)
AI Ethics, Agency, Moral Responsibility, Constructivist Ethics, Korsgaard, Reflective Endorsement, Appropriation of Action, Responsibility Gap

댓글 남기기 응답 취소