Bio CRM: A Data Model for Representing Biographical Information for Prosopography
이 문서는 개인의 생애 정보를 체계적으로 기술하기 위한 데이터 모델인 BioCRM에 대해 설명하고 있습니다. BioCRM은 특히 프로소포그래피(prosopography, 인물군 연구) 분야에서 활용될 수 있도록 설계되었습니다.
BioCRM의 주요 목표 및 활용 사례:
- 목표: 다양한 출처의 전기 정보를 조화시키고 상호 연결할 수 있는 의미론적 데이터 모델을 제공하는 것입니다. 이를 통해 인물, 개인 관계, 직업, 다양한 역할을 가진 참여자가 있는 사건 등 기본적인 인물 데이터를 표현할 수 있습니다.
- 활용 사례:
- 정보 검색: 특정 특징을 공유하는 인물 집단을 찾아낼 수 있습니다. 예를 들어, 1800년에서 1850년 사이에 영국에서 태어나 특정 직업을 가졌던 남성들을 찾는 경우입니다. 이러한 집단은 추가 분석이나 다른 집단과의 비교 대상이 될 수 있습니다.
- 네트워크 분석: 특정 기준에 따라 인물 네트워크를 찾아내고, 이를 네트워크 분석 도구나 시각화를 통해 분석할 수 있습니다.
- 지식 발견: 데이터 내에서 이전에 알려지지 않았던 특정 관심 특징을 공유하는 숨겨진 인물 집단을 자동으로 식별할 수 있습니다.
- 동적 분석: 그룹의 구조와 변화하는 구성, 그리고 개인이나 하위 그룹의 변화하는 역할을 분석할 수 있습니다.
설계 원칙:
- BioCRM은 생애 이야기를 사건 기반 접근 방식으로 모델링합니다. 즉, 개인의 삶은 출생부터 사망까지 시공간적으로 연결된 사건들의 연속으로 간주됩니다. 출생 전이나 사후 사건도 포함될 수 있습니다.
- 혼동을 피하기 위해 BioCRM은 개인의 속성, 인물 간의 관계, 그리고 인물이 다양한 역할로 참여하는 사건을 명확하게 구분합니다.
- 속성: 시간과 공간에 독립적으로 개인을 특징짓는다고 가정하는 속성 (예: 직업)
- 관계: 인물들 사이에 설정되며 시간과 공간에 독립적으로 인물들을 특징짓는다고 가정하는 관계 (예: 아버지-자식 관계)
- 역할: 인물이 사건에 참여하는 방식을 표현 (예: 세례 후보자)
- 사건: 시간과 공간에서 발생하며 다양한 역할의 참여자를 포함
- 이 모델은 CIDOC CRM의 도메인 특정 확장으로, 전기 데이터뿐만 아니라 다른 문화유산(CH) 데이터에도 적용 가능합니다.
- 지속적인 단일 역할(unary roles), 지속적인 이진 관계(binary relationships), 그리고 참여자들이 역할 개념 계층으로 모델링된 다양한 역할을 맡을 수 있는 지속 사건(perduring events)을 구분합니다.
핵심 클래스:
BioCRM 모델의 핵심 클래스는 다음과 같은 계층 구조를 가집니다: Entity, Actor (Person, Group), Actor_Appellation, Document, Entity_Role (Actor_Role, Thing_Role), Event, Place, Thing, Time-Span. 이들 간의 관계는 다이어그램으로 표현되어 있습니다.
주요 정보 표현 방식:
- 인물 (Person):
bioc:Person
(CIDOC CRM의E21_Person
하위 클래스)의 인스턴스로 표현됩니다. 핵심 데이터로는 호칭(이름, 식별자), 출생 및 사망 시점과 장소, 그리고 단일 역할(성별, 국적, 직업), 관계(가족, 사회, 그룹), 참여 사건 등이 있습니다. - 호칭 (Appellations): 한 인물은 여러 호칭을 가질 수 있으며 (예: 필명, 별명), 이는
bioc:Actor_Appellation
의 하위 클래스로 표현됩니다.rdfs:label
속성으로 이름의 문자열 형식을 제공하고, 언어 태그를 사용해 다른 언어로의 음차를 나타낼 수 있습니다. 결혼 등으로 인해 이름이 유효한 시기가 다를 수 있으며, 이는cidoc:P4_has_time-span
을 사용해 표현합니다. - 출생 및 사망 (Birth and Death): 출생 및 사망 사건(
cidoc:E67_Birth
,cidoc:E69_Death
)으로 표현되며, 시간과 장소 정보를 포함할 수 있습니다. 출생 사건에는 부모 정보도 포함될 수 있습니다. - 단일 역할 (Unary Roles): 성별, 국적, 직업 등은
bioc:bearer_of
속성을 사용하여 인물과 단일 역할을 연결하여 표현합니다. 이러한 역할은 시간과 공간적 맥락을 갖는 사건(예: 고용)을 통해 구체화될 수 있습니다. 예를 들어, 존 F. 케네디는 1961-1963년에 미국에서 대통령 역할을 수행했습니다.- 성별:
bioc:has_gender
속성 사용 (예: 남성, 여성) - 국적:
bioc:has_nationality
속성 사용 (예: 영국인, 핀란드인) - 직업:
bioc:has_profession
속성 사용 (예: 철학자, 상인)
- 성별:
- 관계 (Relationships): 가족 관계(어머니, 사촌 등)나 사회적 관계(스승-제자, 아는 사이 등)와 같은 인물 간의 고유한 관계도 역할 기반 패턴을 사용합니다. 행위자(개인 또는 그룹)를
bioc:has_relation
의 하위 속성 중 하나를 사용하여 다른 행위자의 역할에 연결함으로써 관계를 표현합니다. 단일 역할과 마찬가지로 관계도 사건을 사용하여 시간 및 공간 정보로 구체화될 수 있습니다. 예를 들어, 존 F. 케네디는 1953-1963년에 재클린 케네디의 배우자였습니다. - 사건 (Events): 생애의 개별 사건들은
bioc:Event
(CIDOC CRM의E5_Event
하위 클래스)의 하위 클래스로 표현됩니다. 사건은 시간(cidoc:P4_has_time-span
), 장소(cidoc:P7_took_place_at
), 참여한 행위자(cidoc:P11_had_participant
), 관련된 다른 자원(cidoc:P12_occurred_in_the_presence_of
) 등의 관점에서 기술됩니다. 참여 행위자 및 기타 자원의 값은 역할 클래스의 인스턴스입니다. 이를 통해 한 사람이 여러 사건에 서로 다른 역할로 참여할 수 있으며, 각 역할은 추가 속성으로 구체화될 수 있습니다. 예를 들어, 특정 강의 사건은 강사 역할의 인물, 학생 역할의 인물, 시간, 장소 정보 등을 포함할 수 있습니다. 사건은 단일 역할(예: 직업)이나 가족 관계를 더욱 구체화하는 데에도 사용될 수 있습니다.
계층 구조:
- 사건 계층 (Event Hierarchy): 사건을 나타내는 클래스들은 계층 구조로 구성됩니다 (예:
bioc:Event
아래에:Ecclesiastical_Event
,:Educational_Event
등). 예를 들어,:Ecclesiastical_Event
는:Baptism
(세례),:Confirmation
(견진) 등으로 세분화될 수 있으며, 각 사건 유형에는 관련된 역할들이 정의됩니다 (예: 세례의 경우 주례자, 세례 후보자, 대부, 대모 등). - 역할 계층 (Role Hierarchy): 사건에 참여하는 행위자의 역할을 나타내는 클래스들도 계층 구조를 가집니다 (예:
bioc:Entity_Role
아래에bioc:Actor_Role
(다시bioc:Unary_Role
,bioc:Binary_Relationship_Role
,bioc:Event_Role
로 나뉨),bioc:Thing_Role
). 각 사건 클래스에는 해당 사건에 참여할 수 있는 역할들을 제한하기 위해 OWL의owl:allValuesFrom
제한을 사용하여 허용된 역할 클래스를 지정하는 것이 권장됩니다. 예를 들어,:Baptism
사건에는:Baptism_Actor_Role
이라는 클래스에 속하는 역할들만 참여할 수 있도록 정의할 수 있습니다. 이러한 역할 계층은 사건 간 역할 공유를 용이하게 하고 역할 구조 변경을 쉽게 만듭니다.
이 모델은 데이터 주석 작성자가 올바른 역할만 사용하도록 안내하고, 질의 시 역할에 있는 자원을 찾는 데 새로운 역할 클래스를 사용할 수 있게 합니다. bioc:inheres_in
속성은 시간과 무관한 역할(단일 역할 및 한정자 없는 이진 관계)과 시간적 역할(사건을 사용하여 한정됨) 모두를 표현하는 데 사용되며, 이는 모델의 단순성을 위한 의도적인 결정입니다.