BioCRM: 인물 생애 정보 기술을 위한 데이터 모델

Bio CRM: A Data Model for Representing Biographical Information for Prosopography 

http://ldf.fi/schema/bioc/

이 문서는 개인의 생애 정보를 체계적으로 기술하기 위한 데이터 모델인 BioCRM에 대해 설명하고 있습니다. BioCRM은 특히 프로소포그래피(prosopography, 인물군 연구) 분야에서 활용될 수 있도록 설계되었습니다.

BioCRM의 주요 목표 및 활용 사례:

  • 목표: 다양한 출처의 전기 정보를 조화시키고 상호 연결할 수 있는 의미론적 데이터 모델을 제공하는 것입니다. 이를 통해 인물, 개인 관계, 직업, 다양한 역할을 가진 참여자가 있는 사건 등 기본적인 인물 데이터를 표현할 수 있습니다.
  • 활용 사례:
    • 정보 검색: 특정 특징을 공유하는 인물 집단을 찾아낼 수 있습니다. 예를 들어, 1800년에서 1850년 사이에 영국에서 태어나 특정 직업을 가졌던 남성들을 찾는 경우입니다. 이러한 집단은 추가 분석이나 다른 집단과의 비교 대상이 될 수 있습니다.
    • 네트워크 분석: 특정 기준에 따라 인물 네트워크를 찾아내고, 이를 네트워크 분석 도구나 시각화를 통해 분석할 수 있습니다.
    • 지식 발견: 데이터 내에서 이전에 알려지지 않았던 특정 관심 특징을 공유하는 숨겨진 인물 집단을 자동으로 식별할 수 있습니다.
    • 동적 분석: 그룹의 구조와 변화하는 구성, 그리고 개인이나 하위 그룹의 변화하는 역할을 분석할 수 있습니다.

설계 원칙:

  • BioCRM은 생애 이야기를 사건 기반 접근 방식으로 모델링합니다. 즉, 개인의 삶은 출생부터 사망까지 시공간적으로 연결된 사건들의 연속으로 간주됩니다. 출생 전이나 사후 사건도 포함될 수 있습니다.
  • 혼동을 피하기 위해 BioCRM은 개인의 속성, 인물 간의 관계, 그리고 인물이 다양한 역할로 참여하는 사건을 명확하게 구분합니다.
    • 속성: 시간과 공간에 독립적으로 개인을 특징짓는다고 가정하는 속성 (예: 직업)
    • 관계: 인물들 사이에 설정되며 시간과 공간에 독립적으로 인물들을 특징짓는다고 가정하는 관계 (예: 아버지-자식 관계)
    • 역할: 인물이 사건에 참여하는 방식을 표현 (예: 세례 후보자)
    • 사건: 시간과 공간에서 발생하며 다양한 역할의 참여자를 포함
  • 이 모델은 CIDOC CRM의 도메인 특정 확장으로, 전기 데이터뿐만 아니라 다른 문화유산(CH) 데이터에도 적용 가능합니다.
  • 지속적인 단일 역할(unary roles), 지속적인 이진 관계(binary relationships), 그리고 참여자들이 역할 개념 계층으로 모델링된 다양한 역할을 맡을 수 있는 지속 사건(perduring events)을 구분합니다.

핵심 클래스:

BioCRM 모델의 핵심 클래스는 다음과 같은 계층 구조를 가집니다: Entity, Actor (Person, Group), Actor_Appellation, Document, Entity_Role (Actor_Role, Thing_Role), Event, Place, Thing, Time-Span. 이들 간의 관계는 다이어그램으로 표현되어 있습니다.

주요 정보 표현 방식:

  • 인물 (Person): bioc:Person (CIDOC CRM의 E21_Person 하위 클래스)의 인스턴스로 표현됩니다. 핵심 데이터로는 호칭(이름, 식별자), 출생 및 사망 시점과 장소, 그리고 단일 역할(성별, 국적, 직업), 관계(가족, 사회, 그룹), 참여 사건 등이 있습니다.
  • 호칭 (Appellations): 한 인물은 여러 호칭을 가질 수 있으며 (예: 필명, 별명), 이는 bioc:Actor_Appellation의 하위 클래스로 표현됩니다. rdfs:label 속성으로 이름의 문자열 형식을 제공하고, 언어 태그를 사용해 다른 언어로의 음차를 나타낼 수 있습니다. 결혼 등으로 인해 이름이 유효한 시기가 다를 수 있으며, 이는 cidoc:P4_has_time-span을 사용해 표현합니다.
  • 출생 및 사망 (Birth and Death): 출생 및 사망 사건(cidoc:E67_Birth, cidoc:E69_Death)으로 표현되며, 시간과 장소 정보를 포함할 수 있습니다. 출생 사건에는 부모 정보도 포함될 수 있습니다.
  • 단일 역할 (Unary Roles): 성별, 국적, 직업 등은 bioc:bearer_of 속성을 사용하여 인물과 단일 역할을 연결하여 표현합니다. 이러한 역할은 시간과 공간적 맥락을 갖는 사건(예: 고용)을 통해 구체화될 수 있습니다. 예를 들어, 존 F. 케네디는 1961-1963년에 미국에서 대통령 역할을 수행했습니다.
    • 성별: bioc:has_gender 속성 사용 (예: 남성, 여성)
    • 국적: bioc:has_nationality 속성 사용 (예: 영국인, 핀란드인)
    • 직업: bioc:has_profession 속성 사용 (예: 철학자, 상인)
  • 관계 (Relationships): 가족 관계(어머니, 사촌 등)나 사회적 관계(스승-제자, 아는 사이 등)와 같은 인물 간의 고유한 관계도 역할 기반 패턴을 사용합니다. 행위자(개인 또는 그룹)를 bioc:has_relation의 하위 속성 중 하나를 사용하여 다른 행위자의 역할에 연결함으로써 관계를 표현합니다. 단일 역할과 마찬가지로 관계도 사건을 사용하여 시간 및 공간 정보로 구체화될 수 있습니다. 예를 들어, 존 F. 케네디는 1953-1963년에 재클린 케네디의 배우자였습니다.
  • 사건 (Events): 생애의 개별 사건들은 bioc:Event (CIDOC CRM의 E5_Event 하위 클래스)의 하위 클래스로 표현됩니다. 사건은 시간(cidoc:P4_has_time-span), 장소(cidoc:P7_took_place_at), 참여한 행위자(cidoc:P11_had_participant), 관련된 다른 자원(cidoc:P12_occurred_in_the_presence_of) 등의 관점에서 기술됩니다. 참여 행위자 및 기타 자원의 값은 역할 클래스의 인스턴스입니다. 이를 통해 한 사람이 여러 사건에 서로 다른 역할로 참여할 수 있으며, 각 역할은 추가 속성으로 구체화될 수 있습니다. 예를 들어, 특정 강의 사건은 강사 역할의 인물, 학생 역할의 인물, 시간, 장소 정보 등을 포함할 수 있습니다. 사건은 단일 역할(예: 직업)이나 가족 관계를 더욱 구체화하는 데에도 사용될 수 있습니다.

계층 구조:

  • 사건 계층 (Event Hierarchy): 사건을 나타내는 클래스들은 계층 구조로 구성됩니다 (예: bioc:Event 아래에 :Ecclesiastical_Event, :Educational_Event 등). 예를 들어, :Ecclesiastical_Event:Baptism(세례), :Confirmation(견진) 등으로 세분화될 수 있으며, 각 사건 유형에는 관련된 역할들이 정의됩니다 (예: 세례의 경우 주례자, 세례 후보자, 대부, 대모 등).
  • 역할 계층 (Role Hierarchy): 사건에 참여하는 행위자의 역할을 나타내는 클래스들도 계층 구조를 가집니다 (예: bioc:Entity_Role 아래에 bioc:Actor_Role (다시 bioc:Unary_Role, bioc:Binary_Relationship_Role, bioc:Event_Role로 나뉨), bioc:Thing_Role). 각 사건 클래스에는 해당 사건에 참여할 수 있는 역할들을 제한하기 위해 OWL의 owl:allValuesFrom 제한을 사용하여 허용된 역할 클래스를 지정하는 것이 권장됩니다. 예를 들어, :Baptism 사건에는 :Baptism_Actor_Role이라는 클래스에 속하는 역할들만 참여할 수 있도록 정의할 수 있습니다. 이러한 역할 계층은 사건 간 역할 공유를 용이하게 하고 역할 구조 변경을 쉽게 만듭니다.

이 모델은 데이터 주석 작성자가 올바른 역할만 사용하도록 안내하고, 질의 시 역할에 있는 자원을 찾는 데 새로운 역할 클래스를 사용할 수 있게 합니다. bioc:inheres_in 속성은 시간과 무관한 역할(단일 역할 및 한정자 없는 이진 관계)과 시간적 역할(사건을 사용하여 한정됨) 모두를 표현하는 데 사용되며, 이는 모델의 단순성을 위한 의도적인 결정입니다.

Leave a Comment