[Dataset/Model] KPoEM

KPoEM: 한국 현대시 감정 분류 데이터셋과 모델 한국 현대시의 섬세한 감정을 AI가 이해할 수 있을까요? 한국학중앙연구원 디지털인문학연구소에서 개발한 KPoEM(Korean Poetry Emotion Mapping) 데이터셋이 이 질문에 답을 제시합니다. KPoEM은 김소월, 윤동주, 이상, 임화, 한용운 등 한국의 대표 시인 5인의 시작품 483편을 44개의 감정 범주로 세밀하게 분석한 최초의 한국시 감정 데이터셋입니다. 연구 책임자: 김병준 교수 (한국학중앙연구원 한국학대학원 … 더 읽기

Aeneas(아이네이아스): 고대 로마 문자 복원 AI 모델

https://deepmind.google/discover/blog/aeneas-transforms-how-historians-connect-the-past Google DeepMind의 고대 로마 문자 복원 AI 모델인 Aeneas(아이네이아스)입니다. Aeneas는 고대 비문을 해석하고, 속성을 부여하며, 파편화된 텍스트를 복원하는 데 특화된 최초의 AI 모델입니다. 이 모델은 로마 시대 비문의 복잡하고 시간이 많이 소요되는 작업을 가속화하여, 수천 개의 라틴어 비문에서 텍스트 및 문맥적 유사성을 몇 초 만에 검색할 수 있도록 설계되었습니다. 텍스트와 이미지 정보를 모두 분석하여 … 더 읽기

SKT 에이닷 엑스(A.X) 4.0

https://huggingface.co/skt https://huggingface.co/skt/A.X-4.0 https://huggingface.co/skt/A.X-4.0-Light https://github.com/SKT-AI/A.X-4.0 바로: Qwen2.5 기반 72B 표준모델 / 7B 미니모델 웹 데이터, 전문 서적, 합성 데이터 등 한국어 42%, 영어 51%, 기타 언어 코드 7%

네이버 HyperCLOVA X SEED

HyperCLOVA X SEED는 한국어 성능에 중점을 둔 NAVER의 가벼운 오픈소스 라인업입니다. https://huggingface.co/naver-hyperclovax https://huggingface.co/naver-hyperclovax/HyperCLOVAX-SEED-Text-Instruct-1.5B https://huggingface.co/naver-hyperclovax/HyperCLOVAX-SEED-Text-Instruct-0.5B https://huggingface.co/naver-hyperclovax/HyperCLOVAX-SEED-Vision-Instruct-3B 공식 소개 https://clova.ai/tech-blog/ai-%EC%83%9D%ED%83%9C%EA%B3%84%EC%97%90-%EC%94%A8%EC%95%97%EC%9D%84-%EB%BF%8C%EB%A6%AC%EB%8B%A4-%EC%83%81%EC%97%85%EC%9A%A9-%EC%98%A4%ED%94%88%EC%86%8C%EC%8A%A4-ai-hyperclova-x-seed 바로: 말 그대로 가벼운 모델

KT 믿:음 Mi:dm 2.0

https://huggingface.co/K-intelligence 이 공간은 KT의 대규모 언어 모델인 Mi:dm을 소개합니다. Mi:dm 언어 모델군에 대한 포괄적인 정보, 해당 모델 적용을 위해 설계된 도구, 그리고 기술 문서를 제공합니다. KT의 한국 중심 AI 모델 – Mi:dm 2.0 https://huggingface.co/K-intelligence/Midm-2.0-Base-Instruct https://huggingface.co/K-intelligence/Midm-2.0-Mini-Instruct KT 공식 믿음 2.0 소개 페이지 https://enterprise.kt.com/pd/P_PD_NE_00_316.do 바로: 데이터 소스는 한국의 교육용 도서, 문학 작품 등의 출판물과 법류 및 특허 … 더 읽기

BioCRM: 인물 생애 정보 기술을 위한 데이터 모델

Bio CRM: A Data Model for Representing Biographical Information for Prosopography  http://ldf.fi/schema/bioc/ 이 문서는 개인의 생애 정보를 체계적으로 기술하기 위한 데이터 모델인 BioCRM에 대해 설명하고 있습니다. BioCRM은 특히 프로소포그래피(prosopography, 인물군 연구) 분야에서 활용될 수 있도록 설계되었습니다. BioCRM의 주요 목표 및 활용 사례: 설계 원칙: 핵심 클래스: BioCRM 모델의 핵심 클래스는 다음과 같은 계층 구조를 가집니다: Entity, Actor (Person, Group), Actor_Appellation, Document, Entity_Role (Actor_Role, Thing_Role), Event, … 더 읽기

일본 고문 AI_KARAMARU(からまる)/Soan(そあん)

일본 Center for Open Data in the Humanities와 Sakana AI가 합작한 AI 모델 AI 모델 “카라마루(からまる)” 한국어 요약 (Gemini 2.5 Pro 활용) url: https://sakana.ai/karamaru/  Sakana AI가 개발한 **카라마루(からまる)**는 에도 시대(江戸時代)의 고문(古文) 스타일로 대화할 수 있는 챗봇입니다. 주요 특징: 기대 효과: 카라마루는 현대인이 과거의 문화를 더 가깝게 느끼고 이해할 수 있도록 돕는 도구로서, 연구와 교육 분야에 … 더 읽기

Ollama: 로컬에서 무료로 LLM 모델 사용하기

Ollama는 대규모 언어 모델(LLM)을 로컬에서 실행할 수 있도록 돕는 도구이며, 이 라이브러리는 Ollama와 함께 사용할 수 있는 다양한 모델들을 모아 놓은 저장소라고 할 수 있습니다. 쉽게 말해, Ollama는 거대한 뇌를 내 컴퓨터에서 직접 사용할 수 있게 해주는 도구이고, Ollama.com/library 는 그 뇌를 업그레이드하거나, 다른 종류의 뇌로 바꿔 끼울 수 있도록 다양한 뇌 모델들을 제공하는 곳이라고 … 더 읽기

ModernBERT

https://huggingface.co/blog/modernbert https://huggingface.co/answerdotai https://github.com/AnswerDotAI https://www.answer.ai ModernBERT: BERT를 넘어, 효율성과 성능을 모두 잡다! (블로그 소개글) 안녕하세요, 여러분! 딥러닝, 특히 자연어 처리(NLP) 분야에 관심 있는 분들이라면 “BERT”라는 이름을 한 번쯤은 들어보셨을 겁니다. 2018년에 등장한 BERT는 트랜스포머(Transformer) 기반 모델로, 뛰어난 성능을 보여주며 NLP 분야에 혁명을 가져왔죠. 하지만, BERT는 거대한 모델 크기와 높은 컴퓨팅 자원으로 인해 실무 적용에 어려움을 겪기도 … 더 읽기