[디지털인문학 시리즈] 고급 자연어 처리 활용

한국학중앙연구원 디지털인문학 연구소의 ebook <디지털인문학 시리즈> – 고급 자연어 처리 활용

https://wikidocs.net/book/17854

저자 : 김병준, 지해인, 임이로, 조경민, 구슬

총 5개 장으로 구성되어 있으며, 각 장의 핵심 내용은 다음과 같습니다:

2장. 인문학과 레이블 데이터
레이블 데이터의 개념부터 시작하여, 디지털 인문학에서의 특수성을 이해합니다. 기존 선행연구 사례들을 통해 레이블 데이터가 어떻게 인문학 연구의 새로운 지평을 열어왔는지 살펴봅니다.

3장. KPoEM: 근대 시 감정 레이블 데이터셋 구축 과정
한국 근현대 시인들의 작품을 대상으로 한 감정 데이터셋 구축 과정을 단계별로 실습합니다. 대상 데이터 선정부터 Zenodo를 통한 학술적 공개까지 전체 워크플로우를 경험하게 됩니다.

4장. 파인튜닝을 통한 KPoEM 모델 구현
구축한 데이터셋을 활용하여 실제 언어모델을 파인튜닝하는 과정을 실습합니다. 모델 성능 평가 방법론까지 다뤄 완성도 높은 연구 도구를 개발할 수 있습니다.

5장. LLM 파인튜닝
Hugging Face 플랫폼 활용법부터 다양한 파인튜닝 기법들을 학습합니다. LoRA 같은 효율적인 방법론과 생성형 모델 파인튜닝까지 폭넓게 다룹니다.

6장. 파인튜닝/RAG 없이 쉽게 활용하는 GPTs
복잡한 기술적 구현 없이도 OpenAI GPTs를 활용하여 맞춤형 연구 도구를 만드는 방법을 학습합니다. 접근성과 실용성을 중시하는 연구자들을 위한 대안적 접근법입니다.

이 책은 2025년 한국학중앙연구원 연구교육연계과제의 지원을 받아 제작되었습니다. (AKSR2025-RE04 고급 자연어 처리 및 대규모 언어 모델 기반 디지털 한국학 연구 및 교육 방법론 개발)

유튜브 재생목록 (2025년 9월 순차 공개 예정)

댓글 남기기