바른 형태소 분석기 유튜브 채널
한국어 형태소 분석기인 바른(bareun)의 유튜브 채널 오픈. 개발자에게 직접 듣는 ‘바른’ 형태소 분석기의 구조와 이해 콘텐츠. https://www.youtube.com/@bareun-ai
한국어 형태소 분석기인 바른(bareun)의 유튜브 채널 오픈. 개발자에게 직접 듣는 ‘바른’ 형태소 분석기의 구조와 이해 콘텐츠. https://www.youtube.com/@bareun-ai
Academia Sinica (대만 중앙연구원)의 CIKP LAB(CHINESE KNOWLEDGE AND INFORMATION PROCESSING)에서 제공하는 고전한문 형태소 분석/개체명인식 등 NLP 관련 툴/소스와 서비스. 아래 웹사이트에서 텍스트 입력시 트랜스포머 토크나이징과 개체명 인식 등이 가능. https://ckip.iis.sinica.edu.tw/service/transformers/ 깃허브 링크에서 예시 코드 확인 가능. https://github.com/ckiplab/ckip-transformers
한국학중앙연구원 인문정보학과 김바로 교수님과 해당 연구실 대학원생들의 공개한 <디지털인문학 시리즈>입니다. 위키독스에서 누구나 볼 수 있도록 공개했으며, 계속 수정 보완하실 예정이라고합니다. 디지털인문학 관련 각종 수업, 스터디 등에 활용하면 좋은 교재라고 생각합니다.
GPT 3.5 버전을 활용한 텍스트에서 지식 그래프 자동 추출하는 서비스. 한국어도 활용 가능. 🦜🔗 Text-to-graph extraction · Streamlit (auto-graph.streamlit.app) This playground explores the use of OpenAI functions and LangChain to build knowledge graphs from user-input text. It breaks down the user input text into knowledge graph triples of subject (primary entities or concepts in a sentence), predicate (actions or … 더 읽기
https://mimotext.github.io/MiMoTextBase_Tutorial/ 프랑스 계몽주의 소설에 대한 wikbase를 기반으로 SPARQL로 질의를 하고, 그 결과를 다양한 방식(지도, 그래프 등)으로 시각화 할 수 있는 방법을 제시하는 서비스.
NARA.Labs 나라지식정보부설연구소 (naraai.net)에서 개발 승정원 일기 기반 한문 개체명 인식(NER) 모델 허깅페이스 링크: Nara-Lab/History_NER · Hugging Face 관련 논문 : [2306.14592] Transfer Learning across Several Centuries: Machine and Historian Integrated Method to Decipher Royal Secretary’s Diary (arxiv.org)
종교사 데이터베이스(DRH)관련 펀딩 “The Database of Religious History is running a sub-granting competition for scholars or small teams who would like to perform analyses of DRH data. Please pass it on!” 출처 : UBC의 Edward Slingerland 교수 트위터 링크
여러 언어의 시(詩) 말뭉치로 학습한 BERT 모델. 영어를 포함한 유럽어와 아랍어, 중국어 시 포함. “ALBERTI is a set of two BERT-based multilingual model for poetry. One for verses and another one for stanzas. This model has been further trained with the PULPO corpus for verses using Flax, including training scripts.” linhd-postdata/alberti-bert-base-multilingual-cased · Hugging Face [2307.01387] … 더 읽기
디지털인문학의 역사를 Milestone 기준으로 정리한 사이트 Historical milestones of DH | Digital Humanities | MUNI PHIL
https://theme.npm.edu.tw/opendata/ 타이완 고궁 박물관의 Open Data 서비스이다. 타이완 고궁 박물관은 중화민국이 타이완으로 도망치면서, 당시에 가장 귀중한 중국 유물을 거의 다 가져왔기에, 중국 유물의 정수가 있다는 곳이다. 그런 곳에서 Open Data를 수행하고 있다. Open 데이터이기에, 신청도, 용도 제한도, 비용지불조차 없다. 더 구체적으로 100만개의 CC0(완전 공개)와 600만개의 CCBY(저작권표기) 데이터가 공개되어 있다. 심지어는 2020년에 일본 유명 게임인 동물의 … 더 읽기