[Tool] Text-to-graph playground

GPT 3.5 버전을 활용한 텍스트에서 지식 그래프 자동 추출하는 서비스. 한국어도 활용 가능. 🦜🔗 Text-to-graph extraction · Streamlit (auto-graph.streamlit.app) This playground explores the use of OpenAI functions and LangChain to build knowledge graphs from user-input text. It breaks down the user input text into knowledge graph triples of subject (primary entities or concepts in a sentence), predicate (actions or … Read more

승정원 일기 NER 모델 (Nara-Lab/History_NER)

NARA.Labs 나라지식정보부설연구소 (naraai.net)에서 개발 승정원 일기 기반 한문 개체명 인식(NER) 모델 허깅페이스 링크: Nara-Lab/History_NER · Hugging Face 관련 논문 : [2306.14592] Transfer Learning across Several Centuries: Machine and Historian Integrated Method to Decipher Royal Secretary’s Diary (arxiv.org)

The Database of Religious History

종교사 데이터베이스(DRH)관련 펀딩 “The Database of Religious History is running a sub-granting competition for scholars or small teams who would like to perform analyses of DRH data. Please pass it on!” 출처 : UBC의 Edward Slingerland 교수 트위터 링크

ALBERTI (LM For Poetry)

여러 언어의 시(詩) 말뭉치로 학습한 BERT 모델. 영어를 포함한 유럽어와 아랍어, 중국어 시 포함. “ALBERTI is a set of two BERT-based multilingual model for poetry. One for verses and another one for stanzas. This model has been further trained with the PULPO corpus for verses using Flax, including training scripts.” linhd-postdata/alberti-bert-base-multilingual-cased · Hugging Face [2307.01387] … Read more

[Open Data] 타이완 고궁박물관

https://theme.npm.edu.tw/opendata/ 타이완 고궁 박물관의 Open Data 서비스이다. 타이완 고궁 박물관은 중화민국이 타이완으로 도망치면서, 당시에 가장 귀중한 중국 유물을 거의 다 가져왔기에, 중국 유물의 정수가 있다는 곳이다. 그런 곳에서 Open Data를 수행하고 있다. Open 데이터이기에, 신청도, 용도 제한도, 비용지불조차 없다. 더 구체적으로 100만개의 CC0(완전 공개)와 600만개의 CCBY(저작권표기) 데이터가 공개되어 있다. 심지어는 2020년에 일본 유명 게임인 동물의 … Read more

甲言Jiayan / 중국어형태소분석기

https://github.com/jiaeyan/Jiayan 甲言,专注于古代汉语(古汉语/古文/文言文/文言)处理的NLP工具包,支持文言词库构建、分词、词性标注、断句和标点。 Jiayan, the 1st NLP toolkit designed for Classical Chinese, supports lexicon construction, tokenizing, POS tagging, sentence segmentation and punctuation.

생성AI 관련 뉴스레터 및 사이트 소개

요즘AI가 프로덕트를 찾아보거나 궁금한 점이 생길 때 자주 찾아보고 도움을 받은 생성AI 관련 뉴스레터 및 사이트를 소개합니다. 급변하는 AI 트렌드를 파악하는 데 조금이나마 도움이 되셨으면 좋겠습니다. 🙂 1/ 셀렉트스타 AI NEWS & TRENDS 여러 기업, 학계에서 발표하는 논문이나 기술들을 이해하기 쉽게 분석해주는 뉴스레터. 그 외에도 최근 AI 이슈나 샘 알트만 방한 등 재밌는 이슈에 대한 … Read more

전송문 (全宋文), 전원문(全元文) 목차 파일 다운로드

CBDB의 주관 기관 중에 하나인 미국 하버드 대학에서 기계가독이 가능한 전원문(全元文: 중국 원나라 시기[1271-1368]에 쓰여진 모든 글을 모아 편집한 자료)의 목차 파일를 공개하였습니다. 또, 이전에 이미 공개가 되었지만, 이 기회에 전송문(全宋文, 중국 송나라 시기[960-1279]에 쓰여진 모든 글의 모아 편집한 자료)의 목차 파일도 다시 공지 되었습니다. 아래 링크를 통해서 접근 가능합니다 전원문: https://projects.iq.harvard.edu/cbdb/data-sets전송문: 대만 송사 연구 … Read more