한국사데이터베이스(한국근현대잡지자료) 스크래핑 코드
한국사데이터베이스 – 한국근현대잡지자료(https://db.history.go.kr/item/level.do?itemId=ma) 스크래핑 파이썬 코드. Colab에서 바로 실행해볼 수 있습니다. 코드 작성자 : 김병준 https://github.com/ByungjunKim/KoreanHistoryDatabase
한국사데이터베이스 – 한국근현대잡지자료(https://db.history.go.kr/item/level.do?itemId=ma) 스크래핑 파이썬 코드. Colab에서 바로 실행해볼 수 있습니다. 코드 작성자 : 김병준 https://github.com/ByungjunKim/KoreanHistoryDatabase
2월 2일부터 국립국어원에서 ‘근현대 국어사전’ 서비스를 시범 운영하기 시작했습니다. 문세영의 조선어사전(1940)과 한글학회의 큰사전(1957)을 이용할 수 있습니다. 국립국어원은 지난 2022년 네이버와 한글학회와 협력해 디지털 자료 변환 작업을 마쳤습니다. https://opendict.korean.go.kr/modern/main
고도서 한자 인식 고문서 한자 인식(시험판) 고도서 이미지 검색 필사본 자전 고문헌 한문 자동 문장 분절(시험판)
https://github.com/placemark GN⁺: 웹 기반 지리 공간 데이터 편집기인 Placemark, 이제 오픈 소스로 전환 Placemark 애플리케이션 소개 초기 오픈 소스 릴리스 주의사항 기술 스택 Docker를 이용한 실행 Render에서 실행 설치 환경 변수 필수 및 선택적 환경 변수 인프라 도메인 로컬 SSL 테스트 Stripe 사용 GN⁺의 의견
Github: https://github.com/kakaobrain/honeybee 논문: Honeybee: Locality-enhanced Projector for Multimodal LLM // https://arxiv.org/abs/2312.06742 바로: 한국어를 기반으로 하는 LLM이 많다고 하기 어려운 상황에서 경량화 멀티모달 LLM을 공개한 카카오에게… 성은이 망극하나이다. 꾸벅–
유럽의 희곡(Drama) 말뭉치 DraCor 1.0 공개. DraCor (Drama Corpus Project) 는 유럽의 25개 언어로 된 희곡 말뭉치로 단순 말뭉치를 넘어 TEI-XML 태깅까지 된 양질의 데이터. 최근 API 1.0을 공개하면서 더 활용도가 증가하였음. Computaional Literary Studies(전산문학연구)에 가장 중요한 게 데이터 태깅과 구축임을 보여줌. 관련 링크 : https://weltliteratur.net/streamlining-the-dracor-api/
한국어 형태소 분석기인 바른(bareun)의 유튜브 채널 오픈. 개발자에게 직접 듣는 ‘바른’ 형태소 분석기의 구조와 이해 콘텐츠. https://www.youtube.com/@bareun-ai
Academia Sinica (대만 중앙연구원)의 CIKP LAB(CHINESE KNOWLEDGE AND INFORMATION PROCESSING)에서 제공하는 고전한문 형태소 분석/개체명인식 등 NLP 관련 툴/소스와 서비스. 아래 웹사이트에서 텍스트 입력시 트랜스포머 토크나이징과 개체명 인식 등이 가능. https://ckip.iis.sinica.edu.tw/service/transformers/ 깃허브 링크에서 예시 코드 확인 가능. https://github.com/ckiplab/ckip-transformers
한국학중앙연구원 인문정보학과 김바로 교수님과 해당 연구실 대학원생들의 공개한 <디지털인문학 시리즈>입니다. 위키독스에서 누구나 볼 수 있도록 공개했으며, 계속 수정 보완하실 예정이라고합니다. 디지털인문학 관련 각종 수업, 스터디 등에 활용하면 좋은 교재라고 생각합니다.
GPT 3.5 버전을 활용한 텍스트에서 지식 그래프 자동 추출하는 서비스. 한국어도 활용 가능. 🦜🔗 Text-to-graph extraction · Streamlit (auto-graph.streamlit.app) This playground explores the use of OpenAI functions and LangChain to build knowledge graphs from user-input text. It breaks down the user input text into knowledge graph triples of subject (primary entities or concepts in a sentence), predicate (actions or … Read more