KADH / 한국디지털인문학협의회

국립중앙도서관 데이터, ‘누구나’ 쓰는 공공데이터로 탈바꿈

2026-01-13 작성자: 김병준

– 전문 지식 없어도 활용 가능한 국가서지 데이터 OpenAPI 서비스 개시– 공공데이터포털 통해 민간·연구·스타트업 활용 확대 공공데이터포털 링크: https://www.data.go.kr/data/15154402/openapi.do 국립중앙도서관(관장 김희섭)은 그동안 전문가 중심으로 활용되던 국가서지 데이터를 일반 국민과 기업에서도 폭넓게 활용할 수 있도록 개방한다. 국립중앙도서관은‘25년 국가중점데이터 개방 지원사업*’으로 국가서지 Linked Open Data(LOD)** 기반 OpenAPI 서비스를 개발하였으며, 해당 데이터는 공공데이터포털(data.go.kr)을 통해 제공된다. * 국가중점데이터 개방 … 더 읽기

일러스트로 트랜스포머 이해하기 / The Illustrated Transformer

2025-12-29 작성자: Baro

https://jalammar.github.io/illustrated-transformer Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License 로 출처표기, 동일조건, 비영리 사용을 조건으로 자유롭게 사용 가능함.

Omnilingual ASR: 메타의 1600개 언어 지원 오픈소스 음성인식 모델

2025-11-12 작성자: Baro

https://ai.meta.com/blog/omnilingual-asr-advancing-automatic-speech-recognition https://github.com/facebookresearch/omnilingual-asr https://aidemos.atmeta.com/omnilingualasr/language-globe 온라인 도구: https://huggingface.co/spaces/facebook/omniasr-transcriptions 논문: https://ai.meta.com/research/publications/omnilingual-asr-open-source-multilingual-speech-recognition-for-1600-languages Meta AI가 1,600개 이상의 언어를 지원하는 새로운 자동 음성 인식(ASR) 기술인 ‘옴니링구얼 ASR(Omnilingual ASR)’을 공개했습니다. 이 기술의 주요 내용은 다음과 같습니다. 핵심 기능 및 성과: 기술적 특징: 의의 및 목표:

File Search Tool in Gemini API : 내 손안에 NotebookLM

2025-11-11 작성자: Baro

https://blog.google/technology/developers/file-search-gemini-api 관리형 RAG 시스템: 파일 검색 도구는 Gemini API에 직접 내장된 완전 관리형 RAG(Retrieval-Augmented Generation, 검색 증강 생성) 시스템입니다. 개발 간소화: 이 도구는 RAG 파이프라인의 복잡한 과정(파일 저장, 청크화, 임베딩, 컨텍스트 주입 등)을 자동 관리하여 개발자가 더 쉽게 Gemini를 자신의 데이터와 연결할 수 있게 해줍니다. 비용 효율성: 쿼리 시점의 저장 및 임베딩 생성 비용은 무료입니다. … 더 읽기

EuroLLM: 유럽 언어 LLM

2025-11-02 작성자: Baro

eurollm.io https://huggingface.co/blog/eurollm-team/eurollm-9b 바로: 현재 한국에서 진행중인 승자 선정형으로 진행된 것으로 보임. 승자 선정형은 정부 정보 비대칭, 시강 왜곡, 도덕적 해이 등의 분명한 문제가 있음. 그런데 한국처럼 기본적인 체급이 현실적으로 한계가 있는 상황에서는 반도체 시장 처럼 승자 선정형으로 갈 수 밖에 없는 한계도 분명히 있음…

Virtual Philosophers / 홍콩대

2025-10-30 작성자: Baro

https://phil.bdsl.ai/philosopher 바로: 홍콩대학교 하비에르 차, 최동혁 선생님이 만든 동서양 철학자와의 대화 서비스. 다국어LLM 모델을 사용하여 한국어로도 질문 가능함. 구체적인 내용은 아직 설명 페이지 없어서 모름. 물어보기는…귀찮… -0-;;;

오픈 노트북(Open Notebook): 오픈소스형 구글 notebook LM

2025-10-25 작성자: Baro

공식홈페이지: https://www.open-notebook.ai/ 공식홈페이지-설치: https://www.open-notebook.ai/get-started.html Github: https://github.com/lfnovo/open-notebook 바로: 아…정말 괜찮아 보이는데… 한번 테스트 해보고 싶은데… 남아도는 GPU 서버가 있었으면…-0-

Chandra OCR

2025-10-25 작성자: Baro

https://github.com/datalab-to/chandra 찬드라 (Chandra) 찬드라(Chandra)는 이미지와 PDF를 레이아웃 정보를 보존하면서 구조화된 HTML/Markdown/JSON으로 변환하는 매우 정확한 OCR 모델입니다. 특징

PaddleOCR

2025-10-23 작성자: Baro

https://github.com/PaddlePaddle/PaddleOCR addleOCR은 문서와 이미지를 업계 최고 수준의 정확도로 JSON 및 Markdown과 같은 구조화되고 AI 친화적인 데이터로 변환하여, 전 세계 인디 개발자와 스타트업부터 대기업에 이르는 모두를 위한 AI 애플리케이션을 지원합니다. 50,000개 이상의 (GitHub) 스타를 획득하고 MinerU, RAGFlow, OmniParser와 같은 주요 프로젝트에 깊이 통합된 PaddleOCR은 AI 시대에 지능형 문서 애플리케이션을 구축하는 개발자들을 위한 최고의 솔루션이 되었습니다.

DeepSeek-OCR: Contexts Optical Compression

2025-10-23 작성자: Baro

https://github.com/deepseek-ai/DeepSeek-OCR DeepSeek-OCR이란? (핵심 개념) 이름은 OCR이지만, 본질은 ‘문맥 광학 압축 (Contexts Optical Compression)’ 기술입니다. 2. 작동 방식 (두 단계) DeepSeek-OCR은 두 가지 주요 부분으로 구성됩니다. 3. 단순 OCR과의 차이점 이 모델은 단순히 글자만 따는 기존 OCR과는 근본적으로 다릅니다. 요약 DeepSeek-OCR은 “LLM의 긴 글 처리 문제를 ‘시각적 압축’이라는 새로운 방식으로 해결하려는 시도”이며, 그 첫 번째 적용 … 더 읽기