DEEP INTO SEOUL PROJECT 플랫폼

DEEP INTO SEOUL PROJECT는 경성 디지털 문학지도 공동연구팀이 개발한 디지털 문학 플랫폼입니다. 저희 연구팀은 한국 근대문학 텍스트에서 공간 정보를 체계적으로 추출하고, 이를 바탕으로 디지털 문학지도를 구축해 온 전문 연구진으로, 디지털 인문학 방법론을 통해 문학 연구의 객관성과 재현성을 높이는 한편, 학술 성과를 대중과 공유하는 데 주력해 왔습니다. DEEP INTO SEOUL PROJECT는 현대의 구글 지도 위에 근대 … 더 읽기

국립중앙도서관 데이터, ‘누구나’ 쓰는 공공데이터로 탈바꿈

– 전문 지식 없어도 활용 가능한 국가서지 데이터 OpenAPI 서비스 개시– 공공데이터포털 통해 민간·연구·스타트업 활용 확대 공공데이터포털 링크: https://www.data.go.kr/data/15154402/openapi.do 국립중앙도서관(관장 김희섭)은 그동안 전문가 중심으로 활용되던 국가서지 데이터를 일반 국민과 기업에서도 폭넓게 활용할 수 있도록 개방한다. 국립중앙도서관은‘25년 국가중점데이터 개방 지원사업*’으로 국가서지 Linked Open Data(LOD)** 기반 OpenAPI 서비스를 개발하였으며, 해당 데이터는 공공데이터포털(data.go.kr)을 통해 제공된다. * 국가중점데이터 개방 … 더 읽기

Omnilingual ASR: 메타의 1600개 언어 지원 오픈소스 음성인식 모델

https://ai.meta.com/blog/omnilingual-asr-advancing-automatic-speech-recognition https://github.com/facebookresearch/omnilingual-asr https://aidemos.atmeta.com/omnilingualasr/language-globe 온라인 도구: https://huggingface.co/spaces/facebook/omniasr-transcriptions 논문: https://ai.meta.com/research/publications/omnilingual-asr-open-source-multilingual-speech-recognition-for-1600-languages Meta AI가 1,600개 이상의 언어를 지원하는 새로운 자동 음성 인식(ASR) 기술인 ‘옴니링구얼 ASR(Omnilingual ASR)’을 공개했습니다. 이 기술의 주요 내용은 다음과 같습니다. 핵심 기능 및 성과: 기술적 특징: 의의 및 목표:

File Search Tool in Gemini API : 내 손안에 NotebookLM

https://blog.google/technology/developers/file-search-gemini-api 관리형 RAG 시스템: 파일 검색 도구는 Gemini API에 직접 내장된 완전 관리형 RAG(Retrieval-Augmented Generation, 검색 증강 생성) 시스템입니다. 개발 간소화: 이 도구는 RAG 파이프라인의 복잡한 과정(파일 저장, 청크화, 임베딩, 컨텍스트 주입 등)을 자동 관리하여 개발자가 더 쉽게 Gemini를 자신의 데이터와 연결할 수 있게 해줍니다. 비용 효율성: 쿼리 시점의 저장 및 임베딩 생성 비용은 무료입니다. … 더 읽기

EuroLLM: 유럽 언어 LLM

eurollm.io https://huggingface.co/blog/eurollm-team/eurollm-9b 바로: 현재 한국에서 진행중인 승자 선정형으로 진행된 것으로 보임. 승자 선정형은 정부 정보 비대칭, 시강 왜곡, 도덕적 해이 등의 분명한 문제가 있음. 그런데 한국처럼 기본적인 체급이 현실적으로 한계가 있는 상황에서는 반도체 시장 처럼 승자 선정형으로 갈 수 밖에 없는 한계도 분명히 있음…

Virtual Philosophers / 홍콩대

https://phil.bdsl.ai/philosopher 바로: 홍콩대학교 하비에르 차, 최동혁 선생님이 만든 동서양 철학자와의 대화 서비스. 다국어LLM 모델을 사용하여 한국어로도 질문 가능함. 구체적인 내용은 아직 설명 페이지 없어서 모름. 물어보기는…귀찮… -0-;;;

Chandra OCR

https://github.com/datalab-to/chandra 찬드라 (Chandra) 찬드라(Chandra)는 이미지와 PDF를 레이아웃 정보를 보존하면서 구조화된 HTML/Markdown/JSON으로 변환하는 매우 정확한 OCR 모델입니다. 특징