Ollama: 로컬에서 무료로 LLM 모델 사용하기

Ollama는 대규모 언어 모델(LLM)을 로컬에서 실행할 수 있도록 돕는 도구이며, 이 라이브러리는 Ollama와 함께 사용할 수 있는 다양한 모델들을 모아 놓은 저장소라고 할 수 있습니다. 쉽게 말해, Ollama는 거대한 뇌를 내 컴퓨터에서 직접 사용할 수 있게 해주는 도구이고, Ollama.com/library 는 그 뇌를 업그레이드하거나, 다른 종류의 뇌로 바꿔 끼울 수 있도록 다양한 뇌 모델들을 제공하는 곳이라고 … 더 읽기

InkSight: Offline-to-Online Handwriting Conversion by Learning to Read and Write

https://github.com/google-research/inksight InkSight is an offline-to-online handwriting conversion system that transforms photos of handwritten text into digital ink through a Vision Transformer (ViT) and mT5 encoder-decoder architecture. By combining reading and writing priors in a multi-task training framework, our models process handwritten content without requiring specialized equipment, handling diverse writing styles and backgrounds. The system supports … 더 읽기

ModernBERT

https://huggingface.co/blog/modernbert https://huggingface.co/answerdotai https://github.com/AnswerDotAI https://www.answer.ai ModernBERT: BERT를 넘어, 효율성과 성능을 모두 잡다! (블로그 소개글) 안녕하세요, 여러분! 딥러닝, 특히 자연어 처리(NLP) 분야에 관심 있는 분들이라면 “BERT”라는 이름을 한 번쯤은 들어보셨을 겁니다. 2018년에 등장한 BERT는 트랜스포머(Transformer) 기반 모델로, 뛰어난 성능을 보여주며 NLP 분야에 혁명을 가져왔죠. 하지만, BERT는 거대한 모델 크기와 높은 컴퓨팅 자원으로 인해 실무 적용에 어려움을 겪기도 … 더 읽기

LangChain Hub – 랭체인(LangChain) 프레임워크를 위한 공유 및 협업 플랫폼

LangChain Hub – 랭체인 프롬프트, 체인, 에이전트를 공유하고 재사용하여 개발 효율성을 높이는 협업 플랫폼 https://smith.langchain.com/hub 랭체인 허브는 랭체인(LangChain) 프레임워크를 위한 공유 및 협업 플랫폼입니다. 마치 개발자들이 코드를 공유하는 깃허브(GitHub)처럼, 랭체인 허브는 랭체인 프롬프트, 체인, 에이전트 등을 공유하고 재사용할 수 있도록 돕는 공간입니다. 랭체인 허브, 왜 중요한가요? 랭체인 허브의 주요 기능은 무엇인가요? 랭체인 허브, 어떻게 사용할 … 더 읽기

Data Commons / 구글의 오픈지식 그래프 플랫폼

https://datacommons.org Data Commons란 무엇인가? Data Commons는 데이터를 서로 연결하고 공유하기 쉽게 만들고자 하는 오픈 소스 프로젝트입니다. 마치 거대한 지식 그래프 (Knowledge Graph)와 같다고 할 수 있죠. 다양한 분야의 데이터를 한 곳에 모아 연결하고, 이를 통해 새로운 통찰력을 얻고 문제를 해결하는 데 도움을 주고자 합니다. Data Commons의 목표 Data Commons의 주요 특징 Data Commons의 기술적인 내용 … 더 읽기

NDL 클래식 OCR-Lite 애플리케이션 저장소 (고전 일본어 및 한문 OCR)

(deepl 번역) NDL 고전적 OCR-Lite를 이용하여 텍스트화를 수행하기 위한 애플리케이션을 제공하는 리포지토리입니다.NDL 고전적 OCR-Lite는 에도 시대 이전의 일본 고서, 청대 이전의 한적 등 고전적 자료의 디지털화 이미지에서 텍스트 데이터를 생성하는 OCR이다.GPU를 필요로 하지 않는 OCR 처리가 특징이며, 노트북 등 일반 가정용 컴퓨터 및 OS 환경에서 고속으로 실행할 수 있습니다. https://github.com/ndl-lab/ndlkotenocr-lite NDL古典籍OCR-LiteのWeb移植版が公開に https://bungaku-report.com/blog/2025/05/ndlocr-litewebgpuocryuta1984.html NDL古典籍OCR-Lite Web版 https://ndlkotenocr-lite-web.netlify.app/

A Student’s Guide to Writing with ChatGPT

OpenAI에서 발행한 <ChatGPT를 사용한 학생용 글쓰기 가이드>. ChatGPT 제작사에서 쓴 글이니만큼 읽어볼만한 가치가 있어서 공유합니다. 아래는 해당 글의 12개 꼭지입니다. 1. Delegate citation grunt work to ChatGPT2. Quickly get up to speed on a new topic3. Get a roadmap of relevant sources4. Complete your understanding by asking specific questions5. Improve your flow by getting feedback … 더 읽기

“100년 전 ‘멍텅구리’ 네칸 만화, 조선일보 뉴스 라이브러리에 공개

안녕하세요, 한국 최초의 네칸 만화인 ‘멍텅구리’가 조선일보 뉴스 라이브러리를 통해 100년 만에 다시 세상에 나왔습니다. KAIST 디지털인문사회과학부 전봉관 교수 연구팀(디지털인문사회과학부 석사과정 장우리, 문화기술대학원 석사졸업 이서준, 한국학중앙연구원 인문정보학 김병준 교수 포함)의 연구 성과로, 1924년부터 1933년까지 연재된 이 만화 전편(744편)이 이제 누구나 온라인으로 감상할 수 있습니다. 이번 프로젝트에서는 딥러닝 기술을 활용해 옛 신문에서 네칸 만화 객체를 자동으로 … 더 읽기

Showcasing the Japan Biographical Database (JBDB)

Showcasing the Japan Biographical Database (JBDB) Place: In person (Sophia University: Bldg. 2, 4th Floor, Room 414) and on Zoom (for link see below) Date: 9 November 2024 Time: 10:00 until 17:30 (Tokyo time)  Zoom Link:  Topic: Showcasing the Japan Biographical Database (JBDB) Time: 9 Nov. 2024 (opens 09:30 AM) Tokyo https://sophia-ac-jp.zoom.us/j/91601237353 Meeting ID: 916 0123 7353 … 더 읽기

Open Databases for China Studies Resource Guide

This guide provides an overview of open databases and free resources with primary materials for China studies research. The guide was edited by Joshua Seufert (Princeton University Libraries) and Luo Zhou (Duke University Libraries) for the Luce/ACLS Digital Archives Mapping Project. This guide will be updated periodically, with an expanded directory to be released in winter … 더 읽기