甲言Jiayan / 중국어형태소분석기

https://github.com/jiaeyan/Jiayan 甲言,专注于古代汉语(古汉语/古文/文言文/文言)处理的NLP工具包,支持文言词库构建、分词、词性标注、断句和标点。 Jiayan, the 1st NLP toolkit designed for Classical Chinese, supports lexicon construction, tokenizing, POS tagging, sentence segmentation and punctuation.

Kiwi + 딥러닝 언어모델

“BERT, GPT, BART와 같은 딥러닝 언어모델에서는 크기가 고정된 닫힌 어휘 집합을 사용합니다. 따라서 딥러닝 언어모델에 텍스트를 입력하려면 임의의 텍스트를 고정된 어휘 집합으로 분할하여 변환해주는 토크나이저(Tokenizer)가 필수적입니다. 한국어의 경우 오랫동안 개발되어온 형태소 분석기가 있으나, 기존의 형태소 분석기들은 분석결과를 고정된 개수의 어휘로 출력하는 기능이 없었으므로 형태소 분석기를 토크나이저로 사용할 수 없었습니다. 그래서 한국어의 특징을 고려하지 못함에도 Byte … Read more

Pandas-AI(Pandas + ChatGPT)

대표적인 파이썬 데이터 핸들링 패키지인 Pandas와 OpenAI의 ChatGPT API를 활용해 자연어기반의 데이터 핸들링이 가능한 PandasAI 패키지. 예컨대 자연어로 “A컬럼에서 가장 빈도수가 큰 항목을 뽑아줘”라고 하면 판다스 함수를 알아서 실행함. gventuri/pandas-ai: Pandas AI is a Python library that integrates generative artificial intelligence capabilities into Pandas, making dataframes conversational (github.com)

[성균관대]  챗GPT 기술의 이해 워크숍 안내

공지사항 게시판읽기 ( [ 교육개발센터 ] 챗GPT 기술의 이해 워크숍 안내 ) | 챗GPT (skku.edu) 1. 목적: 인공지능 챗GPT 기술에 대한 이해 제고 2. 대상: 우리 대학 교강사 및 관심있는 구성원 3. 주제 및 강사   가. 주제: 챗GPT 기술의 이해   나. 강사: 박진영 교수(인공지능학과) 4. 일시: 2023년 4월 26일(수) 13:30~15:00. Zoom 5. 신청방법: https://forms.gle/uWZWYZqT3nxiyuvr5  ~24일(월) 오후 2시까지 … Read more

성균관대 챗GPT 종합안내

“이에 우리대학은 △ AI의 교육적 선용(善用) 제도, 교육 모델 개발, △ AI를 부적절하게 활용한 부정행위, 표절 등의 적극적 예방, △ AI 활용 윤리와 디지털 리터러시 교육 강화, △ 적절한 평가 방식의 개발  등 챗GPT의 교육적 활용을 위해 양 캠퍼스 부총장을 주도로 연구위원회와 대응 T/F를 구성하였습니다.” https://chatgpt.skku.edu/chatgpt/index.do

[Tool] Taxy AI: Full Browser Automation

GPT4를 활용해서 브라우저 상에서 일어나는 반복 작업을 자동화하는 매크로 패키지. 셀레늄(Selenium) 처럼 브라우저를 조종하는 패키지의 대체제로서 쓸 수 있을 듯합니다. TaxyAI/browser-extension: Automate your browser with GPT-4 (github.com)

고적Cool(古籍酷, GJ.cool) – 고적 연구 종합 플랫폼

https://gj.cool/https://gj.cool/about?tab=punct#Punct 고적Cool(古籍酷, GJ.cool)은 北京籍智达数字科技有限公司에서 개발한 자동표점, 고적OCR, 고문-현대문 번역 등을 지원하는 고적 종합 플랫폼임. (작명 센스가…..이건 쫌…) 표점만 제공하는 것이 아니라, 교정(校对)와 정열(对齐) 기능을 제공함. 그리고 openAPI를 제공하고 있음. 역시 돈 벌려는 기업의 플랫폼은 다름. 다만, 고적OCR이나 고문-현대문 번역은 로그인을 해야만 사용 가능함. 그런데 회원가입에서 고문 못하면 가입하지 말라고 함. 참고로 번체자로 입력해야 함. (처음에 … Read more

CCLUE 古文语言理解测评基准

https://cclue.top/guwen-models.htmlhttps://github.com/Ethan-yt/guwen-modelshttps://huggingface.co/ethanyt/guwen-punc Ethan(https://github.com/Ethan-yt) 개인이 만든 모델(BEIJING INSTITUTE OF TECHNOLOGY 출신, 현재 Yuanfudao 근무) 페이지 로딩도 느리고, 처리 속도도 느림. 표점 표기의 정확도가 높다고 하기 어려운건 둘째 치고, 번체자를 간체자로 변경함. 이건 사용이 어려울듯 함. 원문출처: https://sillok.history.go.kr/id/kea_10009013_002 원문: ○平安道助戰節制使康純辭, 上引見。 純啓曰: “本道受敵初面, 且軍人鮮少, 氷合之時, 尤爲可慮, 本道子弟, 宿衛於京者, 竝令入送防戍何如?” 上曰: “予意亦然。 凡防禦之備, 鍊軍之事, 常加敦勉, 毋或少怠。 且北方寒, 甚慮若等冒寒戍邊。 須造土室, … Read more