생성형AI 환상 순위: LLM Confabulation (Hallucination) Leaderboard for RAG
https://github.com/lechmazur/confabulations 해당 기사는 대규모 언어 모델(LLM)이 오해의 소지가 있는 질문에 응답할 때 얼마나 자주 존재하지 않는 답변, 즉 허구 또는 환각을 생성하는지 평가하기 위한 벤치마크에 관한 것입니다. 질문은 LLM 훈련 데이터에 아직 포함되지 않은 최근 기사를 기반으로 합니다. RAG(검색 증강 생성)를 사용할 때는 이러한 허구를 최소화하는 것이 중요합니다. 2025년 2월 10일 현재, 제공된 텍스트에 답변이 … 더 읽기