수준 이하의 논문은 공공데이터와 생성AI 탓?!

동아사이언스. “수준 이하 과학논문 급증…공공데이터·AI 활용 탓”. 2025.05.15. https://m.dongascience.com/news.php?idx=71682

그 결과 사이언티픽 리포츠, BMC 공중보건, BMJ 오픈 등을 포함한 147개 학술지에 341편의 유사한 논문들이 확인됐다. 

연구팀은 논문 발표가 급증하기 시작한 시점 챗GPT와 같은 AI 챗봇이 널리 보급되기 시작했다는 점에 주목했다. 돈을 받고 논문을 제작해 연구 실적을 올려주는 조직인 ’논문 공장(paper mill)‘의 활동이 이 시기 활발해졌다는 점도 저품질 논문이 늘어난 원인일 것으로 보았다.  

공공 데이터 세트가 악용될 가능성이 높아졌다는 의미다. 공공 데이터 세트는 파이썬이나 R과 같은 코딩 언어로 쉽게 불러와 활용할 수 있다는 장점이 있지만 품질 낮은 논문들이 쏟아지는 원인이 되기도 한다는 것이다. 

바로: 난가?!…. 각설하고-0-! 생성형AI나 공공데이터셋 자체에 대한 오해가 생기지 않았으면 한다. 문제는 “악용” 아닐까?!

Leave a Comment