https://www.netzeronews.kr/news/articleView.html?idxno=5830

학생들은 각자 10개의 계산 문제를 출제했으며, 중국과 미국의 대표 AI 모델(딥시크 V4-Flash·미니맥스 M2.7·클로드 소네트 4.6)이 이 문제를 풀도록 했습니다. 채점 방식도 독특했습니다. AI가 틀릴수록 학생의 점수가 높아지는 시스템이었습니다. 구체적으로 딥시크가 한 문제를 틀리면 1.5점, 미니맥스는 2점, 클로드는 3점이 부여됐으며, 10개 문제를 성실히 출제하면 60점이 보장됐습니다.
출제에는 엄격한 규칙이 적용됐습니다. 문제는 반드시 수업에서 다룬 내용이나 교재에 기반해야 했고, 유일한 정답과 완전한 풀이 과정이 포함되어야 했으며, 학생 본인이 먼저 문제를 정확히 풀 수 있어야 했습니다.
흥미로운 사례는 학부 3학년 셰진수(谢锦树) 학생입니다. 그는 97점을 받았는데, SHAP 값, HITS, HMM, ChiMerge, CART+베이지안 네트워크 등 무거운 계산이 필요한 문제를 10개 출제했고, 세 AI 모델이 거의 모두 틀렸습니다. 샤오 교수는 이를 “인간은 풀 수 있지만 AI는 풀 수 없는” 전형적인 사례라고 평가했습니다.
바로: 재미 있군요. 공학쪽에서는 응용 가능할듯 합니다. 다만, “정답”이라는 것이 없는 인문사회에서는 어떻게 해야 할지…고민이 깊어지는군요.