因為教授誤用 ChatGPT,全班學(xué)生的畢業(yè)差點成為一個大問題。
(資料圖)
整理 |?屠敏
出品 | CSDN(ID:CSDNnews)
曾幾何時,震懾?zé)o數(shù)學(xué)生的「學(xué)好數(shù)理化,走遍天下都不怕」Slogan 在 AI 互聯(lián)網(wǎng)時代,正在變得失效?,F(xiàn)如今,儼然已變成 GPT 打遍天下無敵手。
在此趨勢下,無數(shù)學(xué)生群體借助 GPT 生成論文、完成計算、填補(bǔ)作業(yè)......這也讓很多學(xué)術(shù)界的教授們煩惱不已,稱很多學(xué)生喪失了自主學(xué)習(xí)、獨立思考的能力,只知道把問題拋給 GPT 工具來解答。
為了反向抵制這種情況,一名教授決定用“魔法”打敗“魔法”,萬萬沒想到的是,當(dāng)他誤把生成式的聊天機(jī)器人 ChatGPT 用來檢測學(xué)生自己完成的學(xué)術(shù)論文時,所有學(xué)生的成績不僅都變?yōu)榱恕安患案瘛?,甚至連獲得畢業(yè)證都成為了問題。
事情緣由
具體的事情起因,要從一位名為?DearKick?網(wǎng)友在 Reddit 社交平臺無奈發(fā)的帖子說起。
原來是德克薩斯 A&M 大學(xué)商業(yè)學(xué)院(Texas A&M University-Commerce)農(nóng)業(yè)科學(xué)和自然資源系教農(nóng)業(yè)課程教授 Jared Mumm 對所有學(xué)生發(fā)了一封郵件,稱他正在使用 AI 工具來評估學(xué)生提交的作業(yè)是由人類編寫的還是計算機(jī)生成的。
根據(jù)披露的截圖,郵件完整的內(nèi)容如下:
下午好!
你們現(xiàn)在應(yīng)該都能在 D2L(大學(xué)常用的在線課程管理系統(tǒng))上看到你們的課程最終成績。在每個人單獨給我發(fā)電子郵件之前,請仔細(xì)閱讀這封郵件。
在給你們的最后三次作業(yè)評分時,我已經(jīng)在 Chat GTP 上開通了自己的賬戶。我登錄這個賬戶后,復(fù)制并粘貼你們的回答,Chat GTP 會告訴我,這些內(nèi)容是否是程序自動生成的內(nèi)容。我把每個人的最后三次作業(yè)分別輸入兩次,如果它們都被 Chat GTP 認(rèn)領(lǐng)是 AI 生成的,你就會得到 0 分。
我對這門課的最終成績提交將在今天下午 5 點截止。我將給這門課程的每個人打 "X"。如果你對今天下午 5 點前在 D2L 上看到的成績不滿意,你將完成另一項作業(yè)。如果你對你的成績感到滿意,就不要交下一份作業(yè)。
對于新提交的作業(yè),你需要在周五下午 5 點前完成。它將通過電子郵件發(fā)送給你一個 word 文檔。如果你提交新作業(yè)的時間是在星期五下午 5 點之后,你將收到當(dāng)前在電腦中已經(jīng)顯示的成績。這項作業(yè)的價值為 200 分。
本作業(yè)的提示如下:你正在為一家農(nóng)場主提供咨詢服務(wù),他們要求你幫助他們決定是否應(yīng)該在母豬生產(chǎn)小豬時候,匍匐喂它們吃東西。
你要列出 5 個理由。不過,當(dāng)我通過 Chat GTP 程序來檢查的時候,如果有任何使用的跡象,不僅你現(xiàn)在的成績會維持現(xiàn)狀,而且我會在課堂成績之外判定你為學(xué)術(shù)不端,這將影響你未來參加任何一門我的課程或這所大學(xué)的任何其他課程。
一石激起千層浪,很多學(xué)生比較懵,不知教授到底是在干什么。
不難看出,這封郵件中包含了不少錯誤,譬如時下流行的 AIGC 工具是叫「ChatGPT」,而非“Chat GTP”。
而產(chǎn)生這種關(guān)鍵錯誤的背后,在于教授似乎并不懂 ChatGPT 這款工具以及工作原理,將這款生成式的 AI 聊天機(jī)器人 ChatGPT 誤當(dāng)做檢測 AI 內(nèi)容的工具。
毋庸置疑,工具都用錯了,結(jié)果肯定不會好到哪里去。
正如眾人所料,ChatGPT 最終將很多學(xué)生提交的作業(yè)標(biāo)記為 AI 生成的。
據(jù)外媒 rollingstone 報道,學(xué)生不是沒有想過要向教授解釋,只是他們解釋了,教授不聽。甚至當(dāng)有學(xué)生向教授提供沒有使用過 ChatGPT 的證據(jù)時,教授忽略的這一點,甚至“爆臟話”,在學(xué)校的評分軟件系統(tǒng)中評論說:
“我不給 AI Shit 評分?!?/p>
無奈之下,有學(xué)生“發(fā)郵件聯(lián)系了院長并抄送給大學(xué)校長”,但是沒有立即得到幫助。被卷入這場風(fēng)波的學(xué)生說,明明他們的文章確實是他們自己寫的。更讓他們感到崩潰的是,一部分臨近畢業(yè)的學(xué)生被暫時扣留了畢業(yè)證書。還有網(wǎng)友表述,Mumm 教授以類似的方式讓“幾個”整個班級都不及格,而不是質(zhì)疑他檢測作弊者方法的有效性。
來自學(xué)生的反擊
對于熟悉 ChatGPT 工具的人想必都知道,它是繼續(xù)大量數(shù)據(jù)訓(xùn)練而成,根據(jù)各種提示,也極容易模仿人類書寫的內(nèi)容,自然也會將人類編寫的內(nèi)容識別為“AI 生成的”。
為了證明 ChatGPT 易錯性這一點,網(wǎng)友?Delicious_Village112?復(fù)制了一段?Mumm 教授發(fā)表過的論文摘要,并詢問 ChatGPT 這是人類編寫的還是 AI 生成的。
結(jié)果 ChatGPT 認(rèn)為它可能是“AI 生成的”:「是的,如果得到正確的提示,你分享的段落確實可能是由像 ChatGPT 這樣的語言模型生成的。」
大學(xué)緊急發(fā)布聲明
面對越來越多的學(xué)生在網(wǎng)上開始爆料這一事件,德克薩斯 A&M 大學(xué)商業(yè)學(xué)院緊急發(fā)布聲明回應(yīng):已經(jīng)解決了農(nóng)業(yè)課堂中對 ChatGPT 的擔(dān)憂。
在聲明中,這所高校表示,他們注意到最近的幾篇新聞報道涉及到這樣的指控:德克薩斯A&M大學(xué)商業(yè)學(xué)院農(nóng)業(yè)課的高年級學(xué)生由于對人工智能生成的作業(yè)有疑問而獲得了不及格的成績,并被暫時拒絕頒發(fā)文憑。
A&M-Commerce 證實,沒有學(xué)生因為這個問題而掛科或被禁止畢業(yè)。
當(dāng)前,這班的班主任教授 Jared Mumm 博士正在與學(xué)生就最后一次的書面作業(yè)進(jìn)行單獨溝通。一些學(xué)生獲得了“X”的臨時成績——表示“未完成”——以便讓教授和學(xué)生有時間確定是否使用了 AI 來寫作業(yè),如果是的話,再做級別判定。
目前,已有幾名學(xué)生被免除嫌疑,他們的成績也已經(jīng)公布,而一名學(xué)生已經(jīng)站出來承認(rèn)他在作業(yè)中使用了 ChatGPT。其他幾名學(xué)生選擇完成 Mumm 博士提供給他們的新作業(yè)。
公告稱,大學(xué)官員正在調(diào)查這一事件,并制定政策來解決在課堂上使用或濫用人工智能技術(shù)的問題。他們還在努力采用人工智能檢測工具和其他資源來管理人工智能技術(shù)和高等教育的交叉問題。在課業(yè)中使用人工智能是所有學(xué)習(xí)機(jī)構(gòu)面臨的一個快速變化的問題。
與此同時,網(wǎng)友 DearKick 在最初的帖子下面更新道,迄今為止,教授已經(jīng)向被冤枉的 1 名學(xué)生道歉:
情況(大部分)已解決。
在與教授和幾位行政官員的會面中,我們了解到幾個關(guān)鍵點:
最初人們認(rèn)為整個班級的畢業(yè)證發(fā)放都被擱置了,但實際上只是班級的一半多一點人員被波及。
畢業(yè)證處于“保留”狀態(tài),直到“對每個人的調(diào)查完成”。
學(xué)校表示,他們沒有禁止任何人畢業(yè)/離開學(xué)校,因為畢業(yè)證處于“保留”狀態(tài),還沒有正式被拒絕。
DearKick 稱,到目前為止,他已經(jīng)與幾名學(xué)生交談過,截至撰寫此評論時,已有 1 名學(xué)生通過在谷歌文檔中編輯的時間而被免除嫌疑,雖然他們的畢業(yè)證還沒有發(fā)放,但應(yīng)該發(fā)布。
與此同時,DearKick 透露稱,「由于教授的粗言穢語和與學(xué)生的不專業(yè)溝通,他的工作可能會受到影響,不過,不是因為對 AI 工具的錯誤使用?!箵?jù)悉,該教授向迄今為止被證明沒有作假的 1 名學(xué)生道歉。
什么樣的情況下才能使用 ChatGPT?
截至目前,這份聲明似乎解決了大部分學(xué)生的問題,但是這一次教育工作者對于 AI 工具錯誤使用而引發(fā)的混亂,也讓很多人擔(dān)憂不已。
高校里面是否應(yīng)該使用 AI 工具?老師又是否應(yīng)該使用軟件來檢測學(xué)生提交作業(yè)中 AI 生成的內(nèi)容?
其實,在 ChatGPT 剛剛出現(xiàn)的時候,不少大學(xué)教授就呼吁不可以使用 ChatGPT。甚至一位來自弗曼大學(xué)哲學(xué)助理教授
Darren Hick
還曾發(fā)文分享,抓到了一位用 AI 寫論文的作弊者,并上報了上去。
在這一趨勢下,美國紐約市教育部
正式宣布
:紐約市的學(xué)生和教師,無法再在教育部設(shè)備或互聯(lián)網(wǎng)上訪問 ChatGPT。
事實上,ChatGPT 并不是用于對 AI 生成的文本進(jìn)行識別的最佳工具,它甚至無法準(zhǔn)確確定是否有人用它來寫一篇文章。
過去幾個月間,雖然 OpenAI 推出??
AI-Text-Classifier
、斯坦福大學(xué)帶來?
DetectGPT
,甚至連大學(xué)生都在研發(fā)
GPTZero
等 AI “打假”工具,用以區(qū)分人類寫的文本和來自各種供應(yīng)商使用 AI 寫的文本,但是極高的失敗率,讓人望而卻步。
此前,來自美國馬里蘭大學(xué)的五位計算機(jī)科學(xué)家 Vinu Sankar Sadasivan、Aounon Kumar、Sriram Balasubramanian、Wenxiao Wang 和 Soheil Feizi 在研究了檢測大型語言模型生成的文本之后,發(fā)布了一篇《AI 生成的文本能否可靠地檢測?》論文,最終得出:任何以問號結(jié)尾的提問都可以用“不”來回答。
該論文的一作 Vinu Sankar Sadasivan 坦言,即使是使用最好的檢測器來檢測 AI 生成的文本,這種概率并不比扔硬幣進(jìn)行判斷好到哪里去。
"生成性 AI 文本模型使用人類文本數(shù)據(jù)進(jìn)行訓(xùn)練,目的是使其輸出與人類相似。這些 AI 模型甚至記住了人類文本,并在某些情況下輸出它們,而不會引用實際的文本來源。隨著這些大型語言模型不斷迭代,最好的檢測器只能達(dá)到近 50% 的準(zhǔn)確性“,Sadasivan 說道。
根據(jù)論文結(jié)果顯示,可靠的文本檢測任務(wù)在實踐中是不可能的。
我們可能永遠(yuǎn)無法可靠地說出一篇文章是由人類還是人工智能寫的。
參考:
https://www.rollingstone.com/culture/culture-features/texas-am-chatgpt-ai-professor-flunks-students-false-claims-1234736601/
https://www.theregister.com/2023/05/17/university_chatgpt_grades/
https://www.reddit.com/r/ChatGPT/comments/13isibz/comment/jkeqnam/?context=3
https://arxiv.org/abs/2303.11156
關(guān)鍵詞: