教育新聞_為您服務教育網
推薦:古詩詞欣賞  中考  高考  閱讀:
  您當前位置:為您服務教育網首頁>>> 教師中心>>>教育新聞 >>機器批作文:有效防背作文和套作文
機器批作文:有效防背作文和套作文



         澎湃新聞

  在高考評分中,作文往往是最耗費工作量,也最具爭議的一項。近年來,由于高考作文評價體系屢遭質疑,相關領域的專家學者開始思考運用機器評分,來取代準確度不高且耗時耗力的人工批改。11月26日,華東師范大學(分數線,專業設置)中文系副教授徐默凡,在華東師范大學一場有關“應試作文寫作質量的計量和計算”的研討會上,就機器在作文評分中的實現可能性進行了探討,并對當下的應試作文評分進行了反思。

  通過數據統計可找出背題套題的作文

  據徐默凡介紹,目前有望運用于機器評分的自然語言處理模型有三類,分別是基于規則識別、數據統計和神經網絡的自然語言處理。

  所謂基于規則識別的自然語言處理,是基于一定的規則對作文進行句法分析和語義分析,從而掌握對語言的理解和表達。徐默凡認為,這條路對于作文機器評分是走不通的。因為首先,人類自身并未建構起準確的作文評分標準;其次,作文評價標準涉及到的因素比句子理解更多,思想、邏輯、結構、語言等要素難以規則化。

  第二種模型則是基于神經網絡的自然語言處理。它的原理在于運用腦科學和仿生學,模仿人腦對信息的處理方式。然而在徐默凡看來,這種模型也不適合用于機器評分。除了訓練復雜度高,費時費力之外,無法對它的信息處理過程進行探測和評估,因而結果的可解釋性差。

  更重要的是,這種模型牽涉到了關鍵的智能倫理問題。AlphaGo的橫空出世令人驚詫,而相比圍棋,作文更是人類智能的體現。如果將作文評分交給人工智能,很容易引起倫理上的反感甚至恐慌。高考這一事關很多人前途的重大考試,若完全交由人工智能去判斷評分,很有可能會造成“機器將會主宰人類社會”的聯想。

  于是相比之下,基于數據統計的自然語言處理才是更適合機器評分的模型。這種數據統計的基本原理是,一個句子是否合理,不必了解它的句法語義,只需要考察它在人類說過的話中出現的可能性大小如何:出現的可能性越大,即越合理;可能性越小,則越不合理。理論上,進行這種自然語言處理時,需要把人類講過的所有話都統計一遍;然而在現實中,進行詞頻統計就已綽綽有余。“詞頻統計現在已經是比較成熟的研究成果了,”徐默凡說,“在實際中,也可以考慮到前后文的關聯和影響。只是考慮的詞越多,意味著計算也會越復雜。”

  徐默凡指出,數據統計可以有效禁止背作文和套作文的行為。如今中高考已成為了背作文和套作文的重災區,同一個教師教出的學生背誦了一樣的范文,因而考試時寫出相似的作文,這一普遍現象若依靠人工力量是很難被察覺的。這里就是機器大顯身手的地方了。它可以通過統計給出重復率百分比,并自動摘要出不同考生所寫的相同事例,再由人工鑒定是否是作弊。

  此外,作文的語言規范度也可以使用統計測量。通過計算每篇作文的概率值,概率值越高說明語言用法越常規,以此就可以識別不規范的語言用法。“當然,概率低也有一種可能,那就是作文在語言上進行了創新,使用了一些新穎的表達。在此使用統計法,至少可以挑出概率低的表達,進而進行人工篩查,重點關注,再根據不同類型的作文要求賦分。”徐默凡說。

  在高考評分中,作文往往是最耗費工作量,也最具爭議的一項。近年來,由于高考作文評價體系屢遭質疑,相關領域的專家學者開始思考運用機器評分,來取代準確度不高且耗時耗力的人工批改。11月26日,華東師范大學(分數線,專業設置)中文系副教授徐默凡,在華東師范大學一場有關“應試作文寫作質量的計量和計算”的研討會上,就機器在作文評分中的實現可能性進行了探討,并對當下的應試作文評分進行了反思。

  通過數據統計可找出背題套題的作文

  據徐默凡介紹,目前有望運用于機器評分的自然語言處理模型有三類,分別是基于規則識別、數據統計和神經網絡的自然語言處理。

  所謂基于規則識別的自然語言處理,是基于一定的規則對作文進行句法分析和語義分析,從而掌握對語言的理解和表達。徐默凡認為,這條路對于作文機器評分是走不通的。因為首先,人類自身并未建構起準確的作文評分標準;其次,作文評價標準涉及到的因素比句子理解更多,思想、邏輯、結構、語言等要素難以規則化。

  第二種模型則是基于神經網絡的自然語言處理。它的原理在于運用腦科學和仿生學,模仿人腦對信息的處理方式。然而在徐默凡看來,這種模型也不適合用于機器評分。除了訓練復雜度高,費時費力之外,無法對它的信息處理過程進行探測和評估,因而結果的可解釋性差。

  更重要的是,這種模型牽涉到了關鍵的智能倫理問題。AlphaGo的橫空出世令人驚詫,而相比圍棋,作文更是人類智能的體現。如果將作文評分交給人工智能,很容易引起倫理上的反感甚至恐慌。高考這一事關很多人前途的重大考試,若完全交由人工智能去判斷評分,很有可能會造成“機器將會主宰人類社會”的聯想。

  于是相比之下,基于數據統計的自然語言處理才是更適合機器評分的模型。這種數據統計的基本原理是,一個句子是否合理,不必了解它的句法語義,只需要考察它在人類說過的話中出現的可能性大小如何:出現的可能性越大,即越合理;可能性越小,則越不合理。理論上,進行這種自然語言處理時,需要把人類講過的所有話都統計一遍;然而在現實中,進行詞頻統計就已綽綽有余。“詞頻統計現在已經是比較成熟的研究成果了,”徐默凡說,“在實際中,也可以考慮到前后文的關聯和影響。只是考慮的詞越多,意味著計算也會越復雜。”

  徐默凡指出,數據統計可以有效禁止背作文和套作文的行為。如今中高考已成為了背作文和套作文的重災區,同一個教師教出的學生背誦了一樣的范文,因而考試時寫出相似的作文,這一普遍現象若依靠人工力量是很難被察覺的。這里就是機器大顯身手的地方了。它可以通過統計給出重復率百分比,并自動摘要出不同考生所寫的相同事例,再由人工鑒定是否是作弊。

  此外,作文的語言規范度也可以使用統計測量。通過計算每篇作文的概率值,概率值越高說明語言用法越常規,以此就可以識別不規范的語言用法。“當然,概率低也有一種可能,那就是作文在語言上進行了創新,使用了一些新穎的表達。在此使用統計法,至少可以挑出概率低的表達,進而進行人工篩查,重點關注,再根據不同類型的作文要求賦分。”徐默凡說。


 分享到:分享到QQ空間QQ空間 分享到新浪微博新浪微博 分享到百度i貼吧百度i貼吧 分享到開心網開心網 分享到人人網人人網 豆瓣網 我的收藏
       
       
本欄目最新14條記錄:
 · “假神童”的泡泡是怎么吹成這么大的 · 現在的學生書包越來越鼓眼皮越來越重
 · 法國教育部將禁止學生帶手機上學 · 多動癥兒童困境:普校管不了特校收不了
 · 機器批作文:有效防背作文和套作文 · 控作業總量能否減學生課業負擔?
 · 10歲男孩癡迷手游敗光母親治病錢 · 評中學當面砸毀學生手機
 · 10歲男孩手機導航獨自去湖南與家人團圓 · 假期不出游 家長忙著給孩子“充電”
 · 校園傷害學校擔責 體育課因此被減 · 河南體罰學生涉事老師被調離教學崗位
 · 高中生們有點“嫌棄”老教師太傳統 · 成都一中學:學生犯錯要扣錢
 -> 祝您健康 最新推薦

推薦閱讀
   家庭教育+幼兒教育+賞識教育
    為您服務教育網今日推薦

聯系我們 本站搜索 要資料 請您留言 開心智慧吧 動畫 笑話 安平影像 周恩來總理
為您服務教育網——全心全意為中國教育免費服務(Copyright© 2001-2017 河北·衡水) 安平明德小學 一小學前三班
冀ICP備06009845號
澳洲幸运8是官方网