華文網

機器人挑戰高考數學:22分鐘交卷,成績105分

“AI-MATHS”兩次考試具體得分如下:北京文科數學卷,選擇題滿分、填空題20分、解答題45分,

全卷105分;全國卷二選擇題55分、填空題20分,解答題25,全卷100分。在選擇題和填空題上, 表現十分亮眼。丟分環節主要是解答題,有些題目甚至是0分。

6月7日,高考第一天,在成都高新區天府新穀10棟9層的一個封閉空間裡,一位特殊“考生”準備挑戰今年全國高考的數學。它就是成都高新區一家企業研製的高考機器人,名叫“AI-MATHS”。

作為編外考官,記者在現場注意到,“AI-MATHS”被安排在一間完全斷網的房間內,

並用警戒線圍起,黑色的伺服器主機殼中有11台伺服器負責解題。為保證考試公正,考試現場沒有人可以操作這些伺服器。

另據報導,“AI-MATHS”考試的房間門外貼有“所有設備斷網斷庫”的標識。所謂斷網斷庫意味著,模仿考生封閉環境的閉卷考試;測試複雜邏輯推理能力與聯想能力;斷絕一切可能的外界支持,

包括專家系統庫。這也是人工智慧技術的核心——斷網斷庫場景下的綜合邏輯推理能力。

從下午18時28分到19時29分,“AI-MATHS”分別挑戰了北京卷文科數學以及全國二卷文科數學的考試,分別用時22分鐘和10分鐘,得分為105分和100分。儘管和之前預期的110分目標還有差距,但是作為“家長”——成都準星雲學科技有限公司CEO、清華大學蘇州研究院大資料中心主任林輝介紹,

“前幾個月的書,這孩子沒白讀。”

“AI-MATHS”之父林輝:這孩子解題容易 讀題難

兩次考試具體得分如下:北京文科數學卷,選擇題滿分、填空題20分、解答題45分,全卷105分;全國卷二選擇題55分、填空題20分,解答題25,全卷100分。在選擇題和填空題上,“AI-MATHS”表現十分亮眼。丟分環節主要是解答題,有些題目甚至是0分。

“家長”林輝說,其實能考到這麼多分,已經證明,“這孩子前幾個月的書沒白讀。

”但是他也提到了“自家孩子”在答題的一個弱點,“看不懂題。”研發高考機器人最大的難點在於,要讓系統準確理解人類語言。“直接用數學語言表述的應用題它可以輕鬆解答,但它最大的弱項是不能理解考題裡場景式的描述語言,它會讀不懂題目。”

高考數學機器人為何會讀不懂題目?對於這個問題,林輝打了個比方,如果題目是10-1=?人工智慧系統可以輕鬆作答。

但如果題目用了場景描寫將其表述為“小明有10個蘋果,小麗吃了一個,請問還有幾個蘋果?”面對這樣的情況,人工智慧系統就“傻”了,“它不理解小明是什麼、小麗是什麼、吃又是什麼意思。”

實際上,為了“AI-MATHS”迅速克服這解題的弱點,準星雲學科研團隊此前對“AI-MATHS”已進行了500套試卷、12000道題目的魔鬼式訓練。

閱卷老師祁祖海:“處於本班學生的中等水準”

成都七中林蔭校區高級教師祁祖海是負責此次評閱試卷的三名老師之一,他分析,在評卷過程中,“AI-MATHS”所犯錯誤的題目都有一個共同點:語言文字太多。這表示,高考機器人在自然語言上的理解稍稍欠缺。相反,在理解數學語言上相對容易。

根據自身的教學經驗,祁祖海認為,一般學生的成績大約在110分左右,而這次“AI-MATHS”取得的分數,大概處於本班學生的中等水準。但是他坦言,高考機器人的進步空間會很大。如北京考試卷中有一道立體幾何的證明題,機器人選擇的解題思路與大多數學生選擇的不同,卻依然解答正確,這在思路上有所創新。

而“AI-MATHS”未能完成的題中,有一道概率統計文字題,普通學生需要將自然語言轉換成數學題,將圖表資訊轉換成數學資訊處理。祁祖海估計,機器人在資訊挖掘和語言理解上稍差,相反,在證明題上表現優異。

【挑戰紀實】數學全國卷10分鐘答完,得了100分

17時45分,現場工作人員獲得北京卷文科數學試題。

18時10分許,公證人員進入機房查看路由器和11台伺服器運行。之後,專家確認現場符合斷網環境。

18時15分許,大廳內,技術人員通過二十多台伺服器電子版試題導入伺服器。

18時28分許,數學高考機器人AI-MATHS開始解答北京卷文科數學試題。現場4個大螢幕即時更新解答進度。顯示幕左邊是數學題目,右邊顯示解答步驟。

18時43分,螢幕切換故障,顯示幕中斷,但後臺仍在解題。

18時46分,大螢幕重新顯示答題進度。

18時50分,數學高考機器人AI-MATHS答題完畢,隨即形成答卷,共用時22分鐘。

18時55分,西財智庫首席研究員、斯坦福大學高級訪問學者湯繼強等專家驗證一個空U盤將答卷匯出列印。

19時02分,AI-MATHS的答卷交給3位高中數學老師評閱批改。三人分別是:成都天府七中一級教師袁婧、成都樹德中學寧夏校區高級教師肖興桂、成都七中林蔭校區高級教師祁祖海。為方便電腦閱讀,試卷呈現的是LaTeX語言,而閱卷老師因為經過了前期訓練,因此能夠讀懂批改。

19時19分,數學高考機器人AI-MATHS開始解答全國二卷數學卷。

19時16分,評卷專家宣佈AI-MATHS解答北京卷文科數學科目答題結果:選擇題滿分40分。填空題13、14題不能識別。解答題16、18題完全正確,共得45分。全卷總分105分。

19時29分,數學高考機器人AI-MATHS完成全國二卷數學卷。用時10分鐘。現場爆發驚歎聲。

19時35分,試卷列印完畢,移交專家批改。

19時45分,現場宣佈,數學高考機器人AI-MATHS解答全國二卷數學卷結果:選擇題得55分,填空題得20分,簡答題得25分。全卷總分100分。

原標題:

機器人挑戰高考數學:22分鐘交卷,成績105分

閱卷老師祁祖海:“處於本班學生的中等水準”

成都七中林蔭校區高級教師祁祖海是負責此次評閱試卷的三名老師之一,他分析,在評卷過程中,“AI-MATHS”所犯錯誤的題目都有一個共同點:語言文字太多。這表示,高考機器人在自然語言上的理解稍稍欠缺。相反,在理解數學語言上相對容易。

根據自身的教學經驗,祁祖海認為,一般學生的成績大約在110分左右,而這次“AI-MATHS”取得的分數,大概處於本班學生的中等水準。但是他坦言,高考機器人的進步空間會很大。如北京考試卷中有一道立體幾何的證明題,機器人選擇的解題思路與大多數學生選擇的不同,卻依然解答正確,這在思路上有所創新。

而“AI-MATHS”未能完成的題中,有一道概率統計文字題,普通學生需要將自然語言轉換成數學題,將圖表資訊轉換成數學資訊處理。祁祖海估計,機器人在資訊挖掘和語言理解上稍差,相反,在證明題上表現優異。

【挑戰紀實】數學全國卷10分鐘答完,得了100分

17時45分,現場工作人員獲得北京卷文科數學試題。

18時10分許,公證人員進入機房查看路由器和11台伺服器運行。之後,專家確認現場符合斷網環境。

18時15分許,大廳內,技術人員通過二十多台伺服器電子版試題導入伺服器。

18時28分許,數學高考機器人AI-MATHS開始解答北京卷文科數學試題。現場4個大螢幕即時更新解答進度。顯示幕左邊是數學題目,右邊顯示解答步驟。

18時43分,螢幕切換故障,顯示幕中斷,但後臺仍在解題。

18時46分,大螢幕重新顯示答題進度。

18時50分,數學高考機器人AI-MATHS答題完畢,隨即形成答卷,共用時22分鐘。

18時55分,西財智庫首席研究員、斯坦福大學高級訪問學者湯繼強等專家驗證一個空U盤將答卷匯出列印。

19時02分,AI-MATHS的答卷交給3位高中數學老師評閱批改。三人分別是:成都天府七中一級教師袁婧、成都樹德中學寧夏校區高級教師肖興桂、成都七中林蔭校區高級教師祁祖海。為方便電腦閱讀,試卷呈現的是LaTeX語言,而閱卷老師因為經過了前期訓練,因此能夠讀懂批改。

19時19分,數學高考機器人AI-MATHS開始解答全國二卷數學卷。

19時16分,評卷專家宣佈AI-MATHS解答北京卷文科數學科目答題結果:選擇題滿分40分。填空題13、14題不能識別。解答題16、18題完全正確,共得45分。全卷總分105分。

19時29分,數學高考機器人AI-MATHS完成全國二卷數學卷。用時10分鐘。現場爆發驚歎聲。

19時35分,試卷列印完畢,移交專家批改。

19時45分,現場宣佈,數學高考機器人AI-MATHS解答全國二卷數學卷結果:選擇題得55分,填空題得20分,簡答題得25分。全卷總分100分。

原標題:

機器人挑戰高考數學:22分鐘交卷,成績105分