您的位置:首頁>科技>正文

大資料如何助教育更加公平優質

禹天建 繪

李克強總理在今年的政府工作報告中指出:“實施大資料發展行動, 加強新一代人工智慧研發應用, 在醫療、養老、教育、文化、體育等多領域推進‘互聯網+’。

”當前, 發展教育大資料已成為推進我國當前教育領域深化改革和創新發展的戰略選擇。

黨的十九大報告提出, 努力讓每個孩子都能享有公平而有品質的教育。 在教育領域實施大資料發展行動中, 好的教育大資料怎樣才能挖掘出來, 又該進行怎樣的分析處理?大資料怎樣為教育助力使其更加公平優質?對此, 中國教育報記者對相關專家和從業人員進行了深入採訪。

訪談嘉賓:

戚萬學 曲阜師範大學黨委書記、中國教育大資料研究院院長

甘健侯 雲南師範大學民族教育資訊化教育部重點實驗室常務副主任

方海光 首都師範大學教育技術系教授、遠端教育研究所所長

李 超 學堂線上總裁

好的教育大資料怎樣才能挖掘出來

記者:當前, “大資料”成了一個時髦名詞。 好的教育大資料是什麼樣?教育資料數量越多越好嗎?

戚萬學:大資料之“大”, 我們一般理解為“數量”規模之大, 通常資料樣本量越大, 越有利於對資料進行多維的聚類、聚合、聚集分析, 更有利於“掃描”和“透視”看似毫無價值、毫無關聯資料之中的相關性、邏輯性直至規律性, 從而可以進行評價和趨勢預測。 大資料之“大”, 還有一種理解是處理技術的“大”。 對於教育大資料而言, 需要資料的不斷累積和增多, 同時也需要相應大資料採擷分析技術不斷提高。

教育大資料的價值在於説明決策, 一般而言, 好的教育大資料要具備精確、完整、可靠性、視覺化呈現、存取性高等特徵。

甘健侯:教育大資料之“大”並非只是數量之大, 更為強調的是資料蘊含的“價值”之大。 實質上, 教育大資料並不是越多越好。 對於資料科學家來說, 重要的不是得到最多的資料, 而是看通過哪些資料可以得出真正有價值的結果。 教育大資料大致分為教學資源類大資料、教育教學管理大資料、教與學行為大資料、教育教學評估大資料四類。 教育大資料並非包括所有資料, 因為教育活動過程中也會產生大量無意義的“雜訊”資料, 需要根據教育的應用目的進行資料過濾和“清洗”,

為後期深度挖掘和分析做準備。 因此, 好的教育大資料一定是科學、客觀、準確、有用的, 要把資料與人的差異化有機結合起來。

方海光:教育大資料並非越多越好, 教育大資料要能服務教育發展、具有教育目的性, 而非盲目地囊括一切資料。 教育大資料是以業務應用導向為評判標準的, 即應用是檢驗教育大資料的唯一標準。 好的教育大資料可以在提升教育品質、促進教育公平、實現個性化學習、優化教育資源配置、輔助教育科學決策等方面發揮重要作用。

記者:教育大資料豐富多樣、種類繁多, 在海量的教育資料中, 怎樣挖掘出好的教育大資料?

戚萬學:教育過程中每分每秒都在產生大量豐富、複雜且多樣的資訊, 這些資訊必須經過深入的挖掘才能轉化成可以運用的教育資料。如何挖掘教育大資料一直是擺在教育研究者與政府面前的重要課題,也是一個難題。好的教育大資料是憑藉資料採擷者敏銳的洞察力與先進的挖掘技術來獲得的。好的教育大資料必須有好的理念、好的問題意識、有趣的研究設計,然後才是好的挖掘技術。在資料採擷過程中,應該避免唯技術化和工具化傾向。

李超:大資料採擷不能離開教育實踐,無論是線上教育還是課堂教學,我們都不能為了抓資料而去抓資料,而要從貼近教師的教學需要、滿足學生的學習需要出發,真正以學習者為中心去獲取大資料。非結構化的教育資料如圖片文本,需要通過充分利用好現在的資訊技術手段,通過人工智慧、模式分析、行為分析的瞭解和認知科學的發展、教育技術的最新理念,把它們轉換成結構化的教育資料。更關鍵的是要能夠把這些非結構化資料,通過模型在教育過程中去指導、説明教師以及指導整個系統開發,然後再去獲取資料優化模型,通過往復的過程以後,可以真正實現科學化指導。

甘健侯:好的教育大資料需要對教育資料進行深度挖掘。這個過程中需要綜合運用數學統計、機器學習、資料採擷和人工智慧等多交叉領域的技術和方法,對教育大資料進行處理和分析。通過資料建模,發現學習者學習結果與學習內容、學習資源和教學行為等變數的相關關係,來預測學習者未來的學習趨勢,促進學習者有效學習的發生。

方海光:好的教育大資料也是重要的教育資源之一。為使資料資源物盡其用,當前最需要的就是挖掘能夠促進共建共用的教育大資料。共建共用不僅有利於加速教育大資料產品的應用和開發,也有利於降低成本優化體驗。對於半結構化或非結構化的資料,可以採用自然語言理解、模式識別等人工智慧手段進行資訊抽取,還可以通過專家人為地進行協同標籤處理,這樣可以將其轉化為結構化資料。對於雜質較多的資料,可以在資料採擷時進行資料清洗。對於即時產生的資料可以使用自動獲取效率優先的方式來採集資料。

豐富多樣的教育大資料如何處理

記者:在雲存儲和雲計算的基礎上,如何利用資訊技術等手段對非結構化和半結構化教育資料進行有效處理?

戚萬學:非結構化資料轉化為結構化資料,是大資料產生效力的重要途徑。常見的教育大資料,都是非結構化的類型,能直接進行資料分析的結構化資料反而較少。舉例而言,教師的教學視頻、學生的作業等都屬於非結構化的資料。要解決非結構化資料帶來的挑戰,就是利用資訊技術進行資料轉化。在資料分析方面,目前已經有相當成熟的分析方式,包括傳統統計學的回歸分析、類別分析和決策樹等,真正面臨的挑戰反而是資料的清洗及去敏的處理,關鍵是確保資料與資料產生者之間的匿名性,即在經過資料清洗後,無法通過資料去辨識出該資料所屬者的資訊。如此,才能確保學生個人的資訊不外流,符合一般教學及研究的倫理守則。

李超:在教育大資料的挖掘和分析上,在整個教育教學過程中,現有的手段能夠收集到的資訊還不夠。在大量佔有這些資料的時候,我們一定要利用人工智慧或者最新的神經網路深度學習等技術,基於實踐資料去進行處理總結和分析,同時要把這些結果和總結分析反哺到教育過程中去。

甘健侯:教育資料的處理可分為教育資料的獲取與抽取、教育資料的存儲與管理、教育資料的分析與挖掘三個階段。在雲存儲和雲計算的基礎上,傳統關聯式資料庫無論從描述能力上還是從管理資料的規模上,都無法應對非結構化和半結構化的資料管理要求,因此如何利用資訊技術建立有效的非結構化和半結構化教育資料管理平臺是關鍵。首先,針對半結構化和非結構化資料存儲和分析的需求,建立統一的資料模型。其次,利用雲存儲和雲計算,構建分散式與並行處理模型和架構,支援高度並行化與可擴展性,從而保證教育大資料的高效處理。再其次,支援查詢語言與資料視覺化功能,滿足使用者對教育大資料進行訪問與分析的介面需要,以提升教育資料處理的有效性。

方海光:目前,人們對半結構化和非結構化資料的個體表現、一般性特徵和基本原理尚不清晰,這些都需要通過多學科交叉來研究和討論。但是,人們可用開源資訊技術平臺收集半結構化和非結構化資料。由於大資料所具有的半結構化和非結構化特點,基於教育大資料的資料採擷所產生的結構化的“粗糙知識”

《中國教育報》2018年04月17日第4版 版名:新聞·深度

這些資訊必須經過深入的挖掘才能轉化成可以運用的教育資料。如何挖掘教育大資料一直是擺在教育研究者與政府面前的重要課題,也是一個難題。好的教育大資料是憑藉資料採擷者敏銳的洞察力與先進的挖掘技術來獲得的。好的教育大資料必須有好的理念、好的問題意識、有趣的研究設計,然後才是好的挖掘技術。在資料採擷過程中,應該避免唯技術化和工具化傾向。

李超:大資料採擷不能離開教育實踐,無論是線上教育還是課堂教學,我們都不能為了抓資料而去抓資料,而要從貼近教師的教學需要、滿足學生的學習需要出發,真正以學習者為中心去獲取大資料。非結構化的教育資料如圖片文本,需要通過充分利用好現在的資訊技術手段,通過人工智慧、模式分析、行為分析的瞭解和認知科學的發展、教育技術的最新理念,把它們轉換成結構化的教育資料。更關鍵的是要能夠把這些非結構化資料,通過模型在教育過程中去指導、説明教師以及指導整個系統開發,然後再去獲取資料優化模型,通過往復的過程以後,可以真正實現科學化指導。

甘健侯:好的教育大資料需要對教育資料進行深度挖掘。這個過程中需要綜合運用數學統計、機器學習、資料採擷和人工智慧等多交叉領域的技術和方法,對教育大資料進行處理和分析。通過資料建模,發現學習者學習結果與學習內容、學習資源和教學行為等變數的相關關係,來預測學習者未來的學習趨勢,促進學習者有效學習的發生。

方海光:好的教育大資料也是重要的教育資源之一。為使資料資源物盡其用,當前最需要的就是挖掘能夠促進共建共用的教育大資料。共建共用不僅有利於加速教育大資料產品的應用和開發,也有利於降低成本優化體驗。對於半結構化或非結構化的資料,可以採用自然語言理解、模式識別等人工智慧手段進行資訊抽取,還可以通過專家人為地進行協同標籤處理,這樣可以將其轉化為結構化資料。對於雜質較多的資料,可以在資料採擷時進行資料清洗。對於即時產生的資料可以使用自動獲取效率優先的方式來採集資料。

豐富多樣的教育大資料如何處理

記者:在雲存儲和雲計算的基礎上,如何利用資訊技術等手段對非結構化和半結構化教育資料進行有效處理?

戚萬學:非結構化資料轉化為結構化資料,是大資料產生效力的重要途徑。常見的教育大資料,都是非結構化的類型,能直接進行資料分析的結構化資料反而較少。舉例而言,教師的教學視頻、學生的作業等都屬於非結構化的資料。要解決非結構化資料帶來的挑戰,就是利用資訊技術進行資料轉化。在資料分析方面,目前已經有相當成熟的分析方式,包括傳統統計學的回歸分析、類別分析和決策樹等,真正面臨的挑戰反而是資料的清洗及去敏的處理,關鍵是確保資料與資料產生者之間的匿名性,即在經過資料清洗後,無法通過資料去辨識出該資料所屬者的資訊。如此,才能確保學生個人的資訊不外流,符合一般教學及研究的倫理守則。

李超:在教育大資料的挖掘和分析上,在整個教育教學過程中,現有的手段能夠收集到的資訊還不夠。在大量佔有這些資料的時候,我們一定要利用人工智慧或者最新的神經網路深度學習等技術,基於實踐資料去進行處理總結和分析,同時要把這些結果和總結分析反哺到教育過程中去。

甘健侯:教育資料的處理可分為教育資料的獲取與抽取、教育資料的存儲與管理、教育資料的分析與挖掘三個階段。在雲存儲和雲計算的基礎上,傳統關聯式資料庫無論從描述能力上還是從管理資料的規模上,都無法應對非結構化和半結構化的資料管理要求,因此如何利用資訊技術建立有效的非結構化和半結構化教育資料管理平臺是關鍵。首先,針對半結構化和非結構化資料存儲和分析的需求,建立統一的資料模型。其次,利用雲存儲和雲計算,構建分散式與並行處理模型和架構,支援高度並行化與可擴展性,從而保證教育大資料的高效處理。再其次,支援查詢語言與資料視覺化功能,滿足使用者對教育大資料進行訪問與分析的介面需要,以提升教育資料處理的有效性。

方海光:目前,人們對半結構化和非結構化資料的個體表現、一般性特徵和基本原理尚不清晰,這些都需要通過多學科交叉來研究和討論。但是,人們可用開源資訊技術平臺收集半結構化和非結構化資料。由於大資料所具有的半結構化和非結構化特點,基於教育大資料的資料採擷所產生的結構化的“粗糙知識”

《中國教育報》2018年04月17日第4版 版名:新聞·深度

Next Article
喜欢就按个赞吧!!!
点击关闭提示