您的位置:首頁>正文

建立中文分級閱讀標準,考拉閱讀的野心不止校內市場

調研 | 張揚 東起

撰寫 | 東起

2016年成立的享閱教育選擇了一條新賽道——中文分級閱讀。

中文分級閱讀賽道幾乎還沒有開啟, 其中一個主要原因在於中文本身的複雜程度,

使評測體系難於建立。 享閱教育創始人趙梓淳介紹, 中文分級閱讀的難點主要在於三點:一是漢字數量龐大, 對於英語基礎組成的26個字母, 中文常用漢字約有3500個;二是分詞, 中文沒有天然的分詞界限, 如何分詞影響詞頻, 進而關係到難度的定義;三是句法, 中文句法結構隨性, 增加了分析難度。

考慮到使用傳統語言學加統計學的方法需要大量的時間、人力和物力, 享閱教育通過機器學習的方式搭建中文閱讀分級標準。

解決這一技術難題, 依賴於享閱教育一支極為“性感”的核心技術團隊, CTO任易博士畢業于北京大學, 曾在IBM、搜狐大資料部門和微軟亞洲研究院工作, 有多年資料採擷經驗,

首席資料科學家Jake Zhao, 師從人工智慧“大牛”Yann LeCun教授。

目前, 享閱教育已構建起自己的中文分級量化標準(ER Framework), 從字詞句段篇五個維度, 以及下面更細分的幾十維特徵, 對中文文本進行分級。

基於底層技術, 享閱教育目前有3款產品:閱讀能力測評、考拉閱讀和中文分級閱讀標準。 目前, 公司的商業模式主要是To B, 為學校提供以上3款產品:閱讀能力測評面向學生, 提供測評和結果分析報告;考拉閱讀包括學生端、家長端、教師端和校長端, 教師可以通過軟體為學生佈置個性化的閱讀任務, 學生線上上或線下閱讀、通過軟體完成練習並留下學習資料;中文分級閱讀標準則是所有產品的基礎。 目前, To B產品根據使用者數按年收費。 建立起品牌背書後,

公司也將向C端拓展。

相對於國內, 美國分級閱讀市場已經十分成熟, 其原因主要在於三點, 一是社會對於閱讀的重視程度較高, 二是技術積累, 例如被廣泛使用的藍思分級標準已經有30年積累, 三是英文的特點和語言學研究積累。 據趙梓淳介紹, Renaissance, Newsela和Lightsail等公司都已經得到市場認可。

隨著用戶意識轉變, 中文分級閱讀市場將逐漸走向成熟, 而自主搭建了底層標準的考拉閱讀, 已經在市場中占得先機。

趙梓淳先後在芝加哥大學和哥倫比亞大學獲得碩士學位, 是連續創業者。 近日, 趙梓淳和愛分析分享了對行業和公司商業模式的思考, 現節選部分內容, 供大家參考。

愛分析:創業之初, 對市場如何判斷?

趙梓淳:閱讀在美國是特別大的產業, 無論重視程度還是產業支持都很好, 其中分級閱讀領域比較亮眼的公司有Renaissance, Newsela和Lightsail。

Renaissance1984年成立, 曾拿到Google Capital的4000萬美金融資, 2014年以10億美金被收購。 公司產品線很豐富, 有用於測評的Star Assessment, 通過20-30分鐘的測試, 將孩子的閱讀能力量化, 判定問題所在, 用資料驅動教育發展;有承接測評產品的Accelerated Reader,

通過他們自己的一套分級體系測出文本閱讀難度, 與之前測評的學生閱讀能力匹配, 保證學生讀到最適合自己的文字。

Newsela做新聞分級閱讀, B輪是紮克伯格投資, 累計融資2600萬美金。 公司的底層標準是用藍思分級, 核心技術點是有一部分機器輔助新聞改寫, 同樣的主題以不同的閱讀難度提供給相應理解能力的孩子;產品大概已經覆蓋美國70%以上的公立學校, 每所學校收取4000-7000美金。

Lightsail做iPad端的個性化圖書館, B輪是亞馬遜創始人Bezos投資, 累計融資超過4000萬美金。 它也是基於藍思分級, 可以線上看書是跟其他機構最大的區別;在中國通常是跟相對高端的輔導班以及國際學校合作。

在美國, 分級閱讀市場其實已經很成熟。 相比來看,國內之前有公司在做分級閱讀,但是沒做起來,這條賽道基本上沒有開啟。

因為無論什麼樣的公司做,其實背後都要有底層標準做支撐,去評估、測量出文本閱讀難度。國內遲遲沒有開展,是因為缺乏中文閱讀評級標準。

愛分析:這個難點在哪?

趙梓淳:首先最大的問題是中文太複雜,傳統統計學加語言學的方法有些無能為力。

第一方面是漢字數量多,英語基礎組成是26個字母,但中文最常用漢字大概3500個,中華辭海收錄的漢字超過8萬個,這導致了複雜構成的稀缺性,使我們分析漢語的時候需要更龐大的語料庫。

第二方面是分詞,英語有天然的分詞界限,但中文其實是模糊的,如何分詞會極大影響最後對難度的理解。

協力廠商面是句法,英語句式有先行詞和嚴謹的句法結構,更便於分析語法樹和嵌套深度等,但中文其實很鬆散,結構很隨性,這都導致了更大的分析難度。

當時跟很多教授溝通,他們說如果用傳統統計學加語言學的方法做這件事情,大概需要10-20年。

愛分析:考拉閱讀是怎麼做的?

趙梓淳:我跟合夥人任易博士在做這件事的時候,也受到Google Translation的一些啟發,通過機器學習來實現。因為直接用深度學習的問題在於沒有那麼大量的資料,從語料庫到學生行為資料等,國內都是一片空白,其實整個都是我們在搭建。

首先,我們打造了大概幾百萬字的非平衡語料庫,主要取材于各種語文教材。語言學家洪明教授和來自人民日報的十幾個人組成的標注團隊,從字詞句段篇五個維度、幾十維特徵,給文本進行標注。

第二步,用機器學習方法去學習這個語料庫中專家打標籤的規則,其實這也得益於現在技術的發展,現在有大概處理了幾億次的一個平衡語料庫。

再下一步要得出分數,像英語主要考察詞頻和句長兩個特徵,它們用手寫規則就可以得出公式,但在中文裡這兩點其實都不太靠譜,所以我們最後需要幾十維特徵來表徵中文的閱讀難度,把大概將近五十維的特徵,擬合進AI系統,最後得出從200-1300ER的分值。

隨著產品層面的資料越來越多,可以反向校準這個標準,類似於AlphaGo,實現自我進化。

這也是我們這套系統相比于英文分級系統的一大優勢。

愛分析:K12領域做語文的比較少,是不是也是因為這個技術原因?

趙梓淳:對,K12主要做的就是數學和英語,因為語文無從抓起,沒有任何的抓手,傳統的話或者是線下培訓班,或者是為語文老師提供教案、視頻或微課等。但如何通過資料驅動語文教育,提升閱讀能力,其實是沒有先例的。

我們在做的,就是將本沒有被收集的海量語文學習資料進行捕捉、整合以及分析,把語文學習變成自我調整學習的過程。

愛分析:現在考拉閱讀的分級系統進展如何?

趙梓淳:現在我們打造出了第一套中文分級量化標準,與Yann LeCun教授等行業內專家溝通過,大概可以達到93%的精度。

愛分析:給學校提供的產品包括哪些?

趙梓淳:首先就是考拉測評,從各個維度考察孩子的閱讀能力,生成測評報告提供給學校、班級和老師。

我們現在測評了將近十萬名學生,覆蓋一線城市到四線城市,得到了中國學生閱讀能力第一份量表。我們不但能測出學生的閱讀能力水準,還能測出背後哪個技能點有欠缺。

愛分析:對孩子的測評結果如何與文本分級標準對應?

趙梓淳:需要用數學模型,將兩者擬合進一個體系,使測評分值和ER值對應。同時,還需要大量的實證性研究。

這部分驗證研究是測量心理學專業的李國超博士負責。學界做分級閱讀主要是認知心理學和語言學專業的人,認知心理學其實一直在做這件事情,之前主要研究方向是測孩子的閱讀認知障礙,以及對其的干預,設計各種實驗測量信度、效度等。

愛分析:進校產品在測評之外還有?

趙梓淳:考拉閱讀,包括學生端、教師端、家長端和校長端四個埠。

通過老師端,老師可以根據每個人的最適發展趨勢一鍵佈置閱讀任務。目前考拉閱讀有幾千本課外書,每本書後面有30-100道題目,驗證學生是否讀懂。另外還有朗讀任務,幫孩子糾正讀音。

公司的人工智慧主要應用在三個層面,一是打造底層分級標準,二是自我調整學習系統,就是學生端的自學功能,根據閱讀能力推薦相應內容,三是智慧語音,在老師和家長沒那麼多時間的情況下,説明孩子解決讀音問題。

愛分析:基於現在的產品體系,對於商業模式有哪些規劃?

趙梓淳:首先是To B,通過To B建立品牌背書;To B站穩後,這條賽道基本就關閉了。

第二步是2C,我們其實是天然適合2C的,閱讀產品並不像背單詞和學數學,孩子每天晚上要聽睡前故事,是客觀存在的場景。如何讓閱讀變得更有樂趣,讓孩子讀到他們能讀懂的東西,獲得成就感,從而建立激勵體系,這是我們要做的事情。

相比來看,國內之前有公司在做分級閱讀,但是沒做起來,這條賽道基本上沒有開啟。

因為無論什麼樣的公司做,其實背後都要有底層標準做支撐,去評估、測量出文本閱讀難度。國內遲遲沒有開展,是因為缺乏中文閱讀評級標準。

愛分析:這個難點在哪?

趙梓淳:首先最大的問題是中文太複雜,傳統統計學加語言學的方法有些無能為力。

第一方面是漢字數量多,英語基礎組成是26個字母,但中文最常用漢字大概3500個,中華辭海收錄的漢字超過8萬個,這導致了複雜構成的稀缺性,使我們分析漢語的時候需要更龐大的語料庫。

第二方面是分詞,英語有天然的分詞界限,但中文其實是模糊的,如何分詞會極大影響最後對難度的理解。

協力廠商面是句法,英語句式有先行詞和嚴謹的句法結構,更便於分析語法樹和嵌套深度等,但中文其實很鬆散,結構很隨性,這都導致了更大的分析難度。

當時跟很多教授溝通,他們說如果用傳統統計學加語言學的方法做這件事情,大概需要10-20年。

愛分析:考拉閱讀是怎麼做的?

趙梓淳:我跟合夥人任易博士在做這件事的時候,也受到Google Translation的一些啟發,通過機器學習來實現。因為直接用深度學習的問題在於沒有那麼大量的資料,從語料庫到學生行為資料等,國內都是一片空白,其實整個都是我們在搭建。

首先,我們打造了大概幾百萬字的非平衡語料庫,主要取材于各種語文教材。語言學家洪明教授和來自人民日報的十幾個人組成的標注團隊,從字詞句段篇五個維度、幾十維特徵,給文本進行標注。

第二步,用機器學習方法去學習這個語料庫中專家打標籤的規則,其實這也得益於現在技術的發展,現在有大概處理了幾億次的一個平衡語料庫。

再下一步要得出分數,像英語主要考察詞頻和句長兩個特徵,它們用手寫規則就可以得出公式,但在中文裡這兩點其實都不太靠譜,所以我們最後需要幾十維特徵來表徵中文的閱讀難度,把大概將近五十維的特徵,擬合進AI系統,最後得出從200-1300ER的分值。

隨著產品層面的資料越來越多,可以反向校準這個標準,類似於AlphaGo,實現自我進化。

這也是我們這套系統相比于英文分級系統的一大優勢。

愛分析:K12領域做語文的比較少,是不是也是因為這個技術原因?

趙梓淳:對,K12主要做的就是數學和英語,因為語文無從抓起,沒有任何的抓手,傳統的話或者是線下培訓班,或者是為語文老師提供教案、視頻或微課等。但如何通過資料驅動語文教育,提升閱讀能力,其實是沒有先例的。

我們在做的,就是將本沒有被收集的海量語文學習資料進行捕捉、整合以及分析,把語文學習變成自我調整學習的過程。

愛分析:現在考拉閱讀的分級系統進展如何?

趙梓淳:現在我們打造出了第一套中文分級量化標準,與Yann LeCun教授等行業內專家溝通過,大概可以達到93%的精度。

愛分析:給學校提供的產品包括哪些?

趙梓淳:首先就是考拉測評,從各個維度考察孩子的閱讀能力,生成測評報告提供給學校、班級和老師。

我們現在測評了將近十萬名學生,覆蓋一線城市到四線城市,得到了中國學生閱讀能力第一份量表。我們不但能測出學生的閱讀能力水準,還能測出背後哪個技能點有欠缺。

愛分析:對孩子的測評結果如何與文本分級標準對應?

趙梓淳:需要用數學模型,將兩者擬合進一個體系,使測評分值和ER值對應。同時,還需要大量的實證性研究。

這部分驗證研究是測量心理學專業的李國超博士負責。學界做分級閱讀主要是認知心理學和語言學專業的人,認知心理學其實一直在做這件事情,之前主要研究方向是測孩子的閱讀認知障礙,以及對其的干預,設計各種實驗測量信度、效度等。

愛分析:進校產品在測評之外還有?

趙梓淳:考拉閱讀,包括學生端、教師端、家長端和校長端四個埠。

通過老師端,老師可以根據每個人的最適發展趨勢一鍵佈置閱讀任務。目前考拉閱讀有幾千本課外書,每本書後面有30-100道題目,驗證學生是否讀懂。另外還有朗讀任務,幫孩子糾正讀音。

公司的人工智慧主要應用在三個層面,一是打造底層分級標準,二是自我調整學習系統,就是學生端的自學功能,根據閱讀能力推薦相應內容,三是智慧語音,在老師和家長沒那麼多時間的情況下,説明孩子解決讀音問題。

愛分析:基於現在的產品體系,對於商業模式有哪些規劃?

趙梓淳:首先是To B,通過To B建立品牌背書;To B站穩後,這條賽道基本就關閉了。

第二步是2C,我們其實是天然適合2C的,閱讀產品並不像背單詞和學數學,孩子每天晚上要聽睡前故事,是客觀存在的場景。如何讓閱讀變得更有樂趣,讓孩子讀到他們能讀懂的東西,獲得成就感,從而建立激勵體系,這是我們要做的事情。

同類文章
Next Article
喜欢就按个赞吧!!!
点击关闭提示