調研 | 張揚 東起
撰寫 | 東起
2016年成立的享閱教育選擇了一條新賽道——中文分級閱讀。
中文分級閱讀賽道幾乎還沒有開啟, 其中一個主要原因在於中文本身的複雜程度,
考慮到使用傳統語言學加統計學的方法需要大量的時間、人力和物力, 享閱教育通過機器學習的方式搭建中文閱讀分級標準。
解決這一技術難題, 依賴於享閱教育一支極為“性感”的核心技術團隊, CTO任易博士畢業于北京大學, 曾在IBM、搜狐大資料部門和微軟亞洲研究院工作, 有多年資料採擷經驗,
目前, 享閱教育已構建起自己的中文分級量化標準(ER Framework), 從字詞句段篇五個維度, 以及下面更細分的幾十維特徵, 對中文文本進行分級。
基於底層技術, 享閱教育目前有3款產品:閱讀能力測評、考拉閱讀和中文分級閱讀標準。 目前, 公司的商業模式主要是To B, 為學校提供以上3款產品:閱讀能力測評面向學生, 提供測評和結果分析報告;考拉閱讀包括學生端、家長端、教師端和校長端, 教師可以通過軟體為學生佈置個性化的閱讀任務, 學生線上上或線下閱讀、通過軟體完成練習並留下學習資料;中文分級閱讀標準則是所有產品的基礎。 目前, To B產品根據使用者數按年收費。 建立起品牌背書後,
相對於國內, 美國分級閱讀市場已經十分成熟, 其原因主要在於三點, 一是社會對於閱讀的重視程度較高, 二是技術積累, 例如被廣泛使用的藍思分級標準已經有30年積累, 三是英文的特點和語言學研究積累。 據趙梓淳介紹, Renaissance, Newsela和Lightsail等公司都已經得到市場認可。
隨著用戶意識轉變, 中文分級閱讀市場將逐漸走向成熟, 而自主搭建了底層標準的考拉閱讀, 已經在市場中占得先機。
趙梓淳先後在芝加哥大學和哥倫比亞大學獲得碩士學位, 是連續創業者。 近日, 趙梓淳和愛分析分享了對行業和公司商業模式的思考, 現節選部分內容, 供大家參考。
愛分析:創業之初, 對市場如何判斷?
趙梓淳:閱讀在美國是特別大的產業, 無論重視程度還是產業支持都很好, 其中分級閱讀領域比較亮眼的公司有Renaissance, Newsela和Lightsail。
Renaissance1984年成立, 曾拿到Google Capital的4000萬美金融資, 2014年以10億美金被收購。 公司產品線很豐富, 有用於測評的Star Assessment, 通過20-30分鐘的測試, 將孩子的閱讀能力量化, 判定問題所在, 用資料驅動教育發展;有承接測評產品的Accelerated Reader,
Newsela做新聞分級閱讀, B輪是紮克伯格投資, 累計融資2600萬美金。 公司的底層標準是用藍思分級, 核心技術點是有一部分機器輔助新聞改寫, 同樣的主題以不同的閱讀難度提供給相應理解能力的孩子;產品大概已經覆蓋美國70%以上的公立學校, 每所學校收取4000-7000美金。
Lightsail做iPad端的個性化圖書館, B輪是亞馬遜創始人Bezos投資, 累計融資超過4000萬美金。 它也是基於藍思分級, 可以線上看書是跟其他機構最大的區別;在中國通常是跟相對高端的輔導班以及國際學校合作。
在美國, 分級閱讀市場其實已經很成熟。 相比來看,國內之前有公司在做分級閱讀,但是沒做起來,這條賽道基本上沒有開啟。
因為無論什麼樣的公司做,其實背後都要有底層標準做支撐,去評估、測量出文本閱讀難度。國內遲遲沒有開展,是因為缺乏中文閱讀評級標準。
愛分析:這個難點在哪?
趙梓淳:首先最大的問題是中文太複雜,傳統統計學加語言學的方法有些無能為力。
第一方面是漢字數量多,英語基礎組成是26個字母,但中文最常用漢字大概3500個,中華辭海收錄的漢字超過8萬個,這導致了複雜構成的稀缺性,使我們分析漢語的時候需要更龐大的語料庫。
第二方面是分詞,英語有天然的分詞界限,但中文其實是模糊的,如何分詞會極大影響最後對難度的理解。
協力廠商面是句法,英語句式有先行詞和嚴謹的句法結構,更便於分析語法樹和嵌套深度等,但中文其實很鬆散,結構很隨性,這都導致了更大的分析難度。
當時跟很多教授溝通,他們說如果用傳統統計學加語言學的方法做這件事情,大概需要10-20年。
愛分析:考拉閱讀是怎麼做的?
趙梓淳:我跟合夥人任易博士在做這件事的時候,也受到Google Translation的一些啟發,通過機器學習來實現。因為直接用深度學習的問題在於沒有那麼大量的資料,從語料庫到學生行為資料等,國內都是一片空白,其實整個都是我們在搭建。
首先,我們打造了大概幾百萬字的非平衡語料庫,主要取材于各種語文教材。語言學家洪明教授和來自人民日報的十幾個人組成的標注團隊,從字詞句段篇五個維度、幾十維特徵,給文本進行標注。
第二步,用機器學習方法去學習這個語料庫中專家打標籤的規則,其實這也得益於現在技術的發展,現在有大概處理了幾億次的一個平衡語料庫。
再下一步要得出分數,像英語主要考察詞頻和句長兩個特徵,它們用手寫規則就可以得出公式,但在中文裡這兩點其實都不太靠譜,所以我們最後需要幾十維特徵來表徵中文的閱讀難度,把大概將近五十維的特徵,擬合進AI系統,最後得出從200-1300ER的分值。
隨著產品層面的資料越來越多,可以反向校準這個標準,類似於AlphaGo,實現自我進化。
這也是我們這套系統相比于英文分級系統的一大優勢。
愛分析:K12領域做語文的比較少,是不是也是因為這個技術原因?
趙梓淳:對,K12主要做的就是數學和英語,因為語文無從抓起,沒有任何的抓手,傳統的話或者是線下培訓班,或者是為語文老師提供教案、視頻或微課等。但如何通過資料驅動語文教育,提升閱讀能力,其實是沒有先例的。
我們在做的,就是將本沒有被收集的海量語文學習資料進行捕捉、整合以及分析,把語文學習變成自我調整學習的過程。
愛分析:現在考拉閱讀的分級系統進展如何?
趙梓淳:現在我們打造出了第一套中文分級量化標準,與Yann LeCun教授等行業內專家溝通過,大概可以達到93%的精度。
愛分析:給學校提供的產品包括哪些?
趙梓淳:首先就是考拉測評,從各個維度考察孩子的閱讀能力,生成測評報告提供給學校、班級和老師。
我們現在測評了將近十萬名學生,覆蓋一線城市到四線城市,得到了中國學生閱讀能力第一份量表。我們不但能測出學生的閱讀能力水準,還能測出背後哪個技能點有欠缺。
愛分析:對孩子的測評結果如何與文本分級標準對應?
趙梓淳:需要用數學模型,將兩者擬合進一個體系,使測評分值和ER值對應。同時,還需要大量的實證性研究。
這部分驗證研究是測量心理學專業的李國超博士負責。學界做分級閱讀主要是認知心理學和語言學專業的人,認知心理學其實一直在做這件事情,之前主要研究方向是測孩子的閱讀認知障礙,以及對其的干預,設計各種實驗測量信度、效度等。
愛分析:進校產品在測評之外還有?
趙梓淳:考拉閱讀,包括學生端、教師端、家長端和校長端四個埠。
通過老師端,老師可以根據每個人的最適發展趨勢一鍵佈置閱讀任務。目前考拉閱讀有幾千本課外書,每本書後面有30-100道題目,驗證學生是否讀懂。另外還有朗讀任務,幫孩子糾正讀音。
公司的人工智慧主要應用在三個層面,一是打造底層分級標準,二是自我調整學習系統,就是學生端的自學功能,根據閱讀能力推薦相應內容,三是智慧語音,在老師和家長沒那麼多時間的情況下,説明孩子解決讀音問題。
愛分析:基於現在的產品體系,對於商業模式有哪些規劃?
趙梓淳:首先是To B,通過To B建立品牌背書;To B站穩後,這條賽道基本就關閉了。
第二步是2C,我們其實是天然適合2C的,閱讀產品並不像背單詞和學數學,孩子每天晚上要聽睡前故事,是客觀存在的場景。如何讓閱讀變得更有樂趣,讓孩子讀到他們能讀懂的東西,獲得成就感,從而建立激勵體系,這是我們要做的事情。
相比來看,國內之前有公司在做分級閱讀,但是沒做起來,這條賽道基本上沒有開啟。因為無論什麼樣的公司做,其實背後都要有底層標準做支撐,去評估、測量出文本閱讀難度。國內遲遲沒有開展,是因為缺乏中文閱讀評級標準。
愛分析:這個難點在哪?
趙梓淳:首先最大的問題是中文太複雜,傳統統計學加語言學的方法有些無能為力。
第一方面是漢字數量多,英語基礎組成是26個字母,但中文最常用漢字大概3500個,中華辭海收錄的漢字超過8萬個,這導致了複雜構成的稀缺性,使我們分析漢語的時候需要更龐大的語料庫。
第二方面是分詞,英語有天然的分詞界限,但中文其實是模糊的,如何分詞會極大影響最後對難度的理解。
協力廠商面是句法,英語句式有先行詞和嚴謹的句法結構,更便於分析語法樹和嵌套深度等,但中文其實很鬆散,結構很隨性,這都導致了更大的分析難度。
當時跟很多教授溝通,他們說如果用傳統統計學加語言學的方法做這件事情,大概需要10-20年。
愛分析:考拉閱讀是怎麼做的?
趙梓淳:我跟合夥人任易博士在做這件事的時候,也受到Google Translation的一些啟發,通過機器學習來實現。因為直接用深度學習的問題在於沒有那麼大量的資料,從語料庫到學生行為資料等,國內都是一片空白,其實整個都是我們在搭建。
首先,我們打造了大概幾百萬字的非平衡語料庫,主要取材于各種語文教材。語言學家洪明教授和來自人民日報的十幾個人組成的標注團隊,從字詞句段篇五個維度、幾十維特徵,給文本進行標注。
第二步,用機器學習方法去學習這個語料庫中專家打標籤的規則,其實這也得益於現在技術的發展,現在有大概處理了幾億次的一個平衡語料庫。
再下一步要得出分數,像英語主要考察詞頻和句長兩個特徵,它們用手寫規則就可以得出公式,但在中文裡這兩點其實都不太靠譜,所以我們最後需要幾十維特徵來表徵中文的閱讀難度,把大概將近五十維的特徵,擬合進AI系統,最後得出從200-1300ER的分值。
隨著產品層面的資料越來越多,可以反向校準這個標準,類似於AlphaGo,實現自我進化。
這也是我們這套系統相比于英文分級系統的一大優勢。
愛分析:K12領域做語文的比較少,是不是也是因為這個技術原因?
趙梓淳:對,K12主要做的就是數學和英語,因為語文無從抓起,沒有任何的抓手,傳統的話或者是線下培訓班,或者是為語文老師提供教案、視頻或微課等。但如何通過資料驅動語文教育,提升閱讀能力,其實是沒有先例的。
我們在做的,就是將本沒有被收集的海量語文學習資料進行捕捉、整合以及分析,把語文學習變成自我調整學習的過程。
愛分析:現在考拉閱讀的分級系統進展如何?
趙梓淳:現在我們打造出了第一套中文分級量化標準,與Yann LeCun教授等行業內專家溝通過,大概可以達到93%的精度。
愛分析:給學校提供的產品包括哪些?
趙梓淳:首先就是考拉測評,從各個維度考察孩子的閱讀能力,生成測評報告提供給學校、班級和老師。
我們現在測評了將近十萬名學生,覆蓋一線城市到四線城市,得到了中國學生閱讀能力第一份量表。我們不但能測出學生的閱讀能力水準,還能測出背後哪個技能點有欠缺。
愛分析:對孩子的測評結果如何與文本分級標準對應?
趙梓淳:需要用數學模型,將兩者擬合進一個體系,使測評分值和ER值對應。同時,還需要大量的實證性研究。
這部分驗證研究是測量心理學專業的李國超博士負責。學界做分級閱讀主要是認知心理學和語言學專業的人,認知心理學其實一直在做這件事情,之前主要研究方向是測孩子的閱讀認知障礙,以及對其的干預,設計各種實驗測量信度、效度等。
愛分析:進校產品在測評之外還有?
趙梓淳:考拉閱讀,包括學生端、教師端、家長端和校長端四個埠。
通過老師端,老師可以根據每個人的最適發展趨勢一鍵佈置閱讀任務。目前考拉閱讀有幾千本課外書,每本書後面有30-100道題目,驗證學生是否讀懂。另外還有朗讀任務,幫孩子糾正讀音。
公司的人工智慧主要應用在三個層面,一是打造底層分級標準,二是自我調整學習系統,就是學生端的自學功能,根據閱讀能力推薦相應內容,三是智慧語音,在老師和家長沒那麼多時間的情況下,説明孩子解決讀音問題。
愛分析:基於現在的產品體系,對於商業模式有哪些規劃?
趙梓淳:首先是To B,通過To B建立品牌背書;To B站穩後,這條賽道基本就關閉了。
第二步是2C,我們其實是天然適合2C的,閱讀產品並不像背單詞和學數學,孩子每天晚上要聽睡前故事,是客觀存在的場景。如何讓閱讀變得更有樂趣,讓孩子讀到他們能讀懂的東西,獲得成就感,從而建立激勵體系,這是我們要做的事情。