建立中文分級閱讀標準，考拉閱讀的野心不止校內市場

調研 | 張揚東起

撰寫 | 東起

2016年成立的享閱教育選擇了一條新賽道——中文分級閱讀。

中文分級閱讀賽道幾乎還沒有開啟，其中一個主要原因在於中文本身的複雜程度，

使評測體系難於建立。享閱教育創始人趙梓淳介紹，中文分級閱讀的難點主要在於三點：一是漢字數量龐大，對於英語基礎組成的26個字母，中文常用漢字約有3500個；二是分詞，中文沒有天然的分詞界限，如何分詞影響詞頻，進而關係到難度的定義；三是句法，中文句法結構隨性，增加了分析難度。

考慮到使用傳統語言學加統計學的方法需要大量的時間、人力和物力，享閱教育通過機器學習的方式搭建中文閱讀分級標準。

解決這一技術難題，依賴於享閱教育一支極為“性感”的核心技術團隊， CTO任易博士畢業于北京大學，曾在IBM、搜狐大資料部門和微軟亞洲研究院工作，有多年資料採擷經驗，

首席資料科學家Jake Zhao，師從人工智慧“大牛”Yann LeCun教授。

目前，享閱教育已構建起自己的中文分級量化標準（ER Framework），從字詞句段篇五個維度，以及下面更細分的幾十維特徵，對中文文本進行分級。

基於底層技術，享閱教育目前有3款產品：閱讀能力測評、考拉閱讀和中文分級閱讀標準。目前，公司的商業模式主要是To B，為學校提供以上3款產品：閱讀能力測評面向學生，提供測評和結果分析報告；考拉閱讀包括學生端、家長端、教師端和校長端，教師可以通過軟體為學生佈置個性化的閱讀任務，學生線上上或線下閱讀、通過軟體完成練習並留下學習資料；中文分級閱讀標準則是所有產品的基礎。目前， To B產品根據使用者數按年收費。建立起品牌背書後，

公司也將向C端拓展。

相對於國內，美國分級閱讀市場已經十分成熟，其原因主要在於三點，一是社會對於閱讀的重視程度較高，二是技術積累，例如被廣泛使用的藍思分級標準已經有30年積累，三是英文的特點和語言學研究積累。據趙梓淳介紹， Renaissance， Newsela和Lightsail等公司都已經得到市場認可。

隨著用戶意識轉變，中文分級閱讀市場將逐漸走向成熟，而自主搭建了底層標準的考拉閱讀，已經在市場中占得先機。

趙梓淳先後在芝加哥大學和哥倫比亞大學獲得碩士學位，是連續創業者。近日，趙梓淳和愛分析分享了對行業和公司商業模式的思考，現節選部分內容，供大家參考。

愛分析：創業之初，對市場如何判斷？

趙梓淳：閱讀在美國是特別大的產業，無論重視程度還是產業支持都很好，其中分級閱讀領域比較亮眼的公司有Renaissance， Newsela和Lightsail。

Renaissance1984年成立，曾拿到Google Capital的4000萬美金融資， 2014年以10億美金被收購。公司產品線很豐富，有用於測評的Star Assessment，通過20-30分鐘的測試，將孩子的閱讀能力量化，判定問題所在，用資料驅動教育發展；有承接測評產品的Accelerated Reader，

通過他們自己的一套分級體系測出文本閱讀難度，與之前測評的學生閱讀能力匹配，保證學生讀到最適合自己的文字。

Newsela做新聞分級閱讀， B輪是紮克伯格投資，累計融資2600萬美金。公司的底層標準是用藍思分級，核心技術點是有一部分機器輔助新聞改寫，同樣的主題以不同的閱讀難度提供給相應理解能力的孩子；產品大概已經覆蓋美國70%以上的公立學校，每所學校收取4000-7000美金。

Lightsail做iPad端的個性化圖書館， B輪是亞馬遜創始人Bezos投資，累計融資超過4000萬美金。它也是基於藍思分級，可以線上看書是跟其他機構最大的區別；在中國通常是跟相對高端的輔導班以及國際學校合作。

在美國，分級閱讀市場其實已經很成熟。相比來看，國內之前有公司在做分級閱讀，但是沒做起來，這條賽道基本上沒有開啟。

因為無論什麼樣的公司做，其實背後都要有底層標準做支撐，去評估、測量出文本閱讀難度。國內遲遲沒有開展，是因為缺乏中文閱讀評級標準。

愛分析：這個難點在哪？

趙梓淳：首先最大的問題是中文太複雜，傳統統計學加語言學的方法有些無能為力。

第一方面是漢字數量多，英語基礎組成是26個字母，但中文最常用漢字大概3500個，中華辭海收錄的漢字超過8萬個，這導致了複雜構成的稀缺性，使我們分析漢語的時候需要更龐大的語料庫。

第二方面是分詞，英語有天然的分詞界限，但中文其實是模糊的，如何分詞會極大影響最後對難度的理解。

協力廠商面是句法，英語句式有先行詞和嚴謹的句法結構，更便於分析語法樹和嵌套深度等，但中文其實很鬆散，結構很隨性，這都導致了更大的分析難度。

當時跟很多教授溝通，他們說如果用傳統統計學加語言學的方法做這件事情，大概需要10-20年。

愛分析：考拉閱讀是怎麼做的？

趙梓淳：我跟合夥人任易博士在做這件事的時候，也受到Google Translation的一些啟發，通過機器學習來實現。因為直接用深度學習的問題在於沒有那麼大量的資料，從語料庫到學生行為資料等，國內都是一片空白，其實整個都是我們在搭建。

首先，我們打造了大概幾百萬字的非平衡語料庫，主要取材于各種語文教材。語言學家洪明教授和來自人民日報的十幾個人組成的標注團隊，從字詞句段篇五個維度、幾十維特徵，給文本進行標注。

第二步，用機器學習方法去學習這個語料庫中專家打標籤的規則，其實這也得益於現在技術的發展，現在有大概處理了幾億次的一個平衡語料庫。

再下一步要得出分數，像英語主要考察詞頻和句長兩個特徵，它們用手寫規則就可以得出公式，但在中文裡這兩點其實都不太靠譜，所以我們最後需要幾十維特徵來表徵中文的閱讀難度，把大概將近五十維的特徵，擬合進AI系統，最後得出從200-1300ER的分值。

隨著產品層面的資料越來越多，可以反向校準這個標準，類似於AlphaGo，實現自我進化。

這也是我們這套系統相比于英文分級系統的一大優勢。

愛分析：K12領域做語文的比較少，是不是也是因為這個技術原因？

趙梓淳：對，K12主要做的就是數學和英語，因為語文無從抓起，沒有任何的抓手，傳統的話或者是線下培訓班，或者是為語文老師提供教案、視頻或微課等。但如何通過資料驅動語文教育，提升閱讀能力，其實是沒有先例的。

我們在做的，就是將本沒有被收集的海量語文學習資料進行捕捉、整合以及分析，把語文學習變成自我調整學習的過程。

愛分析：現在考拉閱讀的分級系統進展如何？

趙梓淳：現在我們打造出了第一套中文分級量化標準，與Yann LeCun教授等行業內專家溝通過，大概可以達到93%的精度。

愛分析：給學校提供的產品包括哪些？

趙梓淳：首先就是考拉測評，從各個維度考察孩子的閱讀能力，生成測評報告提供給學校、班級和老師。

我們現在測評了將近十萬名學生，覆蓋一線城市到四線城市，得到了中國學生閱讀能力第一份量表。我們不但能測出學生的閱讀能力水準，還能測出背後哪個技能點有欠缺。

愛分析：對孩子的測評結果如何與文本分級標準對應？

趙梓淳：需要用數學模型，將兩者擬合進一個體系，使測評分值和ER值對應。同時，還需要大量的實證性研究。

這部分驗證研究是測量心理學專業的李國超博士負責。學界做分級閱讀主要是認知心理學和語言學專業的人，認知心理學其實一直在做這件事情，之前主要研究方向是測孩子的閱讀認知障礙，以及對其的干預，設計各種實驗測量信度、效度等。

愛分析：進校產品在測評之外還有？

趙梓淳：考拉閱讀，包括學生端、教師端、家長端和校長端四個埠。

通過老師端，老師可以根據每個人的最適發展趨勢一鍵佈置閱讀任務。目前考拉閱讀有幾千本課外書，每本書後面有30-100道題目，驗證學生是否讀懂。另外還有朗讀任務，幫孩子糾正讀音。

公司的人工智慧主要應用在三個層面，一是打造底層分級標準，二是自我調整學習系統，就是學生端的自學功能，根據閱讀能力推薦相應內容，三是智慧語音，在老師和家長沒那麼多時間的情況下，説明孩子解決讀音問題。

愛分析：基於現在的產品體系，對於商業模式有哪些規劃？

趙梓淳：首先是To B，通過To B建立品牌背書；To B站穩後，這條賽道基本就關閉了。

第二步是2C，我們其實是天然適合2C的，閱讀產品並不像背單詞和學數學，孩子每天晚上要聽睡前故事，是客觀存在的場景。如何讓閱讀變得更有樂趣，讓孩子讀到他們能讀懂的東西，獲得成就感，從而建立激勵體系，這是我們要做的事情。

相比來看，國內之前有公司在做分級閱讀，但是沒做起來，這條賽道基本上沒有開啟。