編者按:紅點創投的投資人TOMASZ TUNGUZ日前撰文, 討論了概率論與機器學習的關係, 提出了管理用戶信任的建議。 他認為, 設置合適的使用者對系統容量的期望至關重要, 要判斷那種統計錯誤類型(這裡的“錯誤類型”是統計術語, 包括一類錯誤和二類錯誤)。
失去信任要比失去軟體的使用者或買家來得更快, 比如這個軟體沒有保存我的資料、資料庫損壞、網站安全係數頻繁下降。 資料完整性是每個公司存儲資料所面臨的挑戰。 機器學習SaaS初創企業面臨著另一種信任風險——一種以概率引入的風險。
當年, 南森預測2008年巴拉克·奧巴馬(Barack Obama)的成功選舉,
在2008年和2016年的分析中, 預測可能是正確的。 2008年的成功預測使人們對資料更加信任, 然而在2016年, 結果卻發生了變化, 預測反倒不准了。 這種現象很自然。
置信係數和2類錯誤許多機器學習系統也依賴概率。 程式師將閾值編碼到機器學習模型中, 系統使用該閾值來決定概率是否可以得出結論, 有時這被稱置信係數。 例如, 該圖像包含貓的最小概率、sacre blue 被翻譯為“哦, 我的天哪!”而不是sacre blue的概率 、高峰時間的範懷克的速度比從新澤西州到曼哈頓的帶百匯要快的概率。
在電腦系統推薦之前, 這些最小概率應該是多少? 80%? 90%? 95%? 增加概率和減少誤報數量或類型1錯誤。 這樣您在搜索貓時, 結果中出現貓鼬的數量就會更少。
但是, 過多的增加信任閾值會引起類型2錯誤。 有可能系統斷言圖像不包含貓, 但經過進一步的檢查, 你可以看到有一個有貓的圖片。
如何管理這種風險機器學習SaaS公司必須找到平衡。 讓機器學習系統可以合理的寬鬆、適當的嚴格。 如果產品掉到一個極端, 產品可能會失去使用者的信任, 最終失去業務。
如何最好地管理這種風險?聊天機器人surge告訴我“人/機器人”交互的一個原則。 設置合適的使用者對系統容量的期望至關重要。 低估和超額投放都會導致不信任。
第二種方法是確定哪種類型的錯誤對使用者更為有利。
這些下一代機器學習產品都將依賴于使用者信任的建立。 在某些時候, 這些產品必須明確什麼時候的概率足夠好, 才能將行銷預算轉移到新的廣告系列, 分類圖片, 翻譯, 分類垃圾郵件或升級錯誤。
這類產品決定選擇一定要謹慎。 ML系統的信心得分直接關係到使用者對產品的信任程度。