繞坑走！細數神經網路的弊端和缺點

目前，深度學習受到大規模的炒作，人們恨不得在各個地方都使用神經網路，但確實在每一個地方都適用麼？我們將在下面的章節中進行討論，閱讀完它後，您將知道神經網路的主要缺點，並且當您為當前的機器學習問題選擇正確類型的演算法時，您將有一個粗略的指導原則。您還將瞭解我們現在面臨的機器學習中的主要問題。

為什麼深度學習受到炒作？（資料，計算能力，演算法，市場行銷）

神經網路與傳統演算法（黑盒子，開發持續時間，資料量，計算成本昂貴）

概要

結論

為什麼深度學習受到炒作？

深度學習有目前正在進行炒作的四個主要原因，包括資料、計算能力、演算法本身和市場行銷。我們將在下面的章節中討論它們中的每一個。

1.資料

增加深度學習的受歡迎程度的一個因素是2018年可用的大量資料，這些資料是在過去幾年和幾十年中收集的。

這使得神經網路能夠真正發揮他們的潛力，因為他們獲得的資料越多越好。

相比之下，傳統的機器學習演算法肯定會達到一個水準，更多的資料不會提高其性能。下面的圖表說明了這一點：

2.計算能力

另一個非常重要的原因是現在可用的計算能力，

這使我們能夠處理更多的資料。根據人工智慧的領先人物Ray Kurzweil的說法，計算能力在每個時間單位會乘以一個常數因數（例如，每年增加一倍），而不是逐漸增加。這意味著計算能力呈指數增長。

3.演算法

提高Deep Learning流行度的第三個因素是演算法本身的進步。演算法開發中的出現最近的突破主要是由於使它們比以前運行得更快，這使得使用越來越多的資料成為可能。

4.行銷

行銷可能也是一個很重要的因素。神經網路幾十年來（第一次在1944年提出），已經經歷了一些炒作，但過去處於沒有人想相信和投資的時代。 “深度學習”這個片語給了它一個新的花哨的名字，這使得新的炒作成為可能，這也是許多人錯誤地認為深度學習是一個新創造的領域的原因。

此外，其他因素也促成了深度學習的行銷，例如漢森機器人技術的“人形”機器人Sophia，在大眾中引起了廣泛的爭議，以及機器學習主要領域的幾項突破，使其成為大眾媒體等等。

神經網路與傳統演算法

當你應該使用神經網路或傳統的機器學習演算法，這是一個難以回答的問題，因為它很大程度上取決於你試圖解決的問題。這也是由於“沒有免費的午餐定理”，它大致表明沒有“完美”的機器學習演算法，在任何問題上都能表現出色。對於每一個問題，一個特定的方法是適合的，能取得良好的效果，而另一種方法或許會失敗，但這可能是機器學習最有趣的部分之一。

這也是您需要精通幾種演算法的原因，

以及為什麼通過練習獲得優秀機器學習工程師或資料科學家的較好的方法。在這篇文章中會為您提供一些指導方針，幫助您更好地理解何時應使用哪種類型的演算法。

神經網路的主要優勢在於其幾乎超越了其他所有機器學習演算法的能力，但是這有一些缺點，我們將在本文中討論並重點關注。就像我之前提到的那樣，決定是否應該使用深度學習主要取決於您正在嘗試解決的問題。例如，在癌症檢測中，高性能至關重要，因為性能越好，可以治療的人越多。但也有機器學習問題，傳統的演算法提供的不僅僅是滿意的結果。

1.黑盒子

神經網路最為人所知的缺點可能就是它們的“黑盒子”性質，這意味著你不知道神經網路如何以及為什麼會產生一定的輸出。例如，當你將一張貓的圖像放入神經網路，並預測它是一輛汽車時，很難理解是什麼導致它產生這個預測。當你具有人類可解釋的特徵時，理解其錯誤的原因要容易得多。在比較中，像決策樹這樣的演算法是非常容易理解的。這很重要，因為在某些領域，可解釋性非常重要。

這就是為什麼很多銀行不使用神經網路來預測一個人是否有信譽，因為他們需要向客戶解釋為什麼他們沒有獲得貸款。否則，這個人可能會覺得受到銀行的錯誤威脅，因為他不明白他為什麼沒有獲得貸款，這可能導致他改變對該銀行的看法，像Quora這樣的網站也是如此。如果他們因為機器學習演算法而決定刪除使用者帳戶，他們需要向使用者解釋為什麼他們已經完成了它。我懷疑他們是否會滿意電腦所給的答案。

在機器學習的推動下，其他情景將是重要的商業決策。你能想像一個大公司的首席執行官會在不明白為什麼應該完成的情況下做出價值數百萬美元的決定嗎？僅僅因為“電腦”說他需要這樣做。

2.開發持續時間

儘管像Keras這樣的庫使得神經網路的開發非常簡單，但是有時您需要更多地控制演算法的細節，例如，當您試圖解決機器學習中的難題時。

然後你可能會使用Tensorflow，它為你提供了更多的機會，但因為它也更複雜，開發需要更長的時間（取決於你想要構建的）。那麼對於公司管理層來說，如果真的值得他們昂貴的工程師花費數周時間來開發一些東西，那麼問題就會出現，用更簡單的演算法可以更快地解決問題。

3.資料量

與傳統的機器學習演算法相比，神經網路通常需要更多的資料，至少有數千甚至數百萬個標記樣本。這不是一個容易解決的問題，如果使用其他演算法，許多機器學習問題可以用較少的資料很好地解決。

儘管有些情況下神經網路很少處理資料，但大多數情況下他們不處理。在這種情況下，像樸素貝葉斯這樣的簡單演算法可以很好地處理少數資料。

4.計算昂貴

通常，神經網路比傳統演算法在計算上更昂貴。最先進的深度學習演算法，實現真正深度的神經網路的成功訓練，可能需要幾周時間才能完全從頭開始進行訓練。大多數傳統的機器學習演算法花費的時間少於幾分鐘到幾個小時或幾天。

神經網路所需的計算能力很大程度上取決於資料的大小，但也取決於網路的深度和複雜程度。例如，具有一層和50個神經元的神經網路將比具有1000棵樹的隨機森林快得多。相比之下，具有50層的神經網路將比僅有10棵樹的隨機森林慢得多。

概要

現在你可能會知道神經網路對於某些任務比較適用，但對其他人來說並不一定適用。您瞭解到，大量的資料、更多的計算能力、更好的演算法和智慧行銷增加了深度學習的受歡迎程度，並使其成為目前最熱門的領域之一。最重要的是，您已經瞭解到，神經網路幾乎可以擊敗所有其他機器學習演算法以及與之相伴隨的缺點。最大的缺點是它們的“黑盒子”性質，增加開發時間（取決於您的問題）、所需的資料量以及它們大部分計算成本高昂。

結論

深度學習目前可能仍舊有點過度炒作的情況，並且超過期望完成的事情。但這並不意味著它沒有用處。我認為我們生活在機器學習復興中，因為它越來越民主化，越來越多的人可以用它來構建有用的產品。機器學習可以解決很多問題，我相信這將在未來幾年內發生。

其中一個主要問題是只有少數人瞭解可以用它做些什麼，並知道如何建立成功的資料科學團隊，為公司帶來真正的價值。一方面，我們擁有博士級工程師，他們是機器學習背後的理論天才，但可能缺乏對商業方面的理解。另一方面，我們有首席執行官和管理職位的人員，他們不知道深度學習可以做些什麼，並認為它將在未來幾年解決所有問題。我們需要更多的人來填補這個空白，這將產生更多對我們社會有用的產品。

2.開發持續時間

儘管像Keras這樣的庫使得神經網路的開發非常簡單，但是有時您需要更多地控制演算法的細節，例如，當您試圖解決機器學習中的難題時。

3.資料量

儘管有些情況下神經網路很少處理資料，但大多數情況下他們不處理。在這種情況下，像樸素貝葉斯這樣的簡單演算法可以很好地處理少數資料。

4.計算昂貴

概要

結論