有了Python+Tensorflow！所有驗證碼識別都能快人一步！快速識別

驗證碼分析和處理

網上搜索驗證碼識別能夠得到很多教程，但大部分都是將驗證碼切割成單個字元訓練，有時候驗證碼字元大小不一或者發生重疊，

切割驗證碼變得不適用。因此通過CNN技術將整塊驗證碼進行識別，能使問題變得更加簡單（以下操作對其他驗證碼分析有參考作用）。小編推薦大家加一下這個群：103456743這個群裡好幾千人了！大家遇到啥問題都會在裡面交流！而且免費分享零基礎入門料資料web開發爬蟲資料一整套！是個非常好的學習交流地方！也有程式師大神給大家熱心解答各種問題！很快滿員了。欲進從速哦！各種PDF等你來下載！全部都是免費的哦！只為幫助大家快速入門，所以小編在群裡等你們過來一起交流學習呢！

在這裡我們選擇模擬學習這樣的驗證碼：

該驗證碼來源於這裡（正如sci-hub網站所言"to remove all barriers in the way of science"，知識就該如此）。

該驗證碼只由六位元小寫字母、噪點和干擾線組成，

如果能去除噪點和干擾線，能夠大大降低學習的難度。很多驗證碼的噪點和干擾線RGB值和字母的不一致，這個我們能通過Photoshop來分析，使用顏色取樣器工具，分別在圖片噪點、干擾線、空白處和字母處點擊獲得RGB值，如下圖：

分析後發現，只要將圖片二值化只保留字母，就能得到不錯的輸入圖片：

實現代碼如下：