崗位職責:
1、 負責調研和收集互聯網可採集的資料範圍;
2、 負責資料獲取、資料傳輸等的架構設計和代碼程式設計等工作。
3、 參與整體運營方案, 負責資料獲取、清洗、關聯分析及資料庫設計部分;
4、 負責公司資料中心的運營和維護;
崗位要求:
1、精通互聯網資料獲取如網路爬蟲技術等的機制和原理;
2、精通Python, 熟悉多執行緒程式設計、網路通信程式設計和分散式資料處理, 熟悉各種常用的文本處理工具集/科學計算工具包/機器學習資料採擷工具包;
3、精通Scrapy或其他爬蟲框架, 並可基於其做智慧爬蟲開發;
4、熟悉垂直搜尋引擎設計,
5、熟悉MySQL、Oracle、HBase等主流資料庫並熟練使用其中的一種, 編寫SQL語句和存儲過程或shell;
6、有過大型專案垂直搜尋引擎設計或智慧爬蟲(機器學習)開發經驗者優先;
7、具有較強的工作計劃性和實施執行能力, 服從安排, 能夠適應較大工作壓力;
8、做事認真有效率, 有耐心;
9、學習能力強, 善於分析、思考問題。