【崗位職責(zé)】
1、對指定的網(wǎng)站進(jìn)行網(wǎng)頁抓取、數(shù)據(jù)提取、破解反爬策略;
2、負(fù)責(zé)多平臺信息抽取、數(shù)據(jù)清洗、入庫、服務(wù)化等研發(fā)和優(yōu)化工作;
3、參與開發(fā)和設(shè)計分布式網(wǎng)絡(luò)爬蟲系統(tǒng),進(jìn)行信息的抓取和分析工作;
4、研究優(yōu)化爬蟲算法,提升爬蟲系統(tǒng)的穩(wěn)定性、可擴展性;
5、獨立解決實際開發(fā)過程中碰到的各類產(chǎn)品數(shù)據(jù)需求和接口問題。
【任職要求】
1、計算機相關(guān)專業(yè)??苹蛞陨蠈W(xué)歷,3年以上相關(guān)工作經(jīng)驗;
2、精通Python 語言,精通scrapy或者其他常見開源爬蟲框架;;
3、精通Charles等抓包工具,精通網(wǎng)頁抓取原理及技術(shù),精通正則表達(dá)式,熟練從結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)中獲取信息;
4、對于常見網(wǎng)站的反爬技術(shù)如js加密混淆等有分析應(yīng)用,對于app有一定的分析經(jīng)驗;
5、精通 selenium 、DrissionPage 等自動化抓取技術(shù);
6、熟悉破解網(wǎng)站驗證碼、繞過機器人檢測、APP脫殼、APP逆向反編譯等技術(shù);
7、熟練使用Mysql/MongoDB/Redis者優(yōu)先;
8、責(zé)任感強、有較強的邏輯思維能力、溝通能力、抗壓能力,對解決挑戰(zhàn)性問題充滿熱情,具有良好的團隊合作精神和敬業(yè)精神;
9、有海外站點實操經(jīng)驗者優(yōu)先;
【其它】
薪資可面談,根據(jù)能力而定。