崗位職責(zé):
1.前沿模型研發(fā)與架構(gòu)設(shè)計:主導(dǎo)AI大語言模型(參數(shù)規(guī)?!?00億)、多模態(tài)模型(支持文本、圖像、語音等≥3種模態(tài)融合)的架構(gòu)設(shè)計,需基于Transformer架構(gòu)完成網(wǎng)絡(luò)層優(yōu)化,使模型在GLUE、SuperCLUE等權(quán)威測評基準(zhǔn)上,關(guān)鍵指標(biāo)達(dá)到行業(yè)前10%水平。全面負(fù)責(zé)模型訓(xùn)練,掌握分布式訓(xùn)練技術(shù)(如數(shù)據(jù)并行、模型并行、流水并行),能針對訓(xùn)練過程中的梯度消失、顯存不足等問題,通過混合精度訓(xùn)練、優(yōu)化器改進(jìn)(如AdaFactor、RAdam)等策略提升訓(xùn)練效率30%以上。
2.行業(yè)場景落地與應(yīng)用創(chuàng)新:針對電商推薦、智能客服等核心業(yè)務(wù),基于公司業(yè)務(wù)場景數(shù)據(jù)(日均處理數(shù)據(jù)量≥10TB),設(shè)計AI算法解決方案。在電商推薦領(lǐng)域,通過優(yōu)化排序模型(如基于Transformer的DeepInterestNetwork變體),實現(xiàn)用戶點擊率提升15%;在智能客服場景,開發(fā)對話策略模型,使客服問題解決率提高20%,并輸出技術(shù)方案文檔及ROI分析報告。
3.全流程算法工程化與部署:統(tǒng)籌數(shù)據(jù)收集、清洗、標(biāo)注全流程,確保數(shù)據(jù)質(zhì)量(標(biāo)注準(zhǔn)確率≥95%),構(gòu)建高效數(shù)據(jù)預(yù)處理流水線。負(fù)責(zé)模型在云端(如AWS、阿里云)、邊緣端(NVIDIAJetson系列等硬件平臺)的部署,使用TensorRT、ONNXRuntime等推理加速框架,將模型推理延遲降低50%以上,實現(xiàn)模型服務(wù)的高并發(fā)(支持QPS≥10000)與高可用(SLA≥99.9%)。
4.技術(shù)團隊引領(lǐng)與協(xié)作:帶領(lǐng)10人以上算法團隊,制定技術(shù)規(guī)劃與項目里程碑,定期開展技術(shù)分享與代碼評審,提升團隊整體技術(shù)水平。與產(chǎn)品團隊協(xié)作完成需求分析,將業(yè)務(wù)需求轉(zhuǎn)化為可執(zhí)行的技術(shù)方案;與工程團隊配合解決模型部署中的技術(shù)難題,保障項目按時交付。
5.技術(shù)趨勢追蹤與創(chuàng)新推動:每周產(chǎn)出AI技術(shù)動態(tài)報告,梳理NeurIPS、ICML等頂會最新成果,篩選3-5項可應(yīng)用于公司業(yè)務(wù)的新技術(shù)。每季度主導(dǎo)至少1次內(nèi)部技術(shù)研討會,推動新技術(shù)在公司的落地驗證,每年申請≥3項AI相關(guān)技術(shù)專利或軟著。
任職資格要求:
1.基本要求:大學(xué)本科及以上學(xué)歷,至少具備基本要求中的2項,且至少具備(1)和(2)中的一項。
(1)博士研究生學(xué)歷(學(xué)歷和學(xué)位雙證);
(2)國家級科技人才(獲得國家授予的科技人才榮譽稱號)或知名互聯(lián)網(wǎng)公司、知名科技領(lǐng)先企業(yè)、大型科研院所、行業(yè)頭部企業(yè)等機構(gòu)中重要技術(shù)團隊負(fù)責(zé)人或主要技術(shù)負(fù)責(zé)人;
(3)具有3個科創(chuàng)類百萬級重大項目成功經(jīng)驗;
(4)從事過國家級發(fā)展規(guī)劃中新一代信息通信、人工智能、大數(shù)據(jù)等前沿領(lǐng)域和解決“卡脖子”技術(shù)問題;
(5)承擔(dān)過省級及以上重大創(chuàng)新項目、重大科技攻關(guān),并取得一定科研成果;
(6)牽頭研發(fā)的科研項目取得重大實踐成果,多次在國家或行業(yè)榮獲獎項。
2.專業(yè)要求:計算機類、電子信息類、數(shù)學(xué)類相關(guān)專業(yè)。
3.其他任職資格要求:
(1)8年以上AI算法研發(fā)經(jīng)驗,有MITCSAIL、OpenAI等國際知名機構(gòu)研究經(jīng)歷者優(yōu)先。主導(dǎo)過至少3個大規(guī)模AI項目(項目預(yù)算≥500萬元,團隊規(guī)?!?5人)。有千億級參數(shù)模型訓(xùn)練與調(diào)優(yōu)經(jīng)驗,熟悉Megatron-LM、DeepSpeed等訓(xùn)練框架,曾通過模型壓縮(剪枝、量化)技術(shù),使模型存儲成本降低70%以上。
(2)近5年內(nèi)在NeurIPS、ICML、ACL等頂會以第一作者發(fā)表≥3篇論文,論文研究方向聚焦大模型優(yōu)化、多模態(tài)對齊等AI核心領(lǐng)域,論文總引用量≥200。
(3)深度技術(shù)能力:熟練使用PyTorch、TensorFlow框架,具備開發(fā)Transformer架構(gòu)核心代碼能力。擁有GPT-3、Llama系列等大模型開發(fā)經(jīng)驗,熟悉模型微調(diào)、指令精調(diào)(RLHF)等技術(shù),能獨立完成模型從訓(xùn)練到上線全流程。掌握強化學(xué)習(xí)(如PPO、GRPO算法)、生成對抗網(wǎng)絡(luò)(GAN、DiffusionModel)等前沿技術(shù),可應(yīng)用于實際業(yè)務(wù)場景開發(fā)。
(4)卓越團隊領(lǐng)導(dǎo)與溝通能力:有成功帶領(lǐng)5人以上算法團隊的經(jīng)驗,曾培養(yǎng)出至少2名團隊成員晉升為技術(shù)骨干。具備出色的溝通能力,向非技術(shù)人員(如高管、產(chǎn)品經(jīng)理)清晰闡述復(fù)雜AI技術(shù)原理與業(yè)務(wù)價值。
(5)創(chuàng)新與成果轉(zhuǎn)化能力:擁有≥5項已授權(quán)的AI相關(guān)專利,主導(dǎo)過至少2個技術(shù)創(chuàng)新項目落地,為公司帶來顯著業(yè)務(wù)增長。能基于業(yè)務(wù)需求,提出創(chuàng)新性AI解決方案,并推動方案從原型到產(chǎn)品的全流程落地。
(6)加分項:在Kaggle全球競賽中獲得過Top1%排名,或在GitHub上主導(dǎo)開發(fā)過Star數(shù)≥5000的AI開源項目,在行業(yè)技術(shù)社區(qū)(如StackOverflow、知乎)有較高影響力。