崗位職責(zé):
1. 負(fù)責(zé)多模態(tài)大模型(涵蓋十億、百億、千億級(jí)參數(shù))的整體技術(shù)方向與發(fā)展戰(zhàn)略制定,規(guī)劃長(zhǎng)期發(fā)展路線圖,確保技術(shù)競(jìng)爭(zhēng)力;
2. 領(lǐng)導(dǎo)團(tuán)隊(duì)開(kāi)展多模態(tài)大模型的研發(fā)全流程工作包括但不限于:SFT、RL訓(xùn)練、prompt工程,推動(dòng)模型評(píng)估、推理優(yōu)化模型壓縮等技術(shù)攻關(guān),調(diào)研業(yè)界前沿大模型,探索創(chuàng)新應(yīng)用;
3. 負(fù)責(zé)涉及數(shù)據(jù)處理、模型訓(xùn)練、部署及優(yōu)化的完整技術(shù)體系建設(shè);
4. 領(lǐng)導(dǎo)算法團(tuán)隊(duì),進(jìn)行技術(shù)指導(dǎo)、工作規(guī)劃和結(jié)果評(píng)估;與業(yè)務(wù)部門(mén)、工程團(tuán)隊(duì)緊密合作,深入理解需求,推動(dòng)技術(shù)方案落地并產(chǎn)生業(yè)務(wù)價(jià)值;
5. 跟蹤學(xué)術(shù)界和工業(yè)界最新成果,探索多模態(tài)大模型的新能力、新應(yīng)用,形成技術(shù)解決方案,并鼓勵(lì)團(tuán)隊(duì)創(chuàng)新;
6. 負(fù)責(zé)構(gòu)建高質(zhì)量、大規(guī)模多模態(tài)數(shù)據(jù)集,制定數(shù)據(jù)采集、清洗、標(biāo)注、增強(qiáng)及質(zhì)量控制標(biāo)準(zhǔn),搭建數(shù)據(jù)引擎。
任職要求:
1. 碩士及以上學(xué)歷,計(jì)算機(jī)科學(xué)、人工智能、機(jī)器學(xué)習(xí)、數(shù)學(xué)等相關(guān)專業(yè);
2. 6年以上深度學(xué)習(xí)、機(jī)器學(xué)習(xí)研發(fā)經(jīng)驗(yàn),其中至少3年專注于大模型(語(yǔ)言、視覺(jué)或多模態(tài))項(xiàng)目開(kāi)發(fā)經(jīng)驗(yàn),有國(guó)產(chǎn)模型訓(xùn)練調(diào)優(yōu)經(jīng)驗(yàn)優(yōu)先,有從0到1構(gòu)建或深度優(yōu)化百億參數(shù)以上多模態(tài)大模型的經(jīng)驗(yàn)者優(yōu)先;
3. 精通深度學(xué)習(xí)理論算法,對(duì)至少一項(xiàng)生成式模型的原理與應(yīng)用有深入了解;
4. 在ACL/EMNLP/NeurIPS等頂會(huì)發(fā)表LLM相關(guān)論文者優(yōu)先。