崗位職責:
1.負責大語言模型(如Deepseek、Qwen、GLM等)的微調(diào)、訓練及性能優(yōu)化,提升模型在特定場景下的表現(xiàn)。
2.構(gòu)建行業(yè)垂直領(lǐng)域的專用模型與知識庫系統(tǒng),推動業(yè)務場景的智能化解決方案落地。
3.協(xié)同研發(fā)團隊完成智能應用產(chǎn)品的設(shè)計、開發(fā)與部署,包括但不限于對話系統(tǒng)、知識推理等方向。
4.跟蹤前沿技術(shù)進展,探索大語言模型與行業(yè)需求結(jié)合的技術(shù)創(chuàng)新點。
任職要求:
1.本科及以上學歷,計算機科學、人工智能、數(shù)學或相關(guān)專業(yè),2年以上人工智能開發(fā)經(jīng)驗者優(yōu)先。
2.熟練掌握PyTorch/TensorFlow等深度學習框架,熟悉Transformer架構(gòu)及NLP領(lǐng)域核心技術(shù)(如預訓練、微調(diào)、Prompt工程)。
3.具備大語言模型實戰(zhàn)經(jīng)驗,包括分布式訓練、模型壓縮、推理加速等技術(shù),熟悉LangChain、Hugging Face等工具鏈。
4.扎實的編程能力,精通Python,熟悉Linux開發(fā)環(huán)境及CUDA加速,有工程落地經(jīng)驗者優(yōu)先。
5.邏輯清晰,具備跨團隊協(xié)作能力,對AI技術(shù)商業(yè)化有強烈興趣。
6.加分項:擁有Deepseek、Qwen、LAMM、GLM等模型的實際項目經(jīng)驗或開源貢獻。