崗位職責:
1.參與海量數(shù)據(jù)分析與統(tǒng)計,能夠深入分析現(xiàn)有模型不足,持續(xù)優(yōu)化算法。
2.對技術有熱情,能夠及時跟進數(shù)據(jù)挖掘,機器學習相關技術的最前沿技術發(fā)展,并合理的運用到實際產品。
3.負責公司的數(shù)據(jù)挖掘、算法設計和研發(fā)工作,通過數(shù)據(jù)分析、機器學習和數(shù)據(jù)挖掘算法發(fā)現(xiàn)業(yè)務問題和機會點。
4.研究和開發(fā)基于大型語言模型(LLM)、檢索增強生成(RAG)和生成式人工智能(AIGC)的高級應用
5.優(yōu)化大模型在不同業(yè)務場景下的微調和應用,確保模型的準確性和效率。
6.構建和維護知識庫,結合RAG技術,提升問答系統(tǒng)、智能助手等的性能。
7.探索并實現(xiàn)大模型在多模態(tài)、多場景下的應用,推動通用人工智能(AGI)的發(fā)展。
8.與咨詢團隊合作,理解并滿足定制化需求,提供端到端的大模型解決方案。
任職要求:
1、本科及以上學歷,計算機科學、數(shù)學、統(tǒng)計學、人工智能等相關專業(yè)優(yōu)先考慮。
2、熟悉大模型訓練流程以及強化學習(RL)算法原理與應用,擁有機器學習、數(shù)據(jù)挖掘、推薦算法等相關領域的實際項目經驗,能夠獨立承擔并高效完成項目中的算法設計與實現(xiàn)任務。
3、精通至少一種以下編程語言:R、Python、Java、Scala,具備扎實的編程功底和良好的代碼規(guī)范。同時,熟悉 Linux 開發(fā)環(huán)境,能夠熟練運用 Linux 命令進行項目開發(fā)與調試。
4、熟悉 Hive、Spark 等大數(shù)據(jù)處理技術,能夠運用這些技術高效處理和分析大規(guī)模數(shù)據(jù)。有機器學習和數(shù)據(jù)挖掘等系統(tǒng)的搭建與實施經驗,能夠獨立完成系統(tǒng)的架構設計、開發(fā)與部署工作。
5、對大型語言模型、檢索增強生成(RAG)和人工智能生成內容(AIGC)有深入理解,具備相關項目經驗者優(yōu)先。
6、熟練掌握至少一種主流深度學習框架,如 TensorFlow 或 PyTorch,能夠利用框架快速搭建、訓練和優(yōu)化深度學習模型。具備使用框架進行模型調優(yōu)、超參數(shù)調整的實際經驗,能通過實驗和分析不斷提升模型性能,有效解決模型過擬合、欠擬合等問題。
7、擁有將人工智能模型部署到實際生產環(huán)境的經驗,熟悉模型部署的常見平臺和工具,如 Docker、Kubernetes 等。能夠根據(jù)實際業(yè)務需求對模型進行性能優(yōu)化,包括但不限于模型壓縮、量化等操作,確保模型在資源受限的環(huán)境下也能高效運行,滿足業(yè)務對實時性和準確性的要求。