最近中文字幕免费mv在线视频,野狼第一精品社区,中文在线中文a,最近2019免费中文第一页,永久免费观看美女裸体的网站

更新于 4月23日

大模型推理引擎研發(fā)工程師

面議
  • 北京海淀區(qū)
  • 3-5年
  • 本科
  • 全職
  • 招5人

職位描述

大模型算法
崗位職責:
1. 參與分離式架構推理引擎的研發(fā)工作,包括方案設計、編碼、測試方案設計與執(zhí)行、性能畫像等;
2. 追蹤前沿技術,并進行落地探索,包括但不限于友商方案比對、開源方案調研、閱讀論文、性能數據分析等;
3. 進行顯存相關的優(yōu)化工作,比如KVCache壓縮、卸載等。
任職要求:
1. 本科及以上學歷,3年及以上工作經驗,計算機科學、人工智能、大數據等相關專業(yè)優(yōu)先;
2. 具有人工智能、深度學習算法建模開發(fā)、模型訓練推理經驗優(yōu)先錄?。?/div>
3. 熟悉并行策略、通信優(yōu)化、KVCache、任意一種加速器并能夠進行性能Profiling、算子優(yōu)化、算子融合等優(yōu)先;
4. 熟悉開源推理引擎,比如vLLM、SGLang、TensorRT-LLM等、模型量化壓縮技術優(yōu)先;
5. 學習新知識能力強,獨立發(fā)現解決問題能力強,具備較強的工程能力且有實際工程項目經驗。

工作地點

北京海淀區(qū)硅谷亮城3A

職位發(fā)布者

劉女士/HR

立即溝通
公司Logo聯通數字科技有限公司
聯通數字科技有限公司是中國聯通的全資子公司,在原聯通系統集成有限公司、聯通云數據有限公司、聯通大數據有限公司、聯通物聯網有限責任公司、聯通智安全科技有限公司基礎上組建而成,是中國聯通建設“數字信息基礎設施運營服務國家隊,網絡強國數字中國智慧社會建設主力軍,數字創(chuàng)新融合排頭兵”的核心成員和堅實力量。聯通數科聚焦集團公司“大聯接,大計算,大數據,大應用,大安全”五大主責主業(yè),以做可信賴的政企客戶數字化轉型服務商為企業(yè)宗旨。下設六大事業(yè)部,一個創(chuàng)新研究院,三大研發(fā)中心,作為出資主體共計持股34家全資、控股和參股公司。
公司主頁