崗位職責:
1、NVIDIA嵌入式平臺開發(fā)全流程:
①基于NVIDIA嵌入式平臺,設計并實現(xiàn)GPU加速的高性能計算模塊;
②負責從算法移植到嵌入式部署的全鏈路開發(fā),包括 CUDA 內核實現(xiàn)、內存優(yōu)化、跨平臺編譯(ARM+GPU)、功耗與實時性調優(yōu)。
2、GPU 程序深度優(yōu)化:
①針對NVIDIA嵌入式平臺資源限制(內存帶寬、功耗、散熱),優(yōu)化 CUDA 核函數(shù)、數(shù)據(jù)傳輸(PCIe/Pinned Memory)、多流并行,確保實時性(如雷達信號處理流水線 ≤ ms 級延遲);
②利用NVIDIA嵌入式平臺專屬工具鏈(TensorRT、cuDNN、NPP)加速 AI/信號處理模型,集成硬件編解碼器(NVDEC/NVENC)。
3、嵌入式系統(tǒng)集成:
①開發(fā)NVIDIA嵌入式平臺驅動層交互模塊,實現(xiàn)與 傳感器(雷達/RF模塊)、通信總線(CAN/Ethernet) 的高效數(shù)據(jù)對接;
②解決交叉編譯、容器化部署及OTA升級中的GPU兼容性問題。
4、技術文檔:編寫嵌入式GPU模塊設計文檔、優(yōu)化報告及部署指南。
任職要求:
1、計算機/電子/通信/自動化類本科及以上學歷;
2、有2年嵌入式開發(fā)經驗;
3、精通C/C++;
4、熟悉嵌入式開發(fā)工具:VS Code,Git 版本控制;
5、精通CUDA 架構:熟悉 GPU 并行模型、內存層級及優(yōu)化技巧;
6、熟悉Linux 嵌入式開發(fā)(驅動、內核裁剪、文件系統(tǒng));
7、掌握ARM 平臺交叉編譯(GCC/CMake)、調試(GDB/JTAG);
8、熟悉NVIDIA嵌入式平臺操作系統(tǒng)及配套工具鏈。
進一步了解寶威:
【一、行業(yè)賽道】
我們深耕國家重點布局的低空經濟領域,核心產品為反無人機雷達。政策紅利持續(xù)傾斜,市場需求爆發(fā)式增長。九三閱兵中,反無人機方隊首次亮相,國家戰(zhàn)略級領域,守護低空安全。
【二、產品及追求】
核心產品反無人機有源相控陣雷達,整機各模塊100%自主研發(fā),技術壁壘高,競爭優(yōu)勢突出。產品在市場化過程中,已收獲客戶高度認可及好評。
我們造雷達,目標是打造“理想中的雷達”,而非僅滿足“能完成交付”的基礎標準,我們強調對技術極致與產品品質的深度追求。
【三、成長加速】
高壁壘意味著高挑戰(zhàn),對技術有更高追求的伙伴,能接觸行業(yè)前沿難題,有更大的成長與發(fā)展空間。公司處于高速發(fā)展階段,優(yōu)秀伙伴有機會快速成長為核心骨干,參與核心業(yè)務建設。
【四、團隊氛圍】
扁平化協(xié)作,簡單純粹搞事業(yè),沒有“辦公室政治”,只有“并肩作戰(zhàn)”,工作氛圍融洽。
公司周末雙休,提供五險一金、員工生日、帶薪年假等福利。