1.負(fù)責(zé)集群操作系統(tǒng)、標(biāo)準(zhǔn)化測(cè)試等產(chǎn)品研發(fā);
2.負(fù)責(zé)融合算力系統(tǒng)資源調(diào)度優(yōu)化;
3.負(fù)責(zé)融合算力系統(tǒng)分布式存儲(chǔ)解決方案優(yōu)化;
4.負(fù)責(zé)融合算力系統(tǒng)高速互聯(lián)系統(tǒng)優(yōu)化及產(chǎn)品研發(fā)。
1.計(jì)算機(jī)相關(guān)專(zhuān)業(yè),碩士及以上學(xué)歷;
2.責(zé)任心強(qiáng),學(xué)習(xí)能力強(qiáng),具備一定的前沿技術(shù)觀察力,具有良好的溝通能力;
3.熟悉HPC和AI集群系統(tǒng)架構(gòu),了解高速互聯(lián)和分布式存儲(chǔ)相關(guān)技術(shù);
4.熟悉Linux操作系統(tǒng)內(nèi)核,系統(tǒng)引導(dǎo)和服務(wù)加載原理者優(yōu)先;
5.熟悉集群資源調(diào)度、應(yīng)用部署和環(huán)境加載者優(yōu)先,包括但不限于slurm/module/spack等;
6.具有集群常用benchmark工具測(cè)試經(jīng)驗(yàn)者優(yōu)先,包括但不限于linpack/ior/fio/stream/osu/spec等;
7.熟悉lustre/zfs/beegfs/ceph等分布式文件系統(tǒng)者優(yōu)先;
8.具有IB/RoCE高速網(wǎng)絡(luò)互聯(lián)調(diào)優(yōu)經(jīng)驗(yàn)者優(yōu)先。