强化学习算法研究员

职位编号：011172

岗位职责：

1、研究语言及多模态大模型RLHF阶段的广义强化算法，提升大模型的能力，探索大模型的自我进化之路；

2、研究大模型驱动的智能体算法，包括但是不局限于ReACT, Voyager, WebGPT, AutoGPT；

3、撰写技术报告和论文，分享研究成果，参与内外部的技术交流和合作，推动团队技术水平的提升，提高团队在行业内的影响力。

任职要求：

1、985/211高校硕士或博士学位，计算机科学、人工智能、自动化、数学等专业；

2、具备扎实的机器学习基础和强悍的编码能力，能熟练使用 PyTorch；

3、3-5年工作经验，在大模型训练和强化学习至少一个方向上有在学术工业界高影响力的工作；

4、对人工智能和大模型技术有强烈的兴趣和热情，愿意不断学习和探索新技术。

加分项：

1、有 ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先；

2、在 ACM/ICPC、NOI/IOI、Kaggle 等编程/AI 比赛获奖者优先；

3、主导、参与过 AI 相关的有大影响力的开源/闭源项目的优先。

联系我们

强化学习算法研究员

地点：北京

薪资：不限制

推荐奖：8000-20000

关键词：大模型驱动智能算法体

Have a thing for this job? Go for it and apply today! You got this!