联系我们

强化学习算法工程师

地点:北京

薪资:不限制

推荐奖:8000-20000

关键词:PyTorch 多模态大模型

职位编号:011180

【岗位职责】

  1. 参与语言及多模态大模型RLHF阶段的数据合成和训练等相关内容,包括但不局限于PPO/DPO/ReST, ORM/PRM/Self-Critique。
  2. 参与大模型驱动的智能体应用的开发,提升智能体的规划、记忆、工具调用及指令遵循能力。
  3. 参与团队合作,与研究员一起解决技术难题,推动项目进展,确保项目按计划完成。

【任职要求】

  1. 985/211高校研究生以上学历或优秀本科生,计算机科学、人工智能、自动化、数学等专业。
  2. 具备扎实的机器学习基础和强悍的编码能力,能熟练使用 PyTorch。
  3. 1-3年工作经验,在 NLP/CV/RL 等至少一个 AI 领域中有过深入的研究经历。
  4. 具备卓越的实验分析与问题解决能力,有创新思维,能够良好沟通、与团队成员高效协作。

【加分项】

  1. 有 ICML、ICLR、NeurIPS、ACL、CVPR 等顶级学术会议发表过有影响力研究成果的优先。
  2. 在 ACM/ICPC、NOI/IOI、Kaggle 等编程/AI 比赛获奖者优先。
  3. 主导、参与过 AI 相关的有大影响力的开源/闭源项目的优先。

Have a thing for this job? Go for it and apply today! You got this!