职位编号:011175
职位职责:
1、参与面向AGI的Scaling Law的建设,探索通用智能的机制与和可预测性;
2、参与Model Architecture的研发、优化和创新,探索不同架构的的Scalability;
3、参与支持超长序列的高效算法研发与落地;
4、设计和迭代评估基座模型通用智能的方法。
职位要求:
1、985/211高校计算机、数学、人工智能等相关专业的博士或优秀研究生;
2、有独立研究能力,曾发表机器学习或相关领域的一作论文;
3、具备扎实的编程基础和优秀的工程能力,能够独立实现相关算法和实验;
4、具备良好的团队协作能力和沟通能力;
5、具有相关领域的研发或科研经验者优先,例如在Scaling Law、Linear Attention、Optimizer等方面有经验的候选人优先考虑。