近日,国家自然科学基金委员会确定了2024年度国家自然科学基金青年学生基础研究项目(博士研究生)立项名单,我院博士生郭思源申报的《强化学习驱动的大语言模型智能体进化机制研究》获得国家自然科学基金青年学生项目资助。吉林大学人工智能学院连续两年共获批3项基金委博士研究生项目。
学生简介:
郭思源,本科就读于吉林大学唐敖庆理科试验班计算机方向,2021年保送至吉林大学人工智能学院跟随常毅教授攻读必赢766net手机版,2023年转为硕博连读博士研究生。主要研究方向为大语言模型智能体和强化学习。以第一作者身份在CCF-A类会议或期刊上发表论文3篇,包括ICML、TKDE和SIGIR,并多次担任ICML、NeurIPS、ICLR等顶级会议PC Member。
指导教师:常毅教授
项目简介:
项目名称:强化学习驱动的大语言模型智能体进化机制研究
内容简介:大语言模型为人工智能的发展带来了新机遇,构建大语言模型智能体实现智能决策是目前的重要议题。然而,现有研究聚焦于离线部署阶段,导致其过于依赖基座模型的能力,且存在未对齐问题。因此,如何使大语言模型智能体通过与环境的交互持续学习从而实现进化成为亟待解决的问题。针对样本效率低、可解释性差、端侧资源受限这三个关键问题,本项目将为强化学习驱动的大语言模型智能体进化机制研究提供新思想,具有重要的学术意义和应用价值。