SSE WEEKLY COLLOQUIUM活动回顾 | 2025理工学院系列研讨会第八十三讲-第八十四讲
2025年9月19日-9月26日,每周五上午,理工学院Weekly Colloquium举办了第八十三场-第八十四场系列讲座。讲座邀请嘉宾分别为冀晓强教授、袁冯毅教授。让我们一起回顾讲座内容吧!
01. 冀晓强教授
题目:Physics-aware Embodied Control
时间:9月19日(周五)10:30-11:30
讲座内容:
本次讲座的主题为“Physics-aware Embodied Control”,主讲人冀晓强教授系统阐述了一种植根于物理动力学系统的具身控制新范式。该研究的核心目标在于学习和探索具备物理可解释性与高度泛化能力的智能控制策略。

冀晓强教授讲座现场
讲座首先阐述了基于ChatGPT等大语言模型的传统控制方法在复杂多变的真实环境中存在的局限性,尤其是在泛化能力与稳定性方面的挑战。为解决此问题,冀晓强教授团队提出了一种创新的研究思路:构建一个“物理-特征-反馈”(“Physics–Eigen–Feedback”)的训练循环,直接从现实世界获取数据。该思路以“具身控制”为核心理念,即智能体必须通过与物理世界的真实交互进行学习与决策。
随后,讲座深入探讨了实现该物理感知框架的具体技术路径。冀教授介绍,其团队通过针对线性非最小相位系统(Linear non-minimum phase systems),应用基于时间稳定反演的高精度前馈控制(Lifted time stable inversion based feedforward control),有效提升了系统的稳定性、泛化能力与稳健性。同时,通过引入基于图形的、以对象为中心的学习范式(Graph based object-centric learning),实现了物理感知的嵌入式控制。在多智能体协作方面,通过异构多机器人协同规划(Heterogeneous multi-robot task planning),使机器人系统能够自主判断任务可行性并执行协同指令。
该框架的突出优势在于,通过构建“物理感知”模型,能够显著提升控制策略的效率和稳定性,并增强其可解释性,从而有效规避了部分深度学习方法的“黑箱”问题。冀教授指出,该方法论在机器人技术等需要与环境进行复杂物理交互的领域已展现出巨大的应用潜力。
最后,冀教授总结具身智能领域当前面临的挑战与未来前景,并介绍其团队目前正致力于人工智能控制理论、通用全身控制、机器人控制基础理论以及骨骼肌学习控制等前沿领域的研究。讲座构建了一张能够理解并利用物理规律的下一代人工智能系统的发展蓝图。
02. 袁冯毅教授
题目:Stochastic Control/Optimization: A Theory for Decision under Uncertainty
时间:9月26日(周五)10:30-11:30
讲座内容:
本次讲座的主题为“Stochastic Control/Optimization: A Theory for Decision under Uncertainty”,主讲人袁冯毅教授系统阐述了随机控制(Stochastic Control)这一核心数学研究领域。该领域的核心目标在于对具有不确定性,特别是含动态结构(dynamic structure)与非预期约束(non-anticipation constraints)的决策问题,进行严谨的数学处理。

袁冯毅教授讲座现场
讲座首先以理想的单周期投资组合选择(one-period portfolio selection)问题为例,清晰勾勒了随机控制理论的整体图景。该理论通过建模智能体策略(agent policy)与环境(environment)的实时交互,在离散时间(discrete time)视角下,结合马尔可夫决策过程(Markov decision process, MDP)构建模型;并由此自然推广至在连续时间(continuous time)下进行动态决策的随机控制分析框架。该框架建立在概率论与现代分析工具之上,如(反向)随机微分方程(backward stochastic differential equations, SDEs)和偏微分方程(partial differential equations, PDEs),为解决具有现实背景的各类复杂问题奠定了坚实的理论基础。
随后,讲座深入探讨了该理论框架的经典工具与前沿进展。袁教授展示了其团队的三项具体研究成果:带非线性偏好的投资组合选择(portfolio selection with nonlinear preferences)、基于生成模型的无模型投资组合选择(model-free portfolio selection using generative models),以及数据驱动的平均场优化(data-driven mean-field optimization)。在介绍了哈密顿-雅可比-贝尔曼方程(Hamilton-Jacobi-Bellman, HJB equation)与随机最大值原理(stochastic maximum principle)等经典方法后,袁教授聚焦于如何解决模型不确定性(model uncertainty)这一关键挑战。他详细阐述了受计算机科学及人工智能启发的前沿思路:通过构建用于动态数据生成的生成模型(generative models),例如针对时间序列数据的扩散模型(diffusion model),来应对模型的不确定性,并强调了保障模型稳定性的重要性。
该理论框架的突出优势在于其广泛的适用性与深刻的指导意义,不仅能为多样的现实问题提供解决方案,更能直接指导相关数值算法(numerical algorithms)的设计与开发。袁教授的案例清晰地展示了随机控制理论在数学金融、大规模系统优化等领域的巨大应用潜力。
最后,袁教授总结了随机控制领域的研究前景,并结合其个人研究兴趣,指出了未来的重要研究方向。讲座为我们描绘了如何利用先进数学工具解决复杂决策问题的蓝图。
点击链接查看讲座回放: