喜讯 | 理工学院师生共4篇论文被国际人工智能领域顶级会议AAAI 2025收录
近日,AAAI 2025公布论文接收结果,香港中文大学(深圳)理工学院共有4篇研究论文被收录。
在被收录的论文中,参与作者包括
- 8位硕博学生:郭永新、罗玥如、潘梓彬、王贤达、王志超、吴晨睿、吴铎、杨奕铭
- 1位本科学生:乔雅琦
参与作者按姓氏首字母排列
通讯作者/指导老师分别为理工学院赵俊华教授、李镇助理教授、唐晓莹助理教授和王方鑫助理教授。
会议介绍
AAAI (AAAI Conference on Artificial Intelligence) 由国际先进人工智能协会(Association for the Advancement of Artificial Intelligence, AAAI)主办,是人工智能领域的顶级会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。
AAAI 2025共接收12957篇投稿,录用论文3032篇,接受率为23.4%。
论文介绍
论文一:

联邦学习(FL)近年来备受关注。然而,虽然客户端在联邦学习中不需要共享其数据,但全局模型本身可以隐式地记住客户端的本地数据。因此,有必要有效地从FL全局模型中删除目标客户端的数据,以减轻隐私泄露的风险并实现“被遗忘权”。联邦遗忘学习被认为是一种无需完全重新训练即可删除数据的有前途的方法。但是,由于梯度冲突,模型效用在遗忘学习过程中很容易大幅降低。此外,在进行后训练以恢复模型效用时,模型很容易倒退并恢复已经遗忘的内容。为了解决这些问题,我们提出了基于正交最速梯度下降法的联邦遗忘学习(FedOSD)。我们首先设计一个遗忘交叉熵损失来克服使用梯度上升的收敛问题。然后在与其他客户端的梯度不冲突而且最接近目标客户端梯度的条件下计算得到遗忘学习的最速梯度下降方向。这有助于有效地进行遗忘同时减轻模型效用受到的影响。遗忘学习之后,我们通过梯度投影法,在保持遗忘的成果的前提下进一步恢复模型效用。最后,在多个FL场景中进行的大量实验验证了FedOSD在遗忘学习效果和模型效用方面优于前人的方法。

图1 交叉熵(Cross-Entropy)和遗忘交叉熵(Unlearning Cross-Entropy)对比图

图2 FedOSD算法流程图
论文的第一作者和第二作者分别为理工学院计算机与信息工程专业在读博士生潘梓彬和王志超。通讯作者为理工学院赵俊华教授和唐晓莹助理教授。
论文二:

从透视图中提取车道拓扑对自动驾驶中的规划和控制至关重要。此方法在无需依赖高清地图的情况下,为自动驾驶车辆提取潜在的可行驶轨迹。然而,DETR框架的无序性和较弱的长距离感知能力可能导致车道线端点的不对齐,并限制拓扑预测能力。受到语言模型中上下文关系学习启发,车道的连接关系可以被表征为显式的拓扑序列。本文提出了一种名为Topo2Seq的创新方法,通过拓扑序列学习来增强拓扑推理。Topo2Seq的核心理念是车道decoder和拓扑序列decoder之间的Randomized order Prompt-to-sequence Learning (RPL)。双decoder分支同时学习从有向无环图(DAG)中提取的车道拓扑序列和包含几何信息的车道图。RPL从车道decoder预测的车道图中提取无序的关键点,这些点随后输入拓扑序列decoder作为prompt以重建有序且完整的车道图。通过这种方式,车道decoder从拓扑序列decoder中学习强大的长距离感知和拓扑推理能力。值得注意的是,拓扑序列decoder仅在训练过程中引入,并不影响推理效率。在OpenLane-V2数据集上的实验评估表明,Topo2Seq在拓扑推理方面表现出了最先进的性能。

论文由理工学院李镇教授团队与腾讯T Lab合作完成。第一作者和第二作者分别为理工学院计算机与信息工程专业在读博士生杨奕铭和罗玥如。通讯作者为理工学院李镇助理教授。本文的作者还包括武汉大学的何秉坤,腾讯T-Lab的李二龙、曹志鹏、郑超、梅树起。
论文三:

视频时序定位(VTG)旨在通过语言查询准确地在特定视频中定位事件时间戳,这对视频浏览和编辑等下游任务有着重要影响。与传统的任务特定模型不同,视频大型语言模型(视频LLM)可以以零样本的方式同时处理多个任务。因此,探索视频LLM在VTG任务中的应用已成为一个蓬勃发展的研究领域。
然而,尽管视频内容理解已有显著进展,视频LLM通常难以准确地在视频中定位时间戳,这限制了它们在VTG任务中的有效性。为了解决这一问题,我们提出了VTG-LLM,一种旨在增强视频LLM时间戳定位能力的模型。我们的方法包括:(1) 有效地将时间戳知识融入视觉标记中;(2) 引入绝对时间标记,以在不发生概念转换的情况下管理时间戳知识;(3) 提出了一种轻量化、高性能的基于插槽的标记压缩技术,旨在应对VTG任务中需要采样大量帧的需求。此外,我们还提出了VTG-IT-120K,一个公开可用的VTG数据集,经过重新标注以改进低质量的标注。我们的全面实验表明,VTG-LLM在各种VTG任务中相较于其他视频LLM方法具有更优的性能。

论文第一作者为理工学院计算机与信息工程专业在读博士生郭永新,该论文是其在腾讯实习期间完成的。通讯作者为理工学院唐晓莹助理教授和腾讯的陈曦博士。本文作者还包括腾讯的刘敬禹博士、李明达、刘庆斌博士、赵博博士,山东大学的程鼎新,和哈尔滨工业大学的隋典伯教授。
论文四:

联邦学习是一种分布式学习范式,旨在满足用户隐私保护和数据安全的需求。在大模型云边协同微调训练中,由于边缘节点的高度异质性,在边缘节点部署同构的大模型进行本地微调成为主要挑战。同时还面临着高计算通信成本以及训练不均衡的问题。为了解决这些问题,在这项工作中,我们设计了一种基于聚类的联邦学习框架(FedCAMS)。首先利用多因素异构感知聚类(MHAC),根据用户的数据分布和计算资源限制情况对边缘节点进行聚类,划分为多个簇,并实现差分隐私保护数据安全性。然后,利用我们设计的知识感知模型架构搜索算法(KAMAS),对大模型进行结构化搜索,根据边缘设备的计算资源限制,为每个用户定制适配的子模型结构,以支持高效的本地训练和模型更新,并通过聚合相应的模型参数来完成簇内模型的更新。最后通过集群感知的知识转移算法(CAKT),将通过知识蒸馏方式跟新服务器模型,实现云边协同训练。大量在不同数据集上的实验结果表明,FedCAMS不仅在准确性方面优于现有最先进的联邦学习算法,而且在计算和通信成本上也具有优势。

论文共同第一作者为理工学院计算机与信息工程专业在读博士生王贤达、计算机与信息工程专业硕士毕业生吴铎,及香港中文大学(深圳)本科生乔雅琦。本文其他作者还包括计算机与信息工程专业硕士毕业生吴晨睿。通讯作者为理工学院王方鑫助理教授。
教授简介

赵俊华教授是香港中文大学(深圳)理工学院教授,中新智慧储能联合研究中心执行主任,深圳高等金融研究院能源市场与能源金融实验室主任,深圳人工智能与机器人研究院研究员。他回国前曾担任澳大利亚纽卡斯尔大学智能电网研究中心主任科学家,在澳大利亚有11年的电力行业从业经验。长期从事智能电网、电力市场、低碳转型、人工智能等方面的研究工作。在国际、国内著名期刊和国际会议上发表论文300余篇,其中包括Cell子刊Joule1篇,Patterns1篇,Nature子刊Scientific Data2篇,中国工程院院刊Engineering1篇,IEEE Transactions收录论文60余篇。发表的论文被国内外引用15000余次,H-index为61(根据Google Scholar统计)。合著英文著作两部。
2023年当选英国工程技术学会会士(IET Fellow)。2023年获评麻省理工科技评论“中国智能计算创新人物”。2021–2023年连续入选Elsevier“中国高被引学者”。2023年获国际金融论坛(IFF)“全球绿色金融奖”。2022年获广东省电力科技杰出贡献奖。2020年获得浙江省自然科学二等奖。2020年获国际期刊Energy Conversion and Economics年度最具影响力论文。2017年获澳大利亚达沃斯论坛(ADC Forum)授予青年科学家奖(Young Scientist of the Future)。2017年获国家科技部“中国百篇最具影响力中文科技期刊论文”奖。2016年获得顶级期刊IEEE Transactions on Smart Grid授予最佳审稿人奖。2014年获得IEEE电力与能源大会(IEEE PES General Meeting)最佳论文奖(Best Paper Award)。两次获得湖南省科技进步二等奖。2020年获深圳特区金融学会重点课题评选二等奖。研究成果在工业界产生了重要影响,担任我国首个省级电力现货市场和首个区域电力现货市场的专家组成员,参与了国内首个跨境碳交易产品的设计。参与开发的多个软件产品先后应用于纽约爱迪生公司、港灯集团、广东省能源集团、中海油、大唐发电等大型能源企业。
招商银行总部特聘能源行业专家。《澳大利亚国家展望报告(Australian National Outlook)》特邀外部专家。IEEE Special Interest Group (SiG) on Active Distribution Grids and Microgrids联合主席。IEEE PES SBLC (Smart Building, Load and Customer) 亚太工作组秘书,国际智能电网联盟(GSGF)“Interfaces of Grid Users/ Focus on EV and Local Storage”专家组成员。担任IEEE Transactions on Network Science and Engineering、Energy Conversion and Economics等多个国际期刊编委。

李镇博士现任香港中文大学(深圳)理工学院/未来智联网络研究院助理教授,校长青年学者。李镇博士获得香港大学计算机科学博士学位(2014-2018年),他还于2018年在芝加哥大学担任访问学者。李镇博士荣获2013年吴文俊优秀青年,2021年中国科协第七届青年托举人才,2023CVPR HOI4D竞赛第一名,2022年SemanticKITTI语义分割竞赛第一名,2023年IROS 最佳论文Finalist,ICCV2021 Urban3D竞赛第二名,CASP12接触图预测全球冠军等。李镇博士还获得了来自于国家、省市级以及工业界的科研项目。李镇博士领导了港中深的Deep Bit Lab (https://mypage.cuhk.edu.cn/academics/lizhen/),其主要的研究方向是3D视觉解析及应用(包括但不限于点云解析,多模态联合解析),深度学习等基础理论算法研究,并致力于将2D/3D人工智能算法推广应用于交叉学科,自动驾驶,工业视觉等场景中,在该方向著名国际期刊和会议发表论文80余篇,包括顶级期刊Cell Systems,Nature Communications,T-PAMI,TMI,TVCG,TNNLS等,以及顶级会议CVPR,ICCV,ECCV,NeurIPS,ICLR,IROS,ACM MM,AAAI,IJCAI,MICCAI等。李镇博士担任IEEE Transactions on Mobile Computing、IROS副编,ICLR AC以及众多顶刊顶会的审稿人,李镇博士还是广东院士联合会脑科学与类脑智能专委委员,VALSE、MICS、中国图象图形学学会机器视觉专委会,3DV专委会等学术组织的委员。

唐晓莹博士,香港中文大学(深圳)理工学院助理教授、博导、校长青年学者。主要研究方向为联邦学习、大模型、可信人工智能、电动车充电信息网络优化与博弈,近年来在ICML、NeurIPS、AAAI、IEEE SmarGridComm、TMC、TII、TSG、TPWRS、IOTJ等国际期刊和会议发表学术论文60余篇,以第一作者获得IEEE通信协会智能电网旗舰会议IEEE SmartGridComm 2013年度唯一的最佳论文奖,并获IEEE/ACM ASE 2023杰出论文奖、IEEE SmartGridComm 2024年度最佳论文奖,以第一作者在国际知名出版社Springer出版科研专著1部,常年担任 Nature Machine Intelligence、ICML、NeurIPS、ICLR等国际期刊或会议审稿人。入选2024腾讯犀牛鸟专项研究计划、广东省青年人才计划,担任IEEE PES中国区电动汽车技术委员会委员、电动汽车与能源交通系统融合技术分委会常务理事、广东省计算机学会移动与边缘计算专委会常务委员、深圳市人工智能学会理事。荣获四川省国际“互联网+”大学生创新创业大赛优秀指导教师奖、香港中文大学(深圳)理工学院2023年度杰出贡献奖等。作为项目负责人主持多项中国南方电网、腾讯等知名头部企业项目。

王方鑫,现为香港中文大学(深圳)助理教授、博士生导师、校长青年学者,研究方向包括多媒体网络与系统,云边端协同计算,深度学习,大模型与边缘智能等。他在SIGCOMM、TMC、TON、TVCG、INFOCOM、MM、VR等顶级会议期刊发表论文60余篇,引用超1700余次;担任JCR一区与CCF-A类期刊IEEE Transactions on Mobile Computing编委(Associate Editor),JCR一区期刊Digital Communication and Network编委,IEEE Satellite 2023和ACM SIGCOMM EMS Workshop的程序委员会主席(TPC Chair),IWQoS 2022(CCF-B类会议)出版主席、分论坛主席;担任电子学会通信分会青年委员,计算机学会互联网专委会执行委员,IEEE多媒体技术委员会委员,通信学会高级会员;获2023广东省科技进步二等奖,入选2022中国科协“青年托举人才计划”,2023、2024连续两年入选斯坦福大学“全球前2%顶尖科学家榜单”,主持和参与多项基金委、科技部、省市与横向项目。
学生作者简介

郭永新
2020级博士生
计算机与信息工程专业
郭永新于2020年加入理工学院唐晓莹教授团队攻读博士学位,主要研究方向为联邦学习、混合专家系统、多模态大模型等。已发表ICML、NeurIPS、AAAI等7篇会议论文。

罗玥如
2022级博士生
计算机与信息工程专业
研究方向为车道线检测,3D场景感知,自动驾驶。目前以第一作者在ICCV、ICLR发表论文两篇,指导老师为李镇教授。

潘梓彬
2020级博士生
计算机与信息工程专业
潘梓彬于2020年加入理工学院赵俊华教授团队攻读博士学位,联合指导导师为唐晓莹教授。潘梓彬的主要研究方向为联邦学习算法及在智能电网中的应用,已发表论文10余篇,其中一作论文7篇(含CCF-A论文3篇,SCI Q1期刊1篇)。研究兴趣包括多目标优化、联邦学习在电力系统中的应用、隐私计算。曾研发发布高性能实用性进化算法工具箱——Geatpy,目前github star超过2k,被收录进《Python最优化算法与实战》一书当中。

王贤达
2023级硕士研究生
计算机信息与工程专业
目前主要从事大模型微调,模型融合,边缘计算,联邦学习等领域相关研究。

王志超
2022级博士生
计算机信息与工程专业
王志超,在电子科技大学数学科学学院获得信息与计算科学学士学位,其后在香港中文大学(深圳)攻读计算机信息与工程专业博士学位,导师为唐晓莹教授。以第一作者身份获得2024 IEEE ICCT Excellent Poster Presentation奖。研究领域包括联邦学习(公平性、隐私安全、联邦推荐系统、联邦大模型高效微调)、大模型推理等。

杨奕铭
2024级博士生
计算机与信息工程专业
研究方向为车道线拓扑和跨模态目标重识别,目前以第一作者在AAAI、IEEE TIP、IEEE TIFS、IEEE TCSVT、ACM TOMM发表论文五篇,指导老师为李镇教授。

吴晨睿
2023届毕业生
计算机与信息工程专业
吴晨睿,现就读于浙江大学与西蒙菲莎大学联培博士。此前,他于2023年在香港中文大学(深圳)获得计算机与信息工程硕士学位,并于2021年在哈尔滨工业大学获得软件工程学士学位。他的研究兴趣主要在联邦学习,云边协同和人工智能。目前他已在多个顶级期刊和国际会议上发表论文,包括IEEE TMC、IEEE IoTJ、ACM MM、ECCV、ICME。

吴铎
2024届毕业生
计算机与信息工程专业
吴铎,现于清华大学攻读博士学位。此前,他于2024年在香港中文大学(深圳)获得计算机与信息工程硕士学位,并于2022年在暨南大学获得计算机科学与技术学士学位。他在多媒体网络、强化学习、大语言模型的交叉领域具有广泛的研究兴趣,近期聚焦于设计基于大模型的算法框架与智能体系统,以解决跨领域的决策优化问题。目前他已作为第一作者在国际核心期刊和会议上发表了多篇论文,包括CCF-A类期刊IEEE TMC和CCF-A类会议 ACM SIGCOMM。他曾获得2024年香港中文大学(深圳)校长杰出研究生毕业生奖。

乔雅琦
2021级本科生
目前研究方向主要为大模型的网络应用、边缘计算和联邦学习。
内容由教授团队提供