喜讯 | 理工学院博士生马畅翼在国际顶级会议SIGIR发表论文
近日,香港中文大学(深圳)理工学院2018级计算机与信息工程专业博士生马畅翼为第一作者的论文被2020 ACM SIGIR信息检索顶级国际会议收录。论文由顾崇林博后、李文烨教授、崔曙光教授等老师指导完成。
会议简介

SIGIR (ACM International Conference on Research and Development in Information Retrieval)国际计算机协会信息检索大会是一个展示信息检索领域中各种新技术和新成果的重要国际论坛,专注于信息存储、检索和传播的各个方面,同时也是中国计算机学会推荐的A类学术会议,享有很高的国际学术声誉。
论文介绍
论文题目:Large-scale Image Retrieval with Sparse Binary Projections
论文摘要:受神经科学前沿技术启发,李文烨博士及其团队于2018年和2019年分别发表NeurIPS文章和技术报告,揭示了稀疏二值投影和竞争模型的诸多优良特性,为信息检索等经典问题提供了新的研究思路。不同于传统方法通过减少数据维度加快检索速度,我们的模型首先将样本投影到高维空间,然后利用WTA竞争对数据向量进行稀疏化和二值化重新表达。沿着该思路,本文借助一种新的算法,通过无监督训练来获得高质量的稀疏二值投影矩阵,并成功地应用于图像检索领域。实验结果表明,该方法针对大规模图像检索任务除了具有良好的稳定性之外,更能够有效提高检索精度和速度,并有效降低数据的存储需求,适合实际工业应用。

学生简介

马畅翼
理工学院,思廷书院
计算机与信息工程专业博士二年级
她的研究兴趣主要在于机器学习基础理论,包括图像检索等
学生感言:该工作对我自己来说是一个很好的锻炼,让我对机器学习和图像检索有了更加深刻的了解。同时,很感谢各位老师的支持,他们的指导对该工作起到了很重要的作用。
指导老师简介

顾崇林博士
理工学院博士后研究员
他在2018年获得哈尔滨工业大学(深圳)计算机科学与技术专业博士学位。在此之前,他于2008年获得哈尔滨工程大学计算机科学与技术学士学位,于2011年获得哈尔滨工业大学(深圳)计算机科学与技术专业硕士学位。2018年5月到2018年8月,他在深圳市大数据研究院做访问学生,并于9月加入香港中文大学(深圳)崔曙光教授团队开始博士后研究工作,研究方向为云计算、绿色数据中心调度。他将于2020年8月博士后出站,作为助理教授加盟哈尔滨工业大学(深圳)。

李文烨博士
理工学院研究助理教授
李文烨博士于2016年8月加入香港中文大学(深圳)和深圳市大数据研究院,从事计算机和信息科学领域的教学科研工作。他的主要研究方向为机器学习和人工智能。李博士在NIPS/ICML等主要学术会议发表第一作者论文多篇,常年来担任多个A类学术会议的程序委员会委员和高级委员。除理论研究外,李博士也是计算机系统和Java/数据库技术专家,担任国家E级超级计算机项目需求委员会评审委员。李博士早年负责设计开发的国家地球系统科学数据共享系统,入选首批国家科技基础条件平台。

崔曙光教授
理工学院代理院长
崔曙光教授现任理工学院代理院长。他于2005年在美国斯坦福大学获得博士学位,先后在美国德州农机大学和加州大学戴维斯分校任助理、副、正、和Child Family讲席教授 。现任深圳市大数据研究院副院长和香港中文大学(深圳)校长讲座教授。崔教授的当前科研方向主要集中在数据驱动的大规模系统控制和资源管理。已在国际一流期刊和会议上发表了两百五十余篇论文。崔教授是IEEE信号处理协会2012年最佳论文奖获得者, 并曾担任多个IEEE国际会议的主席和程序委员会主席,多个国际期刊的编委(IEEE TBD, TSP, TWC, TVT, CL)和IEEE SPM的领域主编,是IEEE通信协会无线技术委员会(WTC)的主席 。崔教授在2013年当选IEEE Fellow(博士毕业后8年内当选,为IEEE历史上最快之一),并在2014年和2016年被分别任命为IEEE Transactions on Big Data和IEEE Transactions on Cognitive Communications and Networking 的Steering Committee委员。崔教授在2014年入选IEEE ComSoc Distinguished Lecturer, Thomson Reuters全球高被引科学家名单, 和ScienceWatch的全球最具影响力科学家名单。在2017年10月,基于其在物联网和数据分析领域的学术声誉,崔教授应阿里巴巴集团的邀请到杭州,作为13名科学家之一为阿里巴巴达摩院的成立提供了战略性意见。
导师点评
利用稀疏二值矩阵来加速图像检索速度和精度具有新颖性和突破性。该方法的难点是如何设计这样一个投影矩阵,在重新表达的同时保证检索精度和速度。我们提出了一种利用WTA自身特点的迭代优化方法,并在ANN和IR的准确度上超过了现有的经典方法。该方法也获得了评审者的一致好评,他们认为我们的SBP方法在检索速度、准确度及通用性上具有一定的优越性。
马畅翼同学具有很好的编程能力,并且对机器学习有着不错的理解。她在接近三个月的时间里尝试了各种想法并最终形成了有效的方法,获得了令人满意的结果。希望她在未来的科研生涯中再接再厉,做出更好的工作!也欢迎对人工智能基础理论感兴趣的同学加入我们的团队,共同探索人工智能时代下的前沿思想方法和应用。