报告题目:
针对元学习问题学习面向原型的集合表征
报告摘要:
集合数据(即多个元素的无序集合)涉及到机器学习中很多应用,如解析一组对象组成的场景,对三维点组成的物体进行分类等。由于元学习问题处理了多个不同的数据分布,我们也可将其看作集合输入任务,每个分布对应于一个集合。上述两者都是为了提高模型对测试集合的快速适应能力,一般情况下元学习由于样本数量的限制或新分布的出现更加困难。尽管集合输入任务的广泛性和重要性,如何处理集合任务仍是机器学习中尚未成功解决的问题。本次报告将介绍我们在ICLR2022上发表的工作:构造一个面向原型的最优传输框架。具体而言,考虑到集合输入任务(包括元学习)中的所有集合是相关的,即存在共享的统计信息,我们将采用最优传输距离(OT)学习这些统计信息,改进集合输入任务的性能。报告将展示如何用所提方法解决统计信息估计、数字加和、点云分类、小样本分类、小样本生成等任务。
报告人简介:
郭丹丹,西安电子科技大学2020届博士研究生,目前在香港中文大学(深圳)数据科学学院进行博士后研究,师从机器学习著名学者查宏远教授。她的主要研究方向是模式识别机器学习,包括贝叶斯动态模型构建与统计推断、元学习、算法公平性研究、最优传输理论,所涉及的应用有图像生成及分类、文本分析、自然语言生成等。她专注于现实应用中小样本分类、小样本生成、训练数据分布有偏等问题,着重从分布校正、分布拟合、分布匹配等角度展开研究。她的必赢766net手机版发表在机器学习国际顶级会议、期刊上,如ICML、NeurIPS、ICLR、IJCV、TNNLS等。同时,她也是多个国际会议的程序委员会委员和期刊审稿人,如ICML、NeurIPS、ICLR、JMLR、TSP等。
报告时间:
2022年9月2日 (星期五)上午9:00-10:00
报告地点:
腾讯会议 903-841-084