活动首页 >日程安排

因果推断算法应用论坛

时间: 07 月 21 日 09:00 - 12:20
内容介绍:

议题1:基于工具变量的因果推断和因果可泛化学习

议题2:基于观测样本的因果推断技术

议题3:因果推断技术在资源分配领域的探索和应用

议题4:基于业务先验知识的多维连续 Treatment 因果模型

日程嘉宾
DataFunCon2023(北京站):数据智能创新与实践大会
况琨
浙江大学 副教授
个人介绍:况琨,浙江大学计算机学院副教授,博士生导师,人工智能系副主任。主要研究方向包括因果推理、数据挖掘、因果可信机器学习。在数据挖掘和机器学习领域已发表近60余篇顶级会议和期刊文章,包括KDD、ICML、NeurIPS、MM、AAAI、TKDE、TKDD、Engineering等。曾获2022年ACM SIGAI China 新星奖(Rising Star Award),2021年度中国科协青年人才托举工程项目支持,2022年度高等学校科学研究优秀成果奖(科学技术)科技进步一等奖,2021年度中国电子学会科技进步一等奖,2020年度中国人工智能学会优秀博士学位论文提名奖。 演讲题目:基于工具变量的因果推断和因果可泛化学习 演讲提纲:现阶段机器学习尤其是深度学习的主要特点在于数据驱动、关联学习、和概率输出,导致模型普遍存在预测不稳定和不可解释等问题。我们认为这些问题的主要根源在于因果机制尚未融入机器学习。因此,我们需要从关联分析跨越到因果推理,将因果引入机器学习,从而实现模型的可解释性和稳定性。 大数据因果推断是实现从关联分析跨越到因果推理的核心一环。当因果推断遇上大数据,会面临高维连续变量,混淆变量观测不全等诸多挑战,导致传统因果推断方法在大数据环境下失效。如何利用机器学习和深度学习的技术,发挥数据优势、激发算法潜能,是实现大数据因果推断的核心。这次报告,我们主要从工具变量视角,给大家介绍如何利用机器学习赋能大数据因果推断。 另一方面,因果关系的可解释性和稳定性也给机器学习的可泛化性带来了可能。我们训练机器学习模型的数据往往是有偏的,如混淆偏差和选择偏差等,导致变量之间存在不稳定且不可解释的虚假关联。消除虚假关联,恢复因果关联是实现可解释可泛化机器学习的关键。这次报告,我们主要从因果推断中的工具变量视角出发,探讨领域泛化问题中存在的偏差问题,并提出因果可泛化学习机制。 听众收益: 1. 认识工具变量和相关方法 2. 利用工具变量实现复杂因果推断 3. 工具变量如何赋能可泛化机器学习
DataFunCon2023(北京站):数据智能创新与实践大会
罗文娟
快手 增长策略算法部 高级算法专家

个人介绍:罗文娟,博士毕业于中国科学院计算技术研究所,研究方向为文本挖掘。毕业后曾在美团从事用户增长相关算法优化,在滴滴担任资源分配业务负责人。加入快手后,主要工作内容为基于因果推断算法优化push效率提升push效果。读博和工作期间曾在ICDM,KDD,NIPS,Information Processing & Management , Knowledge Based System等顶级会议和期刊上发表多篇论文,并发表国际专利一项。

演讲题目:基于观测数据的因果推断技术

演讲提纲:

工业界的因果推断应用大多数场景下需要依赖于随机试验数据(random control),随机试验数据因为符合因果推断需要的一些完美假设,往往在落地中有非常好的效果。但是在实际业务中,我们往往囿于法律、法规、伦理、道德、公平性、成本等原因没有办法进行随机试验。虽然我们从实际的日志数据中,往往能收集到不少的观测性样本,但是这些观测性样本大多数情况下都是有偏的,存在非常多的混杂。本次分享主要是针对无法或者说仅能做有限的随机试验的情况下,我们怎么基于观测样本进行因果推断,帮助大家从算法和业务两个方向去更清晰地学习和落地因果推断技术,助力业务的发展。

主要内容包括:

1、观测性样本如何做deConfounding

2、观测性样本如何评估因果推断效果

听众收益:

、了解如何在无法进行随机试验的情况下怎么做因果推断

2、如何对观测性样本进行消偏

3、基于观测性样本进行因果推断的实践

DataFunCon2023(北京站):数据智能创新与实践大会
宛舒
亚利桑那州立大学 博士研究生
个人介绍:宛舒是美国亚利桑那州立大学数据科学分析与工程专业二年级博士生。目前在DMML实验室进行研究,由刘欢教授指导。主要的研究方向为因果机器学习。在此之前,宛舒先后获得了复旦大学数学学士学位和乔治华盛顿大学统计学硕士学位。曾在滴滴网约车的供需策略技术部工作,主要负责价格弹性建模和建立价格实验平台。在滴滴期间,深度参与了广义因果森林以及Spark因果森林的技术开发和策略迭代,成功地推动了该模型的上线实施。 演讲题目:分组数据上时序因果效应估计 演讲提纲:许多策略由于政策、道德、资金等各方面的限制,往往只能在人群粒度上实施。如何针对这类数据进行策略实施前后的因果效应估计,无疑是一项颇具挑战性的任务。在本次演讲中,我将向大家介绍DiConfounder,这是一种专为估计分组数据的时序因果效应而设计的模型。值得一提的是,该模型在2022年美洲因果大会(ACIC)的数据挑战赛中斩获了冠军。 听众收益: 1. 了解分组数据的特点 2. 了解分组数据因果效应估计的方法
DataFunCon2023(北京站):数据智能创新与实践大会
冯瑶
滴滴出行 算法工程师

个人介绍:硕士毕业于康奈尔大学统计系,目前就职于滴滴,主要负责因果推断方向的算法研究和业务落地工作。

演讲题目:基于业务先验知识的多维连续 Treatment 因果模型

演讲提纲:

1. 业务背景与应用

2. 问题定义与挑战

3. 多维连续 Treatment 因果模型探索与实践

4. 总结与讨论

听众收益:

1. 多维连续 Treatment 因果模型的已有研究进展

2. 业务先验知识对因果建模的重要作用

3. 如何在因果模型中引入业务先验知识