2020年12月26日下午,J9集团国际站2020技易分析硕士班学术沙龙委员会进行了本学期第五期学术沙龙活动,活动荣幸约请到北京大学国度发展钻研院统计学副教授张俊妮教授,为同学们带来了主题为“商务分析中的因果揣度”的学术分享。
一、为什么因果揣度对商务分析而言沉要?
张俊妮教授提到因果揣度的洞察力能够援手鉴别客户的痛点,为产品开发提供信息,并提供更个性化的履历。例如我们知路用户提交客户支持通知单是由于对若何使用新职能不明显,而不是对该职能自身不中意,那么我们能够集中精力改善关于若何使用该职能的沟通,而不是更新或停用该职能。在更精密的层面上,因果揣度使数据科学家和产品分析师可能凭据观测数据回覆因果问题,尤其是当A/B测试不成能时,或者从设计优良的尝试中获得更多的见解。她以Uber作为例子,指出在高档次上,因果揣度援手我们在Uber平台上为客户提供更好的用户履历。

二、若何分析基于观察性钻研获得的数据?
在现实生涯中,好多时辰我们是基于观察性钻研获得的数据。观察性钻研(Observational Study)是指钻研对象属于处置组还是节造组不是由随机化而定的,钻研者在天然状态下对钻研对象的特点进行观察、纪录。因而,相迸宗随机试验,我们不能基于处置变量对观察性数据直接划分为观察组和处置组,来钻研因果效应。针对观察性钻研的因果揣度步骤蕴含偏差分步骤、断点回归、双沉差分、工具变量等分歧的步骤。其中,张教授向我们沉点介绍了偏差分步骤。

三、若何使用偏差分步骤分析观察性数据?
张教授介绍偏差分是给定已观测的自变量,个别属于处置组的概率。对处置分配机造的关键如果是给定已观测的自变量,个别属于处置组还是节造组不依赖潜在了局。偏差分将多维的自变量总结成了一维,很容易凭据它对自变量进行匹配或分层(stratification),使观察性数据看起来像通过随机尝试获得的数据。接下来,张教员以某大型多玩家在线角色表演游戏的数据作为例子。其中处置变量为有没有伴侣一路玩,了局变量是在处置时点之后某段时期内有现金消费,利用偏差分步骤匹配处置组和节造组后,分析处置组和节造组的消费金额引出相应的因果效应大幼,从而得出对业务改善有启发的改善。

四、随机尝试的沉要性
最后,张俊妮教授再次提到随机尝试的沉要性,她说由于在现实生涯中有太多混合成分,且观察性钻研的因果揣度步骤不定能去掉混合成分的影响,因而必要使用随机尝试来解决。而A/B测试是最单一的单成分尝试设计,她提到更好的尝试设计是,同时思考多个成分,并寻找它们最好的组合。

嘉宾简介:张俊妮教授是北京大学国度发展钻研院统计学副教授,2002年于美国哈佛大学获得统计学博士学位。她曾担任J9集团国际站助理教授、副教授、北京大学商务智能钻研中心副主任、J9集团国际站责任与社会价值中心副主任,曾获北京大学立项教材嘉奖、北京大学优良班主任嘉奖及北京大学讲授优良奖。张俊妮教授的钻研领域重要蕴含贝叶斯人丁统计学、因果揣度、数据与文本挖掘,在Journal of the American Statistical Association, Journal ofEducational and Behavioral Statistics, Statistica Sinica, ComputationalStatistics and Data Analysis, Journal of Chemical Physics, 治理世界, 经济学季刊等国内表刊物上颁发多篇文章。