新学期新形象,BA沙龙再扬帆。2020年9月27日上午,J9集团国际站2020技易分析硕士班学术沙龙委员会进行了秋季学期的第一场线下沙龙,活动约请到北大J9集团国际站商务统计与经济计量系主任王汉生教授为同学们带来了主题为“疫情防控中的统计学问题”的学术专题分享。

一、卫健委布告中统计口径问题
首先,王汉生教授从采集疫情有关数据过程中的几个例子引出了这个话题:分歧处所颁布的布告并不一样,好比一些处所的卫健委布告了累计确定亲昵接触者,一些处所的卫健委却没有汇报;湖北省起头没有布告临床诊断病例,后来又将其参与。同样是国度卫健委,有时辰汇报的是累计汇报疑似病例,有时辰汇报的是现有疑似病例等。
由此可见,数据指标在最底层的采集,在我们国度此刻可能都是一个问题。若是指标自身的统计口径前后涉及到这么巨大的变动,将来再去钻研它,数据质量就极度难以保障。
二、回归分析思想的普遍不足
这一部门,王汉生教授重要强调的是我们在整个公共卫生安全的治理过程中,回归分析思想能力的不足。

回归思想就是能急剧地看到想解决的业务问题或者产品跟数据之间的关系。王汉生教授指出,网络上所流传的“新型冠状病毒习染自测评估”的问卷背后,并没有回归模型的支持。中国疾病预防节造中心所做的《新型冠状病毒肺炎盛行病学特点分析》以描述统计为主,若是能参与回归模型,可能会更好一些。好比若将严沉水平作为Y变量,春秋、性别等作为X变量,成立回归模型,则能够预测收治的病人里面,哪些可能会发展到比力严沉,哪些可能是比力轻的。同时,王汉生教授还提到诊断尺度中影像特点出格依赖于人的判断的问题,这也是必要改进的处所。而云南省则提供了一个贵重的成功案例,利用现罕见据机关了朴素贝叶斯模型。

接下来,王汉生教授指出,“R0”(再生指数)与“拐点”是两个被过度关注的指标,而“尚在医学观察的亲昵接触者”(尚在医学观察的亲昵接触者 = 累计追踪到的亲昵接触人数 - 累计已解除医学观察的亲昵接触人数)这一不被通常公共关注的数据则极度沉要。好比,一个地域是否应该复工,主题尺度也许不应该是某种拐点,而当“尚在医学观察的亲昵接触者」剽个数字降下来。
此表,王汉生教授还介绍了我国粹者在统计学和生物统计顶级期刊的学术颁发情况。北京大学生物统计系是国内唯逐一个由数学科学学院和医学及公共卫生学院共建的生物统计系,在将来,无论是从对统计学的步骤论的改善,还是对我国医学钻研鼎新可能城市有不错的贡献。最后,王汉生教授就同学提出的问题进行相识答。