很多人相信你能做到。

但最近文章在《哈佛商业评论》(HBR)上发表了关于在线用户购买产品评分可靠性的文章。作者得出结论,网络评分通常不可信,原因有三:

  1. 评论通常基于一小部分用户样本。作者表示,“如果样本量大,评级分布的可变性较小(即如果不同的评论者倾向于达成一致),我们就可以对平均星级评级更有信心。”
  1. 留下评论的人不是随机选择的。“观点偏激的消费者更有可能发表评论,这被称为‘吹嘘和抱怨’偏见。”评级的分布通常集中在5星和1星,只有少量的2s、3s和4s。
  1. 大多数发布评级的人都没有购买过类似的产品。因此,他们没有办法对一种产品和另一种产品进行测试。“众所周知,消费者对产品质量的评价严重受客观产品性能之外的其他变量的影响,比如品牌形象、价格和外观。”

这些原则也适用于医生评级。

在线医生评分最重要的问题是样本量。《哈佛商业评论》的作者用一个例子说明了这一点。

以一款平均评分为4星的产品为例。如果至少有25个用户对该产品进行了评级,那么您可以有95%的把握确定平均值在3.5到4.5之间。

因此,如果两位医生的评分都低于25分,那么一个3.6分的医生和一个4.4分的医生之间可能没有真正的区别。

你猜在线医生的平均评分是多少?

根据国家研究公司在2015年,“大多数在线供应商的评级是基于平均只有2.4每位医生回顾[粗体字另加]”。

当我博客一篇2014年的论文声称医生的在线评分是可靠的,该论文称其作者研究了9年的评分,发现佛罗里达州21%的心脏外科医生的平均评分为1.9次。没有在线评分的79%的外科医生在2012年完成了79%的手术,这一年他们选择查看患者的结果。

大多数手术都是由没有在线评分的外科医生完成的。在这些条件下比较外科医生并不比抛硬币好多少。

像ProPublica的外科医生记分卡这样的网站怎么样?

我和其他人在2016年7月出版的《外科年报》中,病人安全专家彼得·普罗诺沃斯特和他的合著者指出了它的许多缺点。

因为这篇三页的论文的全文是可用的在这里,我谨引用其结论:

“患者和提供者应该得到有效和透明的绩效评估,医院和医生应该对他们提供的护理负责。然而,有缺陷的措施不仅没有意义,而且可能实际上伤害患者、提供者和其他利益相关者。(强调说。衡量企业必须达到我们对医疗保健提供者应有的高标准。”

skeppel是一名退休外科医生,曾担任外科系主任和住院医师项目主任多年。他在普通外科和一个外科次专业的董事会认证,并已在这两个认证的几次。在过去的六年里,他一直在SkepticalScalpel.blogspot.com和微博@SkepticScalpel。他的博客有超过250万的页面浏览量,他在Twitter上有超过15500名粉丝。