很多人相信你能做到。

但这是最近的文章在哈佛商业评论(HBR)关于关于购买产品的在线用户评级的可靠性。作者得出结论,在线评级通常不受三个重要原因不受信任:

  1. 审查通常基于一个小用户样本。作者说:“如果样品大小很大,如果样品大小很大,则可以更自信,如果评级分布的可变性更小(即,如果不同的审阅者倾向于同意)。”
  1. 发表评论的人并不是随机挑选的。“观点极端的消费者更有可能发表评论,这被称为‘夸夸抱怨’偏见。“评级的分布通常集中在5星和1星,只有几个2星、3星和4星。
  1. 大多数发布评级的人都没有购买过类似的产品。因此,他们没有办法对一个产品和另一个产品进行测试。“众所周知,消费者对产品质量的评价,除了客观的产品性能(如品牌形象、价格和外观)外,还会受到其他变量的严重影响。”

这些原则也适用于医生评级。

医生在线评分最重要的问题是样本量。《哈佛商业评论》的作者举例说明了这一点。

拿一个平均得分为4星的产品来说。如果至少有25个用户对该产品进行了评级,那么您可以95%地确定平均评级在3.5到4.5之间。

因此,如果两名医生的评分都少于25分,那么评分为3.6和4.4分的医生之间可能并没有真正的区别。

你猜在线医生的平均评分是多少?

根据国家研究公司在2015年,“大多数在线服务提供商的评分是基于平均只有2.4每位医生点评[粗体字另加]”。

当我bl关于一本2014年文件声称在线医生评级是可靠的,其作者表示,其作者在9年期间看着评级,发现佛罗里达州的21%的心脏外科医生平均平均为1.9次。在2012年的79%没有在线评级的外科医生,他们选择看待患者结果的年度79%。

大多数手术是由没有在线评分的外科医生完成的。在这种情况下比较外科医生的效果并不比抛硬币好。

那么像ProPublica 's Surgeon Scorecard这样的网站呢?

我和其他人关于它的许多缺点,但不如病人安全专家彼得·普罗诺沃斯特和2016年7月出版的《外科年鉴》的合著者那样简洁和科学。

因为有三页的论文全文在这里,我仅引用其结论:

“病人和提供者应该得到有效和透明的绩效衡量标准,医院和医生应该对他们提供的护理负责。然而,有缺陷的措施不仅没有意义,而且实际上可能会伤害患者、医疗提供者和其他利益相关者。(强调说。测量企业必须保持与我们对医疗保健提供者的适当期望相同的高标准。”

Skeptical Scalpel是一位退休外科医生,多年来一直担任外科部门主席和住院医师项目主任。他获得了普通外科和外科亚专科的认证,并多次获得这两方面的重新认证。在过去的六年里,他一直在SkepticalScalpel.blogspot.com和微博@SkepticScalpel。他的博客有超过250万的页面浏览量,他在推特上有超过1.55万的粉丝。