风险识别和风险预测

临床研究常常需要区分风险识别和风险预测这两个不同的任务。风险识别的目的是找出哪些因素可能会增加患病的风险，而风险预测则是要估计某个个体患病的可能性。然而，这两个任务虽然都需要通过数据分析来完成，却是两条完全不同的路线。新手往往容易混淆这两者，以为一次统计分析就能同时解决这两个问题。但实际上，它们是独立的过程，混用方法只会让结果都不准确。为了更好地理解这一差异，我们可以通过一个案例来拆解分析。假设血压已被确认是心梗的一个独立危险因素，研究者想进一步探索血脂是否也是一个独立因素。在风险识别阶段，研究者可以通过匹配病例对照的方式，给病例组和对照组在血压水平上设置相同的标准，从而突出血脂的影响。但在风险预测阶段，使用这种方法就不行了。因为预测需要基于队列研究设计，在同一人群中顺时观察，同时纳入血压、血脂、年龄等所有可测因素，再通过Logistic回归模型算出权重和截距。来看一下Logistic回归的输出结果表。横轴代表卒中院内死亡的概率，纵轴则显示各种潜在风险因素。在风险识别视角下，我们关注显著性P值、Exp(B)和95%CI。只要P值小于0.05且置信区间不包含1，就说明找到了一个独立危险因素。而在风险预测视角下，我们则更看重B值和Intercept。B值是计算风险概率时的权重系数，Intercept代表了基准风险水平。如果混淆了这两个任务，那么结果可能会变得不准确。因为风险识别主要关注是否存在新的影响因素，而风险预测则关注概率的大小。前者需要用匹配病例对照的设计方法，后者则需要前瞻性队列研究。前者注重显著性检验，后者则需要关注回归系数和截距。在开始研究时给清晰的目标定位是非常重要的。总之，在临床研究中必须清楚地区分风险识别和风险预测这两个任务。只有这样才能保证结论的准确性和可靠性。