关于建立高血压前期人群高血压发病病证结合风险预测模型的思考
防治战略前移是当前临床医学的发展趋势。 2010 年美国心脏协会 ( AHA) 战略规划工作小组 把理想的健康行为和健康因素定义为心血管健 康 [1 ] 。国内外学者指出,高血压是心血管疾病的 第一战场,而高血压前期又是高血压病的第一战 场 [1 -4 ] 。高血压前期由《美国预防、检测、评估与 治疗高血压全国联合委员会第七次报告》 ( JNC7) [5 ] 首次提出,是指收缩压为 120 ~139mmHg、舒张压 为 80 ~89mmHg 者。国内高血压前期患病率较高, 调查发现,除个别地区患病率较低外,其余地区高 血压前期患病率为 41. 5% ~ 43. 9% [6 ] 。与正常血 压人群相比,高血压前期人群未来发生高血压病的 概率和发生心血管疾病的可能性大大增加。北京地 区流行病学调查显示,10 年前正常血压和高血压 前期的亚组人群 10 年后发生高血压的比例分别为 22. 2%和 52. 6% [7 ] 。日本一项调查数据显示,从 高血压前期进展到高血压病的受试者发生心血管疾 病的风险比保持正常血压或高血压前期的风险高 2. 95 倍 [8 ] 。 《中国高血压防治指南》 [9 ] 将高血压前 期定义为正常高值血压,其与 JNC7 指南针对该病 的建议均为以生活方式改变为主。近年来研究发 现,针对高血压前期人群,给予膳食添加剂或中医 辨证治疗、穴位埋线等方法,可以有效地预防或延 缓高血压前期向高血压的改变 [10 -12 ] 。但是,高血 压前期患病率高、血压跨度大、危险度各异,无选 择性地给予干预将浪费巨大的医疗资源。因此,识 别可能发展为高血压病的高危高血压前期人群,预 测未来发展为高血压病的风险,有针对性地进行干 预显得尤为重要。
1 高血压前期人群早期识别和风险预测的研究现 状及存在问题
有学者采用构建数学模型的方法,寻找高血压 前期人群发生高血压病的高危因素及预测因子,并 预测高血压前期人群发展为高血压病的风险。如采 用 Cox 比例风险回归分析,寻找高血压前期人群发 生高血压病的独立危险因素 [13 -14 ] 。采用多元线形 回归探索 C 反应蛋白对高血压前期人群进展至高 血压的预测价值 [15 ] 。这种通过建立数学模型,对 未来可能发生的风险状态、影响因素和变化趋势所 作的分析和推断的方法,即为风险预测,构建的数 学模型称为风险预测模型。近年来,风险预测用于 研究致病危险因素与慢性病发病率及病死率之间数 量依存关系及其规律性,将生活方式、理化指标等 因素转化为可测量的指标,用于预测个体在未来一 定时间发生疾病或死亡的危险。如刘建平等 [16 ] 采 用分类树模型预测缺血性脑卒中发病风险,正确率为 79. 30%。文玉娜等 [17 ] 采用多因素 Logistic 回归 分析,预测乙型肝炎后肝硬化患者死亡概率,结果 显示预测的敏感度为 91. 5%,特异度为 92. 4%, 正确指数为 0. 839。杨召等 [18 ] 采用 ARIMA- BPNN 组合模型预测流感发病率,结果显示,ARIMA- BPNN 组合模型预测的平均绝对误差为 0. 029、平 均误差绝对率为 0. 43%。
这些风险预测模型的建立能够较好地筛查疾病 高危人群、预测疾病的发病情况,但目前开展的相 关研究在预测高血压前期人群发生高血压病的风险 时存在一定的局限性。一方面,目前针对高血压前 期人群发展为高血压病的预测模型主要采用回归统 计方法如 Logistic 回归、Cox 逐步回归等,虽然具 有一定的预测能力,但这些模型要求变量满足独立 性且不能处理变量之间的共线性问题,因此,用于 预测高血压病这样的复杂疾病具有一定的局限 性 [19 ] 。另一方面,这些研究都是基于现代医学研 究的危险因素建立风险评估工具,缺少高血压前期 中医证候学方面的研究内容。此外,也有学者提出 采用基于健康管理队列构建高血压病风险预测模 型,预测高血压前期人群发展为高血压病的风 险 [20 ] 。这种方法也存在一定的缺陷,其危险因素 在高血压前期人群与正常人群中的重要程度不同。 有研究指出,在高血压前期妇女中,蒙古族、高血 压家族史是其发生高血压的独立预测指标,而在正 常血压妇女中则不是 [21 ] 。高血压前期人群与正常 人群相比更容易发生 2 个以上危险因素聚集的情 况,随着危险因素聚集的个数增多,发生高血压前 期的危险性越大 [22 ] 。
2 中医证候要素是开展风险预测研究的重要影响 因素
中医证候是影响高血压前期人群患高血压病的 重要因素。首先,高血压病属于中医学 “眩晕” “头痛”范畴,病因有内外两个方面,病机为脏腑 阴阳平衡失调,主要为肝肾阴阳平衡失调,病理因 素主要为风、火、痰、瘀、虚,病位以肝肾为主, 涉及脾、心 [23 ] ,因此,高血压前期人群中辨证属 于阴虚阳亢或肝火上炎者,更有可能发展为高血压 病。其次,有学者采用临床流行病学方法,对比高 血压病和高血压前期证候学特征,发现血压由正常 高值发展到高血压病的过程是一个机体由实到虚、 由肝系病变到肝肾同病的逐渐发展过程,肝火亢盛 证、阴阳两虚证可能为高血压前期发展为高血压病 的危险证候,肝火亢盛证可能是高血压前期发展为 高血压病的高危证型 [24 -26 ] 。因此,我们提出构建 高血压前期发展为高血压病的风险预测模型,不仅 要考虑高血压前期高危人群危险因素,而且要重视 中医证候要素,要将证候要素作为重要的影响因 素,建立病证结合的高血压前期发展为高血压的风 险预测模型,从而提高模型的预测准确性。
3 队列研究是构建风险预测模型的首选临床研究 类型
队列研究是将某一特定人群按是否暴露于某可 疑因素或暴露程度进行分组,追踪观察两组或多组 成员结局发生的情况,比较各组之间结局发生率的 差异,从而判定这些因素与该结局之间有无因果关 联及关联程度的一种观察性研究方法 [27 ] ,因此, 可作为构建风险预测模型的首选临床研究类型。通 过文献研究及专家访谈,采集高血压前期发展为高 血压病的可能危险因素和四诊信息,在中医理论指 导下,围绕高血压前期发展为高血压病的危险因素 和中医证候等相关问题,遵循筛检问卷设计的一般 原则和方法,通过预调查、信度及效度分析等,形 成高血压前期发展为高血压病的危险因素及四诊信 息调查问卷。采用队列研究的方法,对自愿接受研 究的高血压前期患者,利用高血压前期发展为高血 压病的危险因素及四诊信息调查问卷进行调查,追 踪随访,随访过程中发生高血压病者全部组成病例 组,未发生高血压的高血压前期患者为对照组。对 病例组和对照组的数据,采用描述性分析如 t 检 验、秩和检验、方差分析、Pearson 相关系数法和 Spearman 相关系数法、Logistic 回归的逐步选择法, 探索高血压前期发展为高血压病与各危险因素之间 的定量关系。
4 潜在类别模型是客观判断受试者证候类型的可 行方法
潜在类别模型是通过间断的潜变量即潜在类别 变量来解释外显指标间的关联,使外显指标间的关 联通过潜在类别变量来估计,进而维持其局部独立 性的统计方法。其基本假设是,外显变量各种反应 的概率分布可以由少数互斥的潜在类别变量来解 释,每种类别对各外显变量的反应选择都有特定的 倾向,因此,本文提出将收集的四诊信息作为显变 量,进行潜在类别模型分析。潜在类别模型包括两 类参数,一是计算条件概率值。条件概率值反映个 体某观察变量属于特定类别的可能性,即通过计算 条件概率值的大小,分析各四诊信息 ( 显变量) 属于某一证候要素 ( 潜变量) 的概率,根据中医 诊断有关内容,判断潜变量各类别所代表的证候要 素的内容和性质。二是计算类别概率 [28 ] 。类别概 率表示随机抽取的个体属于一个特定类的概率。通 过计算潜在类别概率,可以判断每个证素所占的比 重和受试者属于各证候要素 ( 潜类别) 的概率, 然后根据概率的大小将每个受试者进行分类,确定 每一位受试者的证候类型,实现将证候纳入到风险 预测模型中 [29 ] 。
5 比较不同建模方法结果,挑选合适的的风险预 测模型
构建疾病的风险预测模型的方法较多,比较常 用的有 Logistic 回归 [17 ] 、Cox 回归 [13 -14 ] 、支持向 量机 ( SVM) [30 ] 、神 经 网 络 [18 ] 、马 尔 科 夫 模 型 [30 ] 、决 策 树 [31 ] 、分 类 树 [16 ] 、贝 叶 斯 网 络 模 型 [31 ] 、时间序列模型 [18 ] 等。目前普遍认为,不存 在某种方法能适合于任何特点的数据。由于数据内 部变量间的关系错综复杂,建立的模型之间存在不 同的差异是肯定的 [32 ] 。如 Delen 等 [19 ] 比较了运用 Logistic回归、决策树和神经网络对 20 多万乳腺癌 患者生存状况的预测能力,结果显示,预测能力决 策树 ( 93. 6%) > 神经网络 ( 91. 2%) > Logistic 回归 ( 89. 2%) 。陈建新等 [31 ] 采用贝叶斯方法、决 策树、RBF 神经网络、SVM、Logistic 回归对冠心 病患者 ( 共 1069 例) 中医诊断分类的准确性进行 比较 研 究,综 合 各 项 性 能 指 标,SVM 最 好, Logistic回归次之,决策树、贝叶斯和神经网络依 次次之。可见数据类型不同,不同模型的预测能力 也不同。然而只要明确了试验设计类型、研究目 的、各种建模方法特点等,将不同建模方法的结果 进行合理地比较,挑选出较优的模型是完全可能 的 [32 ] 。
6 小结
识别发展为高血压病的高危高血压前期人群, 预测未来发展为高血压病的风险,具有重要的临床 价值。本研究通过分析高血压前期人群早期识别和 风险预测的研究现状及存在问题,提出采用队列研 究,收集高血压前期发展为高血压病的危险因素及 四诊信息,充分考虑中医证候对疾病发生的影响, 通过相关的数据分析和数学模型,筛选出对高血压 前期发展为高血压病有重要影响的危险因素和中医 证候,通过对模型的预测效能进行分析评价,挑选 出较优的包括危险因素和中医证候要素相结合的高 血压前期发展为高血压病的风险预测模型,从而为 高血压前期发展为高血压病的高危人群筛查提供科 学依据。
来源:中医杂志 作者:王丽颖 韩学杰