中医在人工智能时代的挑战与经方智能化研究思路
人工智能 (artificial intelligence, AI) 已成为我国的国家战略, 是未来科技发展的战略制高点。2017年7月8日, 国务院印发的《新一代人工智能发展规划》要求到2025年, AI产业进入全球价值链高端, 新一代AI在智能医疗等领域得到广泛应用。可以说, AI时代已经来临, 并在各方面影响中医药的发展。中医在AI时代, 面临着相应的机遇和挑战, 而经方由于其标准化的理论特点, 有可能成为新时代中医在主流医学体系中弯道超车的突破口之一。
AI可助力中医迅速发展
1. AI有望缩短中医人才培养周期
中医的传承, 一直面临培养周期长、成才率低的困境。一方面, 院校教育难以培养出具有临证思维与经验的临床医生;另一方面, 师承教育的效率较低, 且老师的学术思想及临床经验的传承, 往往依赖学生的悟性与总结能力。而由于中医的临床过程多属于隐性思维而难以具象化, 这就使得学生开方流于模仿而难以得其精髓, 导致中医的传承和人才培养周期较长, 难以满足当代社会的医疗需求。
深度学习, 解决了线性不可分问题 (即某一个数据集无法通过一个线性分类器, 如直线、平面等来实现分类) , 与中医辨证论治非线性、模糊性、发散性[1]等思维特点较为契合, 可以通过对海量病案数据的分析, 更准确客观地还原医生的处方用药规律, 能较好地总结名老中医学术经验, 缩短青年中医的成长周期。如王震宇[2]利用BP神经网络, 将名老中医的学术经验提取出来, 转化成为了专家系统中的规则。另有学者[3,4,5]研发了“中医处方智能分析系统”, 通过对个案进行量化演算分析, 实现了名老中医经验传承的“量化”研究。
2.AI或可实现中医疗效评价客观化
辨证论治既是中医最大的优势与特点, 也是中医疗效难以评价的原因之一。现代医学以循证证据为主要的疗效评价依据, 而中医由于其辨证属性, 往往很难用大样本、多中心、随机双盲等方法进行循证评价, 因而也就难以获得高等级的证据以证明其“有效”。
特别是在临床中, 一方面, 同一个病例由于辨证论治的特点, 每一诊的证候病机有可能不同, 医生所开方药也有会有所差异, 导致每一诊不同处方与患者最终临床结局之间的因果关系难以直接阐明;另一方面, 多数疾病无法避免现代医学治疗手段的干预, 导致中医的治疗在其中所发挥的作用难以明确。
贝叶斯网络, 由于其能描述复杂事物之间的因果关系, 可用于多种干预措施的临床疗效评价, 以明确每一种措施与各个临床结局指标之间的因果关系[6]。而不同诊次的处方, 或中医与现代医学的干预措施之间, 都可以看做是不同的干预措施而运用贝叶斯网络, 以阐明其与患者临床结局之间的因果关系, 从而实现客观化的中医疗效评价。
3.AI或将实现疾病发展规律预测
疾病的发生发展具有特定的规律, 中医自古就重视研究病传理论。如《素问·热论篇》中, 即有“伤寒一日, 太阳受之……二日, 阳明受之”的经络传变规律;至张仲景《伤寒论》以伤寒为例, 示病从六经由表入里之传变。只有掌握病传规律, 医生才能整体、动态地进行临床决策, 此为《素问》所谓的“上工治未病”。然而临床很多疾病起病凶险, 变化迅速, 医者仅凭个人经验, 往往难以做出快速而准确的判断。
AI可以通过对海量数据的分析, 得到疾病的整体传变规律, 对疾病下一阶段的发生发展趋势进行预测, 更好地指导临床治疗。如蒙特卡洛树搜索算法, 是一种以概率统计理论为指导的启发示算法, 可以通过随机概率方式, 从原始数据中推演出新的数据[7,8]。故其应用在中医病证演化规律中, 可以模拟出病机传变的最大可能路径, 使得中医“治未病”理念在临床中得到更广泛的运用。
因此, AI对中医在新时代的发展具有较大意义。但由于多种原因, 导致目前中医在相关领域的研究遇到一定瓶颈, 中医智能化仍面临不小的挑战。
中医智能化的挑战
当前, 中医在AI方面的研究主要面临着标准化缺失、基础数据不足等瓶颈与挑战。
1. 标准化的缺失
无论是名老中医经验挖掘, 还是证候学与疗效评价研究, 或是病传预测, AI的研究都离不开标准化。一方面, 人工神经网络 (artificial neural network, ANN) 中输入层神经元的变量 (如四诊信息) 需要进行统一的标准化识别;另一方面, 输出层神经元 (如证候诊断或处方) 也需要形成统一规范。但现在中医与标准化的要求之间仍存在着三大矛盾: (1) 标准化证候规范与临床证候复杂多变性之间的矛盾, (2) 标准化治则治法规范与临床立法的多样性之间的矛盾, (3) 标准化处方规范与中医个体化治疗特点之间的矛盾[9]。
证候标准化的缺乏, 可导致深度学习在输出层的维度不一, 相应的其训练集所需要的数据量就会增大, 且验证难度也随之提高;处方规范化不足, 临床加减过多, 则输出集无法以“方剂”的形式直接输出而需要深入到药物配伍的维度, 也给深度学习的训练造成巨大困难。
而证候标准化的矛盾, 本身既是证候研究中亟待解决的关键问题, 又是AI时代证候研究的新出路所在。传统常用的因子分析、聚类分析、多元线性回归分析等, 可以建立证候的线性模型, 实现一定程度上的客观分类及标准化诊断。但证候并不是单纯的“症状集合”, 而是对疾病阶段性病机的本质概括[[10]], 具有“线性不可分”的特征, 而这正是ANN的优势。
2. 基础数据不足
目前, 中医运用ANN所进行的研究大多不超过1 000例。如, 刘哲等[11]研究肺癌患者化疗前后中医证候的不同, 样本量为122例;岳桂华等[12]、覃裕旺等[13]研究高血压中医证候与分级及危险分层的关系, 样本量分别是77例、154例;徐亮等[14]运用研究名老中医气虚证辨证模型, 样本量为684例;李建生等[15]研究2型糖尿病中医证候诊断标准, 样本量为1 134例。
ANN之所以能摸拟人脑的思维对事物进行分类或者决策, 是因为其基于对海量数据的原始特征进行学习, 通过多个隐层之间的映射与传递, 以还原出原始数据与其特征之间的映射关系。在这过程中各隐层以接力的方式对原始数据特征进行学习。所谓“深度”, 就是指ANN中神经元层次, 特别是隐层的数量。隐层数越多, 其输出的特征与原始数据真实特征之间的差距就越小, 但相应其训练所需要的数据量就越大。因此, 纳入研究的样本量不足, 就意味着其所搭建的ANN隐层数有限, 其所得出的模型与真实世界之间也就存在着一定差距。
在一定程度上, 样本量的不足是标准化程度较低所致的。如, 在名老中医学术经验的智能化研究中, 由于不同的名老中医, 各有其学术思想特点, 也就有着不同的辨证体系;即使同一种辨证体系中, 也有不同的证候分类标准;相似的证候, 处方用药也各有特点[9]。因此, 若把学术背景、用药风格完全不同的名老中医医案纳入同一个辨证模型中进行学习, 并且难以做到标准化, 其变量 (输入层、隐层、输出层的神经元数量) 极为繁杂, 相应地, 训练集所需要的样本量也是海量的。
而解决的方案有两种:第一种, 扩大训练集的样本量, 但由于现今数据开放共享度不佳, 这一方法较难实现;第二种, 以多种算法组合为构架, 并运用降维方法缩小训练所需要的样本量。
可见, 基础数据量的不足, 也是在标准化缺失这一瓶颈之上衍生出来的。中医智能化面临着较大的挑战, 需要有新的思路与方法。而经方, 由于其标准化的理论特点, 是中医在AI时代的突破口。若能在经方标准化的基础上, 构建多算法融合的AI复合辨证模型系统, 中医在AI时代, 或有望实现在主流医学体系中的弯道超车。
经方是中医智能化的突破口
经方, 是以张仲景所著《伤寒论》与《金匮要略》为代表的汉唐方脉医学体系[[16]], 其在理法方药各方面都具有标准化的特点。
1.经方理论的标准化特点
经方理论在辨证体系上具有六经辨证唯一性;在临证立法上具有治则治法严谨性;在处方用药上具有合方加减的规范性[9]。
其中, 六经辨证具体有客观化的辨证标准及规范化的证候体系。如六经提纲证即为六经辨证的标准, 合乎标准即可作出诊断。六经辨证的证候体系, 表证如太阳病分中风、伤寒两大证候系统, 这规范了六经病中凡属表证皆不离中风、伤寒这两条主线, 此即六经辨证所确立的证候规范。
经方的配伍严谨, 强调原方、原量 (或原比例) , 对加减合方极为谨慎, 因为在《伤寒论》与《金匮要略》中, 加减一药, 即成新方。如《伤寒论》中麻黄附子甘草汤, 主治少阴表证;而《金匮要略》中麻黄附子汤, 仅比麻黄附子甘草汤中麻黄多一两, 即主治少阴水气病。
经方的这些标准化特点为AI的研究, 如, ANN搭建智能化的辨证模型及病传预测模型等, 提供了坚实的标准化基础。从经方入手进行智能化研究, 上述中医在AI时代所遇到的瓶颈与挑战或能得到解决。
2. 经方临证思维路径
经方智能化应首先厘清经方临床思维的主要路径。本文以太阳病为例, 简述经方临证三大路径。
2.1 首辨六经归属
六经是张仲景对错综复杂的临床问题所进行的病机分类。其基于“阴阳”的中医哲学框架, 是对风寒湿燥火所导致的营卫失和、胃气强弱虚实寒热、津液输布离合障碍、三焦承奉制化不利所形成的6种病势的高度概括。如风寒湿邪侵袭人体, 导致津液趋表与外邪相争, 出现营卫不利、上焦表位失和的一大类临床病证, 以“脉浮、头项强痛、恶寒”为主要特点, 张仲景即辨为“太阳病”。
2.2 次辨病机方证
在六经归属确定之后, 还需在其框架之下, 进一步审察津液之虚实、营卫之盛衰、胃气之强弱等, 以辨析病机证候与方证。
如在太阳病中, 津液相对不足而在表位涣散, 营弱卫强, 则属太阳中风证, 此为在病机层面对现阶段的临床本质进行的总结, 故属于病机证候。
而病机证候确立之后, 相应的方证也要随之确立, 如太阳中风的主方证为桂枝汤证, 临床还需根据其是否兼夹气逆、热化、水饮等病机, 再细辨其具体是否属于太阳中风中的桂枝加厚朴杏子汤证、桂枝加葛根汤证、桂枝去桂加茯苓白术汤证等兼变证。
2.3 预测病传规律
经方每治一病, 都建立在病传的高度去审视病机证候。故张仲景在《伤寒论》中以六经总括临床诸病之传变。在做出处方选药的临床决策之后, 还需要根据其当前所处的病机层面进行下一步的预测, 方能在整体上治愈疾患。
如《伤寒论》第164条谓:“伤寒大下后, 复发汗, 心下痞, 恶寒者, 表未解也, 不可攻痞, 当先解表, 表解乃可攻痞。解表宜桂枝汤, 攻痞宜大黄黄连泻心汤”。此条述太阳中风, 误下表邪入里, 病有内传阳明里热之势, 但里实未成, 太阳表仍未解。此时若直接用太阳阳明同治法 (如厚朴七物汤) , 过于苦泻而表解不透, 故张仲景依病传先予桂枝汤解太阳未解的病之来路, 再予大黄黄连泻心汤治阳明里热将成的病之去路。
依病传治之的理念, 体现了经方理法的次第, 贯穿《伤寒论》与《金匮要略》始终, 是经方的灵魂, 也是临证中最难把控之处。
3. 经方智能化的思路与方法
依据上述的经方三大临证路径, 经方智能化也可以通过相应的算法, 建立复合结构的AI模型。
3.1 六经分证的辨证模型研究思路
经方临证思维的第一阶段, 是确立六经病的归属, 六经病是对临床疾病6种大的病机概括, 各有其病机特点与方药, 这就类似机器学习中, 监督学习的分类问题。如, k-近邻学, 其能给定测试样本, 基于某种距离度量找出训练集中与其最靠近的k个训练样本, 然后基于这k个“邻居”的信息来进行预测[17]。
然而, 分类将样本集划分为k个互不相交的子集, 这与六经的病机特点略有出入。六经病中, 三阳病病机泾渭分明, 故治法迥然有别而不可混淆, 如太阳病当发其汗, 阳明病当清其里, 少阳病不可汗吐下, 只能和解表里。而三阴病病机互含, 故“四逆辈”贯穿始终, 如太阴病藏虚有寒、少阴病真阳不足、厥阴病阴阳离决, 当分别予四逆汤、通脉四逆汤、通脉四逆加猪胆汁汤等。因此, k-近邻学习等分类算法, 对于三阳病较为适合, 对于三阴病就有线性分割之弊端。这时可以考虑先行降维处理, 如, 加入主成分分析或因子分析等, 将错综复杂的临床信息, 降维成经方中固有的表寒、里热、里虚、里实、血少、水饮等基础病机, 再进行分类, 或可解决此类问题。
3.2 方证辨识的辨证模型研究思路
当六经归属确定之后, 就可进入第二层次的建模——应用ANN对辨证处方进行学习。目前已有多种ANN算法在中医各领域研究中得到应用, 其中, 应用最广的是BP神经网络。该方法将学习过程分为两个阶段:第一阶段, 用一组训练样本对网络进行训练, 每一个样本都包含输入与期望输出两部分;第二阶段, 以输出值与样本的期望输出值进行比较。如果其误差不能满足要求, 则沿着原来的连接通路逐层返回, 并利用两者的误差按一定的规则对各层节点的连接权值和阈值进行调整, 使误差逐渐减小, 直到满足要求为止。
运用ANN, 在数据量足够的基础上, 能最大限度地还原经方的处方思维, 为医生临床决策提供智能化的数据参考。
3.3 病传规律的预测模型研究思路
在上述算法路径完成之后, 还可根据当前的病机特点, 运用贝叶斯网络或蒙特卡洛树搜索算法、时间序列、隐马尔可夫模型等, 计算出下一步的病传规律。2016年, 谷歌旗下DeepMind公司发开的AlphaGo, 正是将ANN与蒙特卡洛树搜索算法相结合, 击败了围棋世界冠军李世石。其中, ANN实现下棋过程中的决策, 即每一步的走法, 蒙特卡洛树搜索算法则是决定了每一步的前进过程[18]。这与经方依病传用方的思路极为吻合。若能利用此类算法, 模拟疾病的进展衍化规律, 则临床医生便能更为准确地制定出整体治疗方案。
基于上述“分类-ANN-预测”的复合结构, 经方AI辨证处方及病传预测模型可为临床医生的辨证处方决策提供基于大数据的智能化路径参考, 某种程度上也具备一定的“循征”特点, 同时为中医人才培养和疗效评价客观化提供了新的可能。经方由于其标准化特点, 具有先天的智能化属性, 或可成为中医在AI时代的新范式。
来源:中华中医药杂志 作者:林树元 刘畅 李煜 曹灵勇