摘要::目的 针对现有药物研发中分子活性值预测不精、泛化性不高等问题,提出基于知识先验与注意力机制相结 合的多通道语义深度神经网络,通过使用分子的 SMILES(Simplified Molecular Input Line Entry System)表达式,预测 雌激素受体 α 亚型(ERα)的 pIC50 生物活性值。 方法 该网络采用两阶段特征提取策略,在语义层设计了将知识先 验与迁移学习结合的语义分析网络,它将分子 SMILES、描述符和图表征的关键信息定位,通过在 Erα 数据集中微 调参数,得到综合的分子 SMILES 表征信息;在通道层,基于高效通道注意力(Efficient Channel Attention, ECA)机 制,设计了 1D-ECA 算法,将其嵌入 CNN 子模块中,构成多通道深度神经 1D-ECA-CNN 模块,实现分子表征的特 征再提取,并减少分子表示学习过程中的信息损失;最后将语义层和通道层相结合形成 KBAC(Knowledge-BERT- 1D-ECA-CNN)深度神经网络,实现 pIC50 生物活性值的回归预测。 结果 实验结果表明:所提出的框架在 4 个评 估指标上均表现优异,MAE 可达 0. 091,MSE 可达 0. 014,RMSE 可达 0. 117,R 2 可达 0. 993,相对于 4 个具有代表 性的模型有较为明显的提升,说明所提模型具有更高的预测精度。 结论 该两阶段特征提取过程使其能够获取更为 全面的分子特征,从而帮助筛选治疗疾病的候选药物。