外排转运蛋白多药耐药相关蛋白-2属于ATP结合盒超家族。该蛋白质家族在多重耐药性和药物-药物相互作用中起着非常重要的作用。这些外排转运蛋白被认为是药物增效的最重要目标。研究人员将它们用于研究外排转运蛋白,以预测底物,非底物,抑制剂和非抑制剂。先前在与蛋白质-2外排转运蛋白相关的多药耐药性抑制剂的预测模型上进行的工作表明,在机器学习后产生了良好的结果。
 
Sahil Kharangarh等人撰写的这项工作的目的。是为了处理机器学习模型的开发,该机器学习模型也具有足够的预测性,可以使用精炼的数据对与蛋白质-2转运蛋白相关的多药耐药性的抑制剂和非抑制剂进行分类。在他们的评论中,许多与机器学习相关的预测算法被用于开发模型,例如支持向量机,随机森林和k-最近邻。其他方法如方差阈值,SelectKBest,随机森林和递归特征消除被用于选择PyDPI生成的特征。由124种抑制剂和115种非抑制剂组成的总共239个分子用于该模型的开发。
 
还观察到基于使用递归特征消除方法选择的那些特征的支持向量机模型显示出最佳性能。该模型可用于鉴定多药耐药相关蛋白-2外排转运蛋白的抑制剂。