摘要
本发明公开了一种确定smiles表达式之间是否具有子结构关系的方法,包括:定义并存储常见原子、化学键和支链关系;定义切片最小粒度:相邻原子与之间的化学键关系与主支链关系作为最小粒度单位;定义起始原子和终止原子,其中起始原子为所述最小粒度对应的第一个原子,终止原子为所述最小粒度对应的第二个原子;基于常见原子、化学键和支链关系对获取的smiles表达式进行分析以将smiles表达式切割成一个个原子对,统计smiles表达式包含的环的个数及原子对的种类、种类个数并存储到哈希表中;根据原子对的种类、种类个数、环的个数确定smiles表达式之间是否具有子结构关系。本发明方法可用于化学式部分结构检索,方法简单,执行效率高。
-
单位厦门中坤化学有限公司; 武汉科技大学