从微笑文件中检索所有分子

Question

从微笑文件中检索所有分子

sam*_*sam 3 python bioinformatics biopython cheminformatics

我正在研究.smiles文件..smiles文件的文件结构是:http://en.wikipedia.org/wiki/Chemical_file_format#SMILES

我想从微笑文件中获取所有原子.这意味着如果存在单个"C"原子,则意味着将有4个"H"原子连接到它们.

我在搜索时发现python中有一些模块可以解析微笑格式,但它们不会给出支持的氢原子.(例如:它们只给'C'而不是其他4'H'原子连接到'C'原子)

如何使用python找到所有原子,包括连接的'H'原子.
需要转换为包含连接的'H'原子的所有原子的smiles文件示例:

[H]OC([H])([H])[C@@]1([H])C([H])=C([H])[C@@]([H])(n2c([H])nc3c(nc(nc23)N([H])[H])N([H])C2([H])C([H])([H])C2([H])[H])C1([H])[H]

Run Code Online (Sandbox Code Playgroud)

先感谢您.

Answer 1

pra*_*nsg 6

见Open Babel.

Open Babel网站上的有用链接

另请参阅
本博客(由Casper Steinmann撰写)关于化学与Python(使用Open Babel,但并非所有)

更新请参阅此代码(未经测试):

mymol = pybel.readstring("smi",  
"[H]OC([H])([H])[C@@]1([H])C([H])=C([H])[C@@]([H])(n2c([H])nc3c(nc(nc23)" + \
"N([H])[H])N([H])C2([H])C([H])([H])C2([H])[H])C1([H])[H")
print mymol.addh()

Run Code Online (Sandbox Code Playgroud)

归档时间：	12 年，8 月前
查看次数：	2107 次
最近记录：	11 年，8 月前