Py4chemoinformatics
文章目录
Brief info
- This is a reading notebook for the book 《py4chemoinformatics》
遇到的专业名词
chemoinformatics
- 化学信息学
RDKit
- link: http://www.rdkit.org/
- github: https://github.com/rdkit/rdkit
definition:
- RDKit is a collection of cheminformatics and machine-learning software written in C++ and Python.
OpenBable
- link: http://openbabel.org/wiki/Main_Page
definition:
- Open Babel is a chemical toolbox designed to speak the many languages of chemical data. It's an open, collaborative project allowing anyone to search, convert, analyze, or store data from molecular modeling, chemistry, solid-state materials, biochemistry, or related areas.
SKlearn
- 即 SciKit-learn
说明:
- Scikit-learn(sklearn)是机器学习中常用的第三方模块, 对常用的机器学习方法进行了封装,包括回归(Regression)、 降维(Dimensionality Reduction)、分类(Classfication)、 聚类(Clustering)等方法。
- 机器学习相关
教程
- link: https://blog.csdn.net/xiaoyi_eric/article/details/79952325
作者提供资源
https://github.com/Mishima-syk/sklearn-tutorial
- in jupyter notebook format
- 日语
机器学习
- Machine Learning
SMILES
Simplified molecular-input line-entry system
- 简化分子输入规范
- simplified molecular input line entry specifications
link: https://en.wikipedia.org/wiki/Simplified_molecular-input_line-entry_system
- wikipedia page
link: https://baike.baidu.com/item/SMILES/6655640?fr=aladdin
- 百度百科
definition:
- is a specification in form of a line notation for describing the structure of chemical species using short ASCII strings.
一种用 ASCII 字符串, 写出来的, 用来描述, 分子结构的, 文字表达方式
- 就是 用字符串表示分子结构式的一种方式
- 教程: http://www.daylight.com/meetings/summerschool98/course/dave/smiles-intro.html#TOC
- molecular editor
MMPA
MMP
- Matched Molecular Pair , analysis
可视化
Cytoscape
- 一种广泛用于各种场景的开源网络可视化软件
安装使用
- 安装很简单,从下载站点下载相应的 OS 安装程序仅安装。 安装完成后,启动 Cytoscape 并“安装 Chemviz2 插件”以绘制复合结构 我会的程序很简单。从 Apps-> App Manager 中选择 chemviz2 并安装它。
本书中用途
- 使用 Cytoscape 可视化 MMP 网络
mmpdb
- 另一种 可视化软件
- 命令行运行
Chemical Space
化学空间
- 化学空间是指化合物在一定比例的 n 维空间中的排列。
RDKit
安装
1 2 3 4 5 6 7 8 9conda create -n py4chemoinformatics python3.6 source activate py4chemoinformatis #install packages conda install -c conda-forge rdkit conda install -c conda-forge seaborn conda install -c conda-forge ggplot conda install -c conda-forge git相关软件
- rdkit
seaborn
- 其中一个图形绘制包是它可以用一致的语法合理地绘制。最初称为 R. 它是为统计分析语言开发的,但已由一家名为 yhat 的公司移植到 Python。
ggplot
- 它是可视化统计数据的软件包之一。
使用
相关软件
python3
作者推荐书籍
- 名字: Python Boot Camp
相关网站
- udemy: https://www.udemy.com/topic/python/
- https:// https://github.com/Mishima-syk/py4chemoinformatics/issues
- Qiita: https://qiita.com/
- stackoverflow: https://stackoverflow.com/
- 日语网站
jupyter notebook
可插入可视化内容
如:
- 图片
- 程序生成的图像, 可视化结果的等等
教程
在 jupyter notebook 上使用 RDKit
数据库
- chemoinformatics 常用的数据库
数据库列表
- ChEBIL
ChEBIL
- 前身:stARLITe
- 相关名词
PubChem
文章作者
上次更新 2023-02-10 (97c415e)