Efficient learning of nonautoregressive graph variational autoencoders for molecular graphgeneration_综合

阅读笔记-Efficient learning of non-autoregressive graph variational autoencoders for molecular graph generation

概要
方法
- 表示符号
- 图形变分自动编码器

概要

SMILES：简化分子线性输入规范（SMILES），是一种用ASCII字符串明确描述分子结构的规范。
关于分子图的生成方法主要有两类： $non?autoregressive\mathbf {non-autoregressive}$ 与 $autoregressive\mathbf {autoregressive}$ 、非自回归的方法允许更有原则地生成模型，无需任何迭代过程即可使用非自回归分布 $p(G∣z)p(\mathcal G|\mathbf z)$ 直接从潜在变量 $z\mathbf z$ 生成分子图结构 $G\mathcal G$ ，具有快速高效的优点但性能较差。由于图同构所带来的挑战，即一个分子图对其节点的排列不变性，基于这种方法的方法很少被提出。目前有两种基于非自回归的工作 $GraphVAE\mathbf {GraphVAE}$ 和 $MolGAN{\mathbf {MolGAN}}$ 。 $GraphVAE\mathbf {GraphVAE}$ 中图的同构问题是通过计算量大的图匹配过程来解决的。而 $MolGAN{\mathbf {MolGAN}}$ 的训练遭受模式崩溃问题，因此生成的分子图较少。非自回归方法以非常快速和有效的方式成功地生成了小分子图，但是在生成较大的图时存在模型训练困难和有效率低的问题。由于这种局限性，旨在使用自回归分布按节点顺序生成一个分子图节点的自回归方法已成为主要研究方向。这些方法成功地生成了高有效性的分子图，但每生成一次都需要迭代，效率较低。

方法

表示符号

$G=(V,E)\mathcal G=(\mathcal{V},\mathcal {E})$ ：表示一个具有 $m$ 个节点的无向图。 $V\mathcal V$ 和 $E\mathcal E$ 分别表示节点集合与边的集合。
$vi∈V\mathbf v_{i}\in\mathcal V$ ：表示节点向量；
$ei,j∈E\mathbf e^{i,j}\in\mathcal E$ 表示边向量，并且由于是无向图，所以有： $ei,j=ej,i\mathbf e^{i,j}=\mathbf e^{j,i}$ 。 $ei,j\mathbf e^{i,j}$ 表示第 $i$ 个原子和第 $j$ 个原子之间的化学键，并且它是一个表示化学键类型的 $q$ 维的 $o n e ? h o t$ 向量。为了简单起见，作者对分子内部的化学键进行了简化，因此只需要考虑单键，双键，三键，无键，因此 $q = 4$ ；
对于第 $i$ 个原子 $vi=(vi,1,...,vv,p)\mathbf v^{i}=(v^{i,1},...,v^{v,p})$ 是由表示原子类型，电荷形式和显示氢原子数量的三个one-hot向量串联而成的一个 $p\mathbf p$ 维的向量，并且 $p\mathbf p$ 依赖于所使用的数据集。
$y=(y^{1},...,y^{l})$ ：是代表分子性质的表示向量。

图形变分自动编码器

作者构建了一个条件非自回归图自编码器。它的目的是找到一个基于潜在表示向量 $z\mathbf z$ ，分子性质向量 $y\mathbf y$ ，模型参数 $θ\mathbf {\theta}$ 的图 $G\mathcal G$ 的生成分布 $pθ(G∣z,y)\mathcal {p}_{\mathbf \theta}(\mathcal G|\mathbf {z,y})$ 。并且， $z\mathbf z$ 和 $y\mathbf y$ 的先验分布应该为： $p(z)=N(z∣0,I)\mathcal p(\mathbf z)=\mathcal N(\mathcal z|\mathbf 0,\mathbf I)$ ， $p(y)=N(y∣μy,Σy)\mathcal p(\mathbf y)=\mathcal N(\mathbf y|\mathbf{ \mu}_{\mathbf y},\mathbf {\Sigma}_{\mathbf y})$ 。
分布 $q?(z∣G,y)q_{\phi}(\mathbf z|\mathcal G,\mathbf y)$ ,以及分布 $pθ(G∣z,y)p_{\theta}(\mathcal G|\mathbf z,\mathbf y)$ 分别被称为编码器和解码器。对于解码器，使用的是消息传递神经网络 $MPNN\mathbf {MPNN}$ (它是图神经网络的一种变体，可直接在不同大小的图上运行，并且对图结构具有同构不变性。)解码器的输入时 $G\mathcal G$ 与 $y\mathbf y$ 输出一组仿射参数：平均值向量 $μz(G,y)\mathbf {\mu}_{\mathbf z}(\mathcal G,\mathbf y)$ ，方差向量 $σz2(G,y)\mathbf {\sigma}^{2}_{\mathbf z}(\mathcal G,\mathbf y)$ 。 $?∈N(0,I)\epsilon \in\mathcal N(\mathbf 0,\mathbf I)$ ，可以得到图的潜在表示向量 $z$ 为 $z=μz(G,y)+??σz2(G,y)\mathbf z=\mathbf {\mu}_{\mathbf z}(\mathcal G,\mathbf y)+\mathbf \epsilon\bigodot\mathbf {\sigma}^{2}_{\mathbf z}(\mathcal G,\mathbf y)$ 。而解码器是一个全连接神经网络。