强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,主要用于时变系统控制规则构建和对战博弈策略构建。

半监督分类是在无类标签的样例的帮助下训练有类标签的样本,获得比只用有类标签的样本训练得到的分类器性能更优的分类器,弥补有类标签的样本不足的缺陷。

无监督学习只利用未标记的样本集,而监督学习则只利用标记的样本集进行学习。但在很多实际问题中,只有少量的带有标记的数据,因为对数据进行标记的代价有时很高,比如在生物学中,对某种蛋白质的结构分析或者功能鉴定,可能会花上生物学家很多年的工作,而大量的未标记的数据却很容易得到,这就促使能同时利用标记样本和未标记样本的半监督学习技术迅速发展起来。

GAN中的生成器坍塌到一个极小的分布内,生成的样本不再变化,这种现象称为模型坍塌。边界平衡生成对抗网络BEGAN可以解决解决模型坍塌问题,和大多数GAN交替训练生成器和判别器不同,它允许在每一步以对抗的方式同时训练两个网络。

CGAN的全拼是Conditional Generative Adversarial Networks,条件生成对抗网络,它是GAN真正大展拳脚的开始。

DCGAN(Deep Convolutional GAN)是基础GAN的改进版之一,也是第一个全卷积的GAN,使用了卷积神经网络代替了基础GAN中的多层感知机。

生成对抗网络(GANs)是一种由两个相互竞争的网络组成的深度神经网络架构。
0%