生成对抗网络(Generative Adversarial Nets) 作为生成模型的一种,从2013年提出以来就在CV界大放异彩,各种玩法层出不穷。本文旨在了解GAN的进展的同时针对文章中具体实现的方法进行琢磨,希望能在阅读文章的过程中找到训练GAN的有效的方法或者Trick,具体Code基于Pytorch,并不定时更新。
20170322 [CA] Social Scene Understanding End-to-End Multi-Person Action Localization adn Collective acitivty
这篇文章是一篇新的与Collective activity有关的文章,2016年11月挂在arxiv上然而最近才看到。作者有大牛Silvio Saverese。
这篇文章主要贡献在于提出了一个真正的end-to-end的框架,把多人检测和群体行为识别做在了一起,这个也是我们想到要做的,不料被先做出来了。
文章主要用的的是FCN做detection个recognition的特征提取,主要架构是detection和基于rnn的recognition。此外,本文对单帧检测人之后在视频中matching的方法,虽然方法比较简单,但是个人觉得是一个值得思考的问题。
20170121-Pytorch入门笔记
Pytorch顾名思义是torch移植到python的一个实现,标榜的是与numpy相似的操作与高效利用GPU计算资源。
本来已经加入Tensorflow阵营的我在tf的静态图构建和缓慢的gpu加速的夹击之下感到绝望,故尝试Pytorch会不会对代码进行加速以及利用更好的架构来优化代码。
Pytorch与其他框架最大的不同感觉是在于Pytorch构建的是动态的计算流图,据说在计算的时候可以动态改变图的架构而不用重新构建一个新的图。
为了快速上手Pytorch,我们先把MNIST例程放在首位,通过对例程的理解学习Pytorch。
20170104 Structual-RNN Deep Learning on Spatio-Temporal Graphs
Structural-RNN: Deep Learning on Spatio-Temporal Graphs
By Ashesh Jain
CVPR2016 Oral
[20160531] Discriminative Embeddings of Latent Variable Models for Structured Data
Discriminative Embedding of Latent Variable Models for Structured Data
By Hanjun Dai, Bo Dai, Le Song
Georgia Institute of Technology
20160429 Neural Machine Translation by jointly learning to align and translate
Neural Machine Translation by jointly learning to align and translate
By Dzmitry Bahdanau, KyungHyun Cho, Yoshua Bengio
[20160423]Human Activity Recognition and Prediction (C-6)
Human Activity Recognition and Prediction By Yun Fu
Chapter 6 Activity Prediction