[DL / CV] Computer Vision 논문 공부 순서 정리
1. ImageNet Classification with Deep Convolutional Neural Networks(AlexNet)
https://proceedings.neurips.cc/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf
CNN 의 기초논문
2. Going deeper with convolutions(Inception-v1)
Inception module 을 제시한 논문
3. Rethinking the Inception Architecture for Computer Vision (Inception-v2~3)
arxiv.org/pdf/1512.00567v3.pdf
Inception module 에서 여러 기법을 추가한 논문
4. Deep Residual Learning for Image Recognition (ResNet)
arxiv.org/pdf/1512.03385v1.pdf
skip connection 을 처음 제시한 논문
5. Squeeze and Excitation Network(SENet)
Channel Attention 을 처음 제시한 논문
6. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks(EfficientNet)
arxiv.org/pdf/1905.11946v5.pdf
Resolution * depth * width 의 최적비율을 찾는 논문 -> 적은 flop 으로 높은 acc 를 보여준다.
7. You Only Look Once: Unified, Real-Time Object Detection
CVPR 2016 Open Access Repository
Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi; Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 779-788 We present YOLO, a new approach to object detection. Prior work on object detection repurpos
www.cv-foundation.org
object detection 의 시작. 현재까지도 YoLO 는 지속적으로 버전업데이트를 하고 있으며 매우 좋은 성능을 보인다.
8. Generative Adversarial Networks(GAN)
https://dl.acm.org/doi/abs/10.1145/3422622
Generative adversarial networks | Communications of the ACM
Generative adversarial networks are a kind of artificial intelligence algorithm designed to solve the generative modeling problem. The goal of a generative model is to study a collection of training examples and learn the probability distribution that ...
dl.acm.org
두 개의 모델을 경쟁시켜 생성 모델을 학습시키는 방법. 추후 여러 GAN과 관련된 논문이 나와서 기초를 이해하는데 좋을 듯 하다.
9. Rich feature hierarchies for accurate object detection and semantic segmentation
논문 자체는 2014 년 논문이다. 하지만 Object Detection 쪽에서 중요하게 다뤄지는 논문이므로 넣었다.
10. Attention Is All You Need
https://proceedings.neurips.cc/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdf
Transformer 라는 현재 딥러닝의 메인스트림이 되는 개념을 제시한 논문.
NLP, ASR, CV 등 분야를 가리지 않고 Transformer 를 사용하는 추세이므로 반드시 읽어야 한다고 생각해서 넣었다.