Deep Learning/cv

[DL / CV] Computer Vision 논문 공부 순서 정리

LiaLi_1997 2023. 4. 5. 00:35

1. ImageNet Classification with Deep Convolutional Neural Networks(AlexNet)

https://proceedings.neurips.cc/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf

 

CNN 의 기초논문


2. Going deeper with convolutions(Inception-v1)

arxiv.org/pdf/1409.4842v1.pdf

 

Inception module 을 제시한 논문


3. Rethinking the Inception Architecture for Computer Vision (Inception-v2~3)

arxiv.org/pdf/1512.00567v3.pdf

 

Inception module 에서 여러 기법을 추가한 논문

 


4. Deep Residual Learning for Image Recognition (ResNet)

arxiv.org/pdf/1512.03385v1.pdf

 

skip connection 을 처음 제시한 논문

 


5. Squeeze and Excitation Network(SENet)

https://openaccess.thecvf.com/content_cvpr_2018/papers/Hu_Squeeze-and-Excitation_Networks_CVPR_2018_paper.pdf

 

Channel Attention 을 처음 제시한 논문

 


6. EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks(EfficientNet)

arxiv.org/pdf/1905.11946v5.pdf

 

Resolution * depth * width 의 최적비율을 찾는 논문 -> 적은 flop 으로 높은 acc 를 보여준다.


7. You Only Look Once: Unified, Real-Time Object Detection

https://www.cv-foundation.org/openaccess/content_cvpr_2016/html/Redmon_You_Only_Look_CVPR_2016_paper.html

 

CVPR 2016 Open Access Repository

Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi; Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016, pp. 779-788 We present YOLO, a new approach to object detection. Prior work on object detection repurpos

www.cv-foundation.org

object detection 의 시작. 현재까지도 YoLO 는 지속적으로 버전업데이트를 하고 있으며 매우 좋은 성능을 보인다.


 

8. Generative Adversarial Networks(GAN)

https://dl.acm.org/doi/abs/10.1145/3422622

 

Generative adversarial networks | Communications of the ACM

Generative adversarial networks are a kind of artificial intelligence algorithm designed to solve the generative modeling problem. The goal of a generative model is to study a collection of training examples and learn the probability distribution that ...

dl.acm.org

두 개의 모델을 경쟁시켜 생성 모델을 학습시키는 방법. 추후 여러 GAN과 관련된 논문이 나와서 기초를 이해하는데 좋을 듯 하다.


9. Rich feature hierarchies for accurate object detection and semantic segmentation

 

https://openaccess.thecvf.com/content_cvpr_2014/papers/Girshick_Rich_Feature_Hierarchies_2014_CVPR_paper.pdf

 

논문 자체는 2014 년 논문이다. 하지만 Object Detection 쪽에서 중요하게 다뤄지는 논문이므로 넣었다.

 


10. Attention Is All You Need

https://proceedings.neurips.cc/paper/2017/file/3f5ee243547dee91fbd053c1c4a845aa-Paper.pdf

 

Transformer 라는 현재 딥러닝의 메인스트림이 되는 개념을 제시한 논문.

NLP, ASR, CV 등 분야를 가리지 않고 Transformer 를 사용하는 추세이므로 반드시 읽어야 한다고 생각해서 넣었다.