딥러닝 모델 성능 개선 Tip 모음
본 포스트는 경희대학교 컴퓨터공학과 동아리 D.COM에서 진행한 D.Competition 대회에서 배부한 모델 성능 향상 가이드라인입니다. 전체적인 내용은 Andrew Ng
[논문 리뷰] Language Models are Unsupervised Multitask Learners
이번 시간에는 GPT-2 논문을 리뷰합니다. GPT-2는 GPT-1의 후속 모델로,이전 모델과 전체적인 구조는 비슷하나, 보다 더 크고
[논문 리뷰] Improving Language Understanding by Generative Pre-Training
이번 시간에는 GPT-1 논문을 리뷰합니다. BERT와 함께 NLP에 한 획은 그은 모델 중 하나로, 이때부터 NLP 프리트레인과 파인튜닝 모델이
[논문 리뷰] RoBERTa: A Robustly Optimized BERT Pretraining Approach
이번 시간에는 RoBERTa 논문을 리뷰합니다. RoBERTa는 BERT의 파생 모델로, 기존 모델에 추가적인 학습 방법을 제시하여 성능을 향상시켰습니다. 모델 구조에 큰
[논문 리뷰] ALBERT: A Lite BERT for Self-supervised Learning of Language Representations
이번 시간에는 ALBERT 논문을 리뷰합니다. ALBERT는 BERT의 파생 모델입니다. 두가지 파라미터를 줄이는 기법을 통해 기존 BERT 모델보다 적은 파라미터와 학습
한국어 NLP는 왜 어려울까?
한국어 NLP는 왜 어려울까?
컴퓨터에게 사람의 말을 알아듣게 하는 것은 매우 어려운 일입니다. 그중에서도 한국어 NLP는 다른 언어들(Ex. 영어,
[논문 리뷰] BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension
이번 시간에는 BART: Denoising Sequence-to-Sequence Pre-training for Natural Language Generation, Translation, and Comprehension 논문을 리뷰합니다.
BART는 Facebook에서
머신러닝/딥러닝 논문 어떻게 잘 읽을 수 있을까?
이번 시간에는 Andrew Ng 교수님의 Stanford ML 수업에서 다룬 효율적인 논문 읽기를 정리해보았습니다.
원본 강좌는 아래에서 확인할 수 있습니다.
Stanford
[논문 리뷰] BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding
이번 시간에는 BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding 논문을 리뷰합니다.
BERT는 등장과 동시에 Question Answering 등
[논문 리뷰] Attention is All You Need
이번 시간에는 NLP 발전에 한 획을 그은 Attention is All You Need 논문을 리뷰합니다.
본 논문에서는 self-attention만을 사용한 transformer라는