[매일 논문 초록 읽기 : 29일차] Student와 Teacher에게 적합한 난이도의 훈련 예제를 생성하는 방법을 추가한 Tutor-KD

인공지능/매일 논문 초록 읽기

언유상 2023. 12. 9. 20:21

사전학습 언어모델은 NLP task들에서 눈에 띄는 성공을 이루어냈지만, 모델 크기를 키워야 한다는 비용을 치러야 했다. 이러한 문제를 해결하기 위해서, 지식 증류는 언어모델을 압축하는데 광범위하게 적용되었다.

하지만, 언어모델에 대한 일반적인 KD 방법론은 학습 예제들의 난이도를 간과하여, teacher 모델의 부정확한 예측 전이, 비효율적인 방법 사용 등에 시달리고 있다.

이 논문에서, 우리는 사전학습을 진행하는 과정에서 학습 예제들의 난이도를 조절하여 distillation의 효율성을 향상시키는 새로운 KD 프레임워크, Tutor-KD를 소개한다.

우리는 student에게는 어렵지만 teacher에게는 쉬는 예제들을 생성하고, 조심스럽게 디자인된 Policy gradient 방법론으로 학습시킨다.

실험 결과는 Tutor-KD가 GLUE benchmark에서 다양한 크기의 student model들에 대해 KD 방법론을 적용한 것들 중 SOTA를 달성하였고, tutor의 존재가 student를 위한 학습 예제들을 효율적으로 생성해줄 수 있음을 보였다.

제목 : Tutoring Helps Students Learn Better: Improving Knowledge Distillation for BERT with Tutor Network

[매일 논문 초록 읽기 : 31일차] 시간이 흐름에 따라 발생하는 catastrophic forgetting을 방지하는 방법론 (0)	2023.12.10
[매일 논문 초록 읽기 : 30일차] BERT를 압축하고 지연시간을 낮춘 MobileBERT (0)	2023.12.09
[매일 논문 초록 읽기 : 28일차] 데이터 증강을 통해 지식 증류의 단점을 보완한 방법론인 AD (0)	2023.12.07
[매일 논문 초록 읽기 : 27일차] hidden state를 사용하여 긴 문장 task에서 발견되는 prefix-tuning의 약점을 보완한 방법론인 prefix-propagation (1)	2023.12.06
[매일 논문 초록 읽기 : 26일차] 지식 증류 방법론에 대한 Survey (1)	2023.12.05

현재글[매일 논문 초록 읽기 : 29일차] Student와 Teacher에게 적합한 난이도의 훈련 예제를 생성하는 방법을 추가한 Tutor-KD

언유상씨의 건전한 취미생활

간단합니다. 건전합니다. 제맘입니다.

특수대학원, Python, c++, 취미생활, 건전한, 건전한 취미생활, 독학, *Luna, 국민대학교, 주식, 알고리즘, VOCALOID, 소프트웨어융합대학원, 재태크, 백준, 학습생활, 사회초년생, 구현, 인공지능, C언어,

언유상씨의 건전한 취미생활