[매일 논문 초록 읽기 : 23일차] 텍스트 기반 적대적 알고리즘을 사용한 지식 증류 방법론인 MATE-KD

Notice

Recent Posts

Recent Comments

Link

« 2024/10 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

언유상씨의 건전한 취미생활

[매일 논문 초록 읽기 : 23일차] 텍스트 기반 적대적 알고리즘을 사용한 지식 증류 방법론인 MATE-KD 본문

건전한 학습생활 - 매일 논문 초록 읽기

[매일 논문 초록 읽기 : 23일차] 텍스트 기반 적대적 알고리즘을 사용한 지식 증류 방법론인 MATE-KD

언유상 2023. 12. 2. 23:56

거대한 사전학습 언어모델의 출현은 NLP 분야에서 빠른 발전을 가져다 주었다. 표준 benchmark들에서 모델들의 성능은 크기에 비례하지만, 지식 증류와 같은 압축 기술은 이러한 모델들을 실용적으로 만드는데 핵심적인 역할을 했다. 우리는 지식 증류의 성능을 향상시키는 텍스트 기반의 적대적 알고리즘인 MATE-KD를 제안한다.

MATE-KD는 먼저 teacher과 student의 logit의 차이를 극대화 하는 방향으로 masked language model 기반의 생성기를 훈련시켜 텍스트를 교란시킨다. 그리고 지식 증류를 사용하여 student를 원본 데이터와 교란된 학습 예제들로 학습을 시킨다.

우리는 GLUE benchmark에 대해 BERT-based model를 사용하여 우리의 알고리즘을 평가하였고, MATE-KD가 적대적 학습과 데이터 증강을 사용한 비교군 보다 좋은 성능이 나옴을 보였다. 우리의 6 layer RoBERTa-based는 GLUE test에 대해 BERT-LARGE보다 좋은 성능을 달성하였다.

제목 : MATE-KD: Masked Adversarial TExt, a Companion to Knowledge Distillation

https://aclanthology.org/2021.acl-long.86/

'건전한 학습생활 - 매일 논문 초록 읽기' 카테고리의 다른 글

[매일 논문 초록 읽기 : 25일차] teacher의 중간 layer들을 사용하여 student를 학습시키는 방법론인 Patient Knowledge Distillation (2)	2023.12.04
[매일 논문 초록 읽기 : 24일차] multi task 문제를 해결할 때 knowledge distillation과 prompt tuning을 결합한 MPT (1)	2023.12.03
[매일 논문 초록 읽기 : 22일차] BERT를 모듈화 하고, 모듈을 교체하는 방식을 사용하여 모델 압축을 해낸 방법론 (0)	2023.12.01
[매일 논문 초록 읽기 : 21일차] 기존의 prompt tuning의 문제점들을 보완한 PANDA 접근법 (0)	2023.11.30
[매일 논문 초록 읽기 : 20일차] task간의 관련성에 기반한 multi-task learning 방법론 조사 (0)	2023.11.29

'건전한 학습생활 - 매일 논문 초록 읽기' Related Articles

Comments

언유상씨의 건전한 취미생활

[매일 논문 초록 읽기 : 23일차] 텍스트 기반 적대적 알고리즘을 사용한 지식 증류 방법론인 MATE-KD 본문

[매일 논문 초록 읽기 : 23일차] 텍스트 기반 적대적 알고리즘을 사용한 지식 증류 방법론인 MATE-KD

'건전한 학습생활 - 매일 논문 초록 읽기' 카테고리의 다른 글

티스토리툴바