[매일 논문 초록 읽기 : 24일차] multi task 문제를 해결할 때 knowledge distillation과 prompt tuning을 결합한 MPT

Notice

Recent Posts

Recent Comments

Link

« 2025/05 »
일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

언유상씨의 건전한 취미생활

[매일 논문 초록 읽기 : 24일차] multi task 문제를 해결할 때 knowledge distillation과 prompt tuning을 결합한 MPT 본문

건전한 학습생활 - 매일 논문 초록 읽기

[매일 논문 초록 읽기 : 24일차] multi task 문제를 해결할 때 knowledge distillation과 prompt tuning을 결합한 MPT

언유상 2023. 12. 3. 17:10

학습된 프롬프트 벡터들을 조정하는 방식을 통해 사전학습된 모델들을 특정 task에 맞추는 prompt tuning은 여러가지 downstream task들에 LLM을 효율적으로 맞추는 방법이 되었다. 하지만, 존재하는 방법론들은 일반적으로 소프트 프롬프트 벡터를 처음부터 학습시키고, 이러한 방법은 multitask learning 설정에서 프롬프트 벡터들을 사용했을때 task간의 풍부한 지식을 어떻게 사용하는지에 대해서는 명확하지 않다.

우리는 multitask prompt tuning (MPT)를 제안한다.
먼저 여러개의 task 별 source prompt 로부터 지식을 추출하여 전이 가능한 프롬프트를 학습시킨다. 그리고 각각의 downstream target task들에게 공유된 프롬프트를 효율적으로 맞추기 위해 multiplicative low rank update를 학습시킨다.

23개의 NLP dataset들에 대한 실험을 통해 우리의 방법론은 특정 task별 파라미터의 0.035%를 tuning 했지만 일부의 경우 full fine-tuning 모델을 포함한 SOTA를 달성한 방법론 보다 좋은 성능을 보였다.

제목 : MULTITASK PROMPT TUNING ENABLES PARAMETER-EFFICIENT TRANSFER LEARNING

https://arxiv.org/abs/2303.02861

'건전한 학습생활 - 매일 논문 초록 읽기' 카테고리의 다른 글

[매일 논문 초록 읽기 : 26일차] 지식 증류 방법론에 대한 Survey (1)	2023.12.05
[매일 논문 초록 읽기 : 25일차] teacher의 중간 layer들을 사용하여 student를 학습시키는 방법론인 Patient Knowledge Distillation (2)	2023.12.04
[매일 논문 초록 읽기 : 23일차] 텍스트 기반 적대적 알고리즘을 사용한 지식 증류 방법론인 MATE-KD (0)	2023.12.02
[매일 논문 초록 읽기 : 22일차] BERT를 모듈화 하고, 모듈을 교체하는 방식을 사용하여 모델 압축을 해낸 방법론 (0)	2023.12.01
[매일 논문 초록 읽기 : 21일차] 기존의 prompt tuning의 문제점들을 보완한 PANDA 접근법 (0)	2023.11.30

'건전한 학습생활 - 매일 논문 초록 읽기' Related Articles

Comments

언유상씨의 건전한 취미생활

[매일 논문 초록 읽기 : 24일차] multi task 문제를 해결할 때 knowledge distillation과 prompt tuning을 결합한 MPT 본문

[매일 논문 초록 읽기 : 24일차] multi task 문제를 해결할 때 knowledge distillation과 prompt tuning을 결합한 MPT

'건전한 학습생활 - 매일 논문 초록 읽기' 카테고리의 다른 글

티스토리툴바