[매일 논문 초록 읽기 : 59일차] 언어모델이 긴 문맥을 제대로 활용하지 못한다는 내용의 논문

Notice

Recent Posts

Recent Comments

Link

« 2025/04 »
일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

Tags more

Archives

Today

Total

관리 메뉴

언유상씨의 건전한 취미생활

[매일 논문 초록 읽기 : 59일차] 언어모델이 긴 문맥을 제대로 활용하지 못한다는 내용의 논문 본문

건전한 학습생활 - 매일 논문 초록 읽기

[매일 논문 초록 읽기 : 59일차] 언어모델이 긴 문맥을 제대로 활용하지 못한다는 내용의 논문

언유상 2024. 1. 23. 14:51

최근 언어모델이 input으로 긴 문맥을 입력받을 수 있는 능력을 가짐에도 불구하고, 언어모델이 더 긴 문맥을 얼마나 잘 활용하는지에 대해서는 상대적으로 잘 알려져 있지 않다. 우리는 입력된 문맥과 관련된 정보를 식별하는 능력을 요하는 2가지 task (multi-document question answering, key-value retrieval)를 통해 언어모델의 성능을 분석한다.

우리는 관련된 정보의 위치가 변경될 때 성능이 많이 떨어짐을 발견했다. 이는 현재의 언어모델들이 입력 받은 긴 문맥의 정보를 견고하게 활용하지 못함을 보인다. 특히, 우리는 관련된 내용이 입력된 문맥의 맨 앞 또는 맨 뒤에 존재할 때 성능이 종종 매우 높게 나오는 것을 발견하였고, 긴 문맥의 중간에 있을 때 성능이 상당히 떨어짐을 발견하였다. 이는 명시적으로 긴 문맥을 위한 모델들에게도 해당된다.

우리의 분석은 언어모델이 그들이 입력 받은 긴 문맥을 사용하는 방법에 대해 더 나은 이해를 제공하고, 향후 긴 문맥을 입력받는 언어모델들을 위한 새로운 평가 프로토콜을 제공한다.

제목 : Lost in the Middle: How Language Models Use Long Contexts
https://arxiv.org/abs/2307.03172

'건전한 학습생활 - 매일 논문 초록 읽기' 카테고리의 다른 글

[매일 논문 초록 읽기 : 61일차] knowledge-intensive task를 해결하기 위한 방안인 RAG (0)	2024.03.24
[매일 논문 초록 읽기 : 60일차] Synthetic feedback을 사용해 RM을 진행하는 모델인 ALMoST (0)	2024.01.24
[매일 논문 초록 읽기 : 58일차] EToD 분야에 대한 Survey (1)	2024.01.22
[매일 논문 초록 읽기 : 57일차] 다중 사용자 환경에 사용되는 챗봇 개발을 위한 framework인 MUCA (0)	2024.01.18
[매일 논문 초록 읽기 : 56일차] 여러 에이전트들을 동시에 활용하여 할루시네이션을 낮추고 어려운 문제에 대한 해결력을 높인 MetaGPT (1)	2024.01.16

'건전한 학습생활 - 매일 논문 초록 읽기' Related Articles

Comments

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

언유상씨의 건전한 취미생활

언유상씨의 건전한 취미생활

[매일 논문 초록 읽기 : 59일차] 언어모델이 긴 문맥을 제대로 활용하지 못한다는 내용의 논문 본문

[매일 논문 초록 읽기 : 59일차] 언어모델이 긴 문맥을 제대로 활용하지 못한다는 내용의 논문

'건전한 학습생활 - 매일 논문 초록 읽기' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역