[매일 논문 초록 읽기 : 8일차] LLM에 추론 능력을 부여하는 Chain of thought

인공지능/매일 논문 초록 읽기

[매일 논문 초록 읽기 : 8일차] LLM에 추론 능력을 부여하는 Chain of thought

언유상 2023. 11. 8. 09:52

https://cafe.naver.com/minslsat광고

LLM 전문 민스컨설팅 뉴욕주 변호사 직강 LSAT, 로스쿨 준비부터 미국 변호사 자격 취득까지 전 과정을 지원합니다. Mins LSAT이 LSAT, PRELAW 전문 민스컨설팅로 확장 오픈합니다.

http://cafe.naver.com/ktkacademy.cafe광고

KTK 미국로스쿨 아카데미 미국변호사 시험 및 미국 로스쿨 준비 기관, 로스쿨 프로세싱, 동영상 강의 진행

우리는 chain of thought(일련의 중간 추론 과정들)을 생성하는 것이 LLM이 복잡한 추론을 하는 능력을 크게 향상시키는 방법을 탐구한다. 특히 충분한 크기의 LLM에서 chain of thought 이라는 간단한 방법을 통해 이러한 추론 능력이 자연스럽게 나타나는 것을 보인다. 3개의 LLM에서 진행한 실험은 chain of thought 프롬프팅이 산수, 상식, 상징적 추론 task에서 성능이 향상됨을 보인다. 경험적인 이득은 매우 크다. 예를 들어, PaLM 540B에 8개의 chain of thought 예시를 적용한 것만으로 수학 단어 문제 벤치마크인 GSM8K에서 파인튜닝된 GPT-3를 넘긴 성능을 보이며 SOTA를 달성하였다.

제목 : Chain-of-Thought Prompting Elicits Reasoning in Large Language Models

https://arxiv.org/abs/2201.11903

'인공지능 > 매일 논문 초록 읽기' 카테고리의 다른 글

[매일 논문 초록 읽기 : 10일차] 오픈소스가 아닌 챗봇 모델의 대항마로 나온 Llama 2 (0)	2023.11.10
[매일 논문 초록 읽기 : 9일차] LLM이 학습한 사회적 편향의 리스크를 낮출 수 있는 데이터 셋 (0)	2023.11.09
[매일 논문 초록 읽기 : 7일차] LLM과 score function을 활용한 prompt 제작 자동화 (0)	2023.11.07
[매일 논문 초록 읽기 : 6일차] 여러 task에 대해 few-shot으로 좋은 성능을 내는 모델 (0)	2023.11.06
[매일 논문 초록 읽기 : 5일차] 언어모델을 사람의 의도와 맞추는 방법 (0)	2023.11.05

현재글[매일 논문 초록 읽기 : 8일차] LLM에 추론 능력을 부여하는 Chain of thought

언유상씨의 건전한 취미생활 간단합니다. 건전합니다. 제맘입니다.

언유상씨의 건전한 취미생활

간단합니다. 건전합니다. 제맘입니다.

국민대학교, 재태크, 백준, 취미생활, Python, 소프트웨어융합대학원, 독학, 특수대학원, 사회초년생, 알고리즘, *Luna, 건전한, c++, 건전한 취미생활, VOCALOID, C언어, 인공지능, 구현, 주식, 학습생활,

Today :
Yesterday :

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

언유상씨의 건전한 취미생활