โ† ๐Ÿ“š ์ด๋ฒˆ ์ฃผ Weekly Digest๋กœ ๋Œ์•„๊ฐ€๊ธฐ

DD-062 Adamโ€™s Law: Textual Frequency Law on Large Language Models

arXiv: 2604.02176 ๊ธฐ๊ด€: FaceMind Upvotes: 309 | Comments: 6 ์ˆœ์œ„: ์ด๋ฒˆ ์ฃผ Top 2


๋…ผ๋ฌธ ๋ฆฌ๋ทฐ: Adamโ€™s Law: Textual Frequency Law on Large Language Models

1. ์™œ ์ด ๋…ผ๋ฌธ์ด ์ค‘์š”ํ•œ๊ฐ€?

๊ธฐ์กด์˜ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ ์—ฐ๊ตฌ๋Š” ์ฃผ๋กœ ๋ฐ์ดํ„ฐ์˜ ์–‘์ด๋‚˜ ์งˆ(Quality)์— ์ง‘์ค‘ํ–ˆ์ง€๋งŒ, ํ…์ŠคํŠธ ํ‘œํ˜„์˜ ๋นˆ๋„(Frequency)๊ฐ€ ๋ชจ๋ธ ์„ฑ๋Šฅ์— ๋ฏธ์น˜๋Š” ์˜ํ–ฅ์€ ๊ฐ„๊ณผ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ์‚ฌ๋žŒ์ด ์ฝ์„ ๋•Œ ํ”ํ•œ ๋‹จ์–ด๋ฅผ ๋” ๋นจ๋ฆฌ ์ธ์‹ํ•˜๋“ฏ์ด, ์–ธ์–ด ๋ชจ๋ธ ๋˜ํ•œ ๋นˆ๋ฒˆํ•˜๊ฒŒ ๋“ฑ์žฅํ•˜๋Š” ํ…์ŠคํŠธ ํŒจํ„ด์„ ๋” ์ž˜ ํ•™์Šตํ•˜๊ณ  ์ถ”๋ก ํ•œ๋‹ค๋Š” ํ…์ŠคํŠธ ์ฃผํŒŒ์ˆ˜ ๋ฒ•์น™(Textual Frequency Law)์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž์˜ ์ž…๋ ฅ์„ ๋” ํ”ํ•œ ํ‘œํ˜„์œผ๋กœ ๋ฐ”๊ฟ”์ฃผ๋Š” ๋‹จ์ˆœํ•˜๋ฉด์„œ๋„ ๊ฐ•๋ ฅํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ํ†ตํ•ด, ํ์‡„ํ˜• ๋ชจ๋ธ์˜ ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ์•Œ ์ˆ˜ ์—†๋Š” ์ƒํ™ฉ์—์„œ๋„ ์„ฑ๋Šฅ์„ ํš๊ธฐ์ ์œผ๋กœ ๋†’์ด๋Š” ํ•ด๊ฒฐ์ฑ…์„ ์ œ์‹œํ•ฉ๋‹ˆ๋‹ค.

2. ํ•ต์‹ฌ ์•„์ด๋””์–ด ์‰ฝ๊ฒŒ ์ดํ•ดํ•˜๊ธฐ

์ผ์ƒ์ƒํ™œ ๋น„์œ : ๋„์„œ๊ด€์˜ ์ฑ…์žฅ

์ด ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š” ๊ฑฐ๋Œ€ ๋„์„œ๊ด€์—์„œ ์ฑ…์„ ์ฐพ๋Š” ๋„์„œ๊ด€์›๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๋งŒ์•ฝ ๋‹น์‹ ์ด โ€œ๊ทธ ์œ„์„ฑ ๊ถค๋„ ์—ญํ•™์„ ์ง€๋ฐฐํ•˜๋Š” ๋ฏธ๋ถ„ ๋ฐฉ์ •์‹์˜ ํ•ด๋ฅผ ๊ตฌํ•˜๋ผโ€๋ผ๊ณ  ๋งค์šฐ ์–ด๋ ต๊ณ  ๋“œ๋ฌธ ๋ฌธ์žฅ์œผ๋กœ ์š”์ฒญํ•˜๋ฉด, ๋„์„œ๊ด€์›์€ ์ž ์‹œ ๋ฉˆ์นซํ•˜๋ฉฐ ์–ด๋””์„œ ์ฐพ์•„์•ผ ํ• ์ง€ ๊ณ ๋ฏผํ•  ๊ฒƒ์ž…๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ โ€œ์ธ๊ณต์œ„์„ฑ์ด ๊ถค๋„๋ฅผ ๋„๋Š” ์›๋ฆฌ๋ฅผ ๊ณ„์‚ฐํ•ด์ค˜โ€๋ผ๊ณ  ์šฐ๋ฆฌ๊ฐ€ ์ผ์ƒ์—์„œ ํ”ํžˆ ์“ฐ๋Š” ๋ง๋กœ ๋ฐ”๊ฟ”์„œ ์š”์ฒญํ•˜๋ฉด, ๋„์„œ๊ด€์›์€ ์ฆ‰์‹œ ๊ฐ€์žฅ ๊ฐ€๊นŒ์šด ์ฑ…์žฅ์—์„œ ๊ด€๋ จ ์ฑ…์„ ๊บผ๋‚ด์ค„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ๋ฐ”๋กœ ์ด โ€˜ํ”ํ•˜๊ฒŒ ์“ฐ์ด๋Š” ํ‘œํ˜„โ€™์„ ์ฐพ์•„๋‚ด์–ด ๋ชจ๋ธ์—๊ฒŒ ์ „๋‹ฌํ•ด์ฃผ๋Š” ๊ฒƒ์ด ์„ฑ๋Šฅ ํ–ฅ์ƒ์˜ ์—ด์‡ ์ž„์„ ๋ฐํ˜€๋ƒˆ์Šต๋‹ˆ๋‹ค.

๋‹จ๊ณ„๋ณ„ ๋™์ž‘ ๊ณผ์ •

์ด ๋…ผ๋ฌธ์˜ ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ํฌ๊ฒŒ ์„ธ ๊ฐ€์ง€ ๋‹จ๊ณ„๋กœ ๊ตฌ์„ฑ๋ฉ๋‹ˆ๋‹ค. ์ฒซ์งธ, ํ…์ŠคํŠธ ์ฃผํŒŒ์ˆ˜ ๋ฒ•์น™(TFL)์„ ํ†ตํ•ด ๋ชจ๋ธ์ด ํ•™์Šตํ•  ๋•Œ๋‚˜ ํ”„๋กฌํ”„ํŠธ๋ฅผ ์ž…๋ ฅ๋ฐ›์„ ๋•Œ ๋” ๋นˆ๋ฒˆํ•˜๊ฒŒ ๋“ฑ์žฅํ•˜๋Š” ๋ฌธ์žฅ์„ ์„ ํ˜ธํ•˜๋„๋ก ๋งŒ๋“ญ๋‹ˆ๋‹ค. ๋‘˜์งธ, ์‹ค์ œ๋กœ ๋ชจ๋ธ์ด ์–ด๋–ค ๋ฐ์ดํ„ฐ๋ฅผ ํ•™์Šตํ–ˆ๋Š”์ง€ ์•Œ ์ˆ˜ ์—†๊ธฐ ๋•Œ๋ฌธ์—, ์˜จ๋ผ์ธ ๊ฒ€์ƒ‰ ์—”์ง„์ด๋‚˜ ๋Œ€๊ทœ๋ชจ ๋ง๋ญ‰์น˜๋ฅผ ์ด์šฉํ•ด ๋ฌธ์žฅ์˜ ๋“ฑ์žฅ ๋นˆ๋„๋ฅผ ์ถ”์ •ํ•ฉ๋‹ˆ๋‹ค. ์…‹์งธ, ์ž…๋ ฅ๋œ ๋ฌธ์žฅ์„ ๋” ํ”ํ•œ ํ‘œํ˜„์œผ๋กœ ๋ฐ”๊ฟ”์ฃผ๋Š” ๋ฐ”๊ฟ” ๋งํ•˜๊ธฐ(Input Paraphraser)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ, ๋ชจ๋ธ์ด ์ดํ•ดํ•˜๊ธฐ ๊ฐ€์žฅ ์‰ฌ์šด ํ˜•ํƒœ๋กœ ์งˆ๋ฌธ์„ ๋ณ€ํ˜•ํ•ฉ๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜

๊ฐ€์žฅ ์ค‘์š”ํ•œ ์ˆ˜์‹์€ ์˜๋ฏธ๋Š” ๊ฐ™์ง€๋งŒ ํ‘œํ˜„์ด ๋‹ค๋ฅธ ๋ฌธ์žฅ ์ง‘ํ•ฉ ์ค‘์—์„œ ๋นˆ๋„๊ฐ€ ๊ฐ€์žฅ ๋†’์€ ๋ฌธ์žฅ์„ ์„ ํƒํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ˆ˜์‹์œผ๋กœ ํ‘œํ˜„ํ•˜๋ฉด argmax_(x in P) (sfreq(x, D))์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ P๋Š” ๊ฐ™์€ ์˜๋ฏธ๋ฅผ ๊ฐ€์ง„ ๋ฐ”๊ฟ” ๋งํ•˜๊ธฐ ๋ฌธ์žฅ๋“ค์ด๊ณ , sfreq๋Š” ๋ง๋ญ‰์น˜ D์—์„œ์˜ ๋ฌธ์žฅ ๋นˆ๋„๋ฅผ ์ธก์ •ํ•˜๋Š” ํ•จ์ˆ˜์ž…๋‹ˆ๋‹ค. ์ฆ‰, ๊ฐ™์€ ์˜๋ฏธ๋ผ๋„ ๋” ๋งŽ์ด ์“ฐ์ธ ํ‘œํ˜„์„ ๊ณจ๋ผ์„œ ๋ชจ๋ธ์— ์ž…๋ ฅํ•˜๋ฉด ๋ชจ๋ธ์˜ ์ถ”๋ก  ๋Šฅ๋ ฅ์ด ์˜ฌ๋ผ๊ฐ„๋‹ค๋Š” ๊ฒƒ์ด ํ•ต์‹ฌ ๋ฉ”์ปค๋‹ˆ์ฆ˜์ž…๋‹ˆ๋‹ค.

3. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ถ„์„

๋ฒค์น˜๋งˆํฌ ๋ฐ ์„ค์ •

์—ฐ๊ตฌ์ง„์€ ์ˆ˜ํ•™์  ์ถ”๋ก (Mathematical Reasoning)๊ณผ ๊ธฐ๊ณ„ ๋ฒˆ์—ญ(Machine Translation) ์ž‘์—…์„ ํ†ตํ•ด ์ด ๋ฒ•์น™์„ ๊ฒ€์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ์ˆ˜ํ•™ ์ถ”๋ก ์—์„œ๋Š” ์ •ํ™•๋„(Accuracy)๋ฅผ, ๋ฒˆ์—ญ์—์„œ๋Š” chrF, BLEU, ๊ทธ๋ฆฌ๊ณ  ์ตœ์‹  ์‹ ๊ฒฝ๋ง ๊ธฐ๋ฐ˜ ํ‰๊ฐ€ ์ง€ํ‘œ์ธ COMET ์ ์ˆ˜๋ฅผ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ฒ€์ฆ์„ ์œ„ํ•ด GPT-4o-mini, DeepSeek-V3, Qwen2.5-7B-Instruct, Llama-3.3-70B-Instruct ๋“ฑ ๋‹ค์–‘ํ•œ ๊ฐœ๋ฐฉํ˜• ๋ฐ ํ์‡„ํ˜• ์ตœ์‹  ๋ชจ๋ธ์„ ๋ฒ ์ด์Šค๋ผ์ธ์œผ๋กœ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค.

์„ฑ๋Šฅ ํ–ฅ์ƒ ์ˆ˜์น˜

๊ตฌ์ฒด์ ์ธ ์ˆ˜์น˜๋Š” ๋…ผ๋ฌธ์˜ ํ…Œ์ด๋ธ”์— ์ž์„ธํžˆ ๋‚˜ํƒ€๋‚˜ ์žˆ์œผ๋‚˜, ์š”์•ฝ๋ณธ์— ์ œ์‹œ๋œ ์„ค์ •์— ๋”ฐ๋ฅด๋ฉด ๊ณ ๋นˆ๋„ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํŒŒ์ธ ํŠœ๋‹(Fine-tuning)ํ–ˆ์„ ๋•Œ ๊ธฐ์กด์˜ ์‰ฌ์šด ๊ฒƒ์—์„œ ์–ด๋ ค์šด ์ˆœ์„œ๋กœ ํ•™์Šตํ•˜๋Š” ์ „ํ†ต์ ์ธ ์ปค๋ฆฌํ˜๋Ÿผ ๋Ÿฌ๋‹(Easy-to-Hard) ๋ฐฉ์‹๋ณด๋‹ค ๋” ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ๋ฒˆ์—ญ ์ž‘์—…์—์„œ COMET ์ ์ˆ˜๊ฐ€ ํ–ฅ์ƒ๋˜์—ˆ์œผ๋ฉฐ, ์ž…๋ ฅ ๋ฌธ์žฅ์„ ๊ณ ๋นˆ๋„ ํ‘œํ˜„์œผ๋กœ ๋ฐ”๊พธ์–ด ํ”„๋กฌํ”„ํŠธํ–ˆ์„ ๋•Œ ๋ชจ๋ธ์˜ ์ •๋‹ต๋ฅ ์ด ์œ ์˜๋ฏธํ•˜๊ฒŒ ์ƒ์Šนํ•˜๋Š” ๊ฒƒ์„ ํ™•์ธํ–ˆ์Šต๋‹ˆ๋‹ค.

์ฃผ๋ชฉํ•  ๋งŒํ•œ ์„ฑ๊ณผ

์ด ์—ฐ๊ตฌ์˜ ๊ฐ€์žฅ ํฅ๋ฏธ๋กœ์šด ์ ์€ ๋ชจ๋ธ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํฌ๊ฒŒ ๋ณ€๊ฒฝํ•˜์ง€ ์•Š๊ณ ๋„, ์ž…๋ ฅ ๋ฐ์ดํ„ฐ์˜ ํ‘œํ˜„ ๋นˆ๋„๋งŒ ์กฐ์ •ํ•˜์—ฌ ์„ฑ๋Šฅ์„ ๋Œ์–ด์˜ฌ๋ ธ๋‹ค๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ €์ž๋“ค์€ ๊ฑฐ๋Œ€ ๋ชจ๋ธ์ผ์ˆ˜๋ก ํฌ๊ท€ ๋‹จ์–ด๋‚˜ ํฌ๊ท€ ํ‘œํ˜„์„ ๋” ์ž˜ ์˜ˆ์ธกํ•œ๋‹ค๋Š” ๊ธฐ์กด ์Šค์ผ€์ผ๋ง ๋ฒ•์น™๊ณผ ๋Œ€์กฐ์ ์œผ๋กœ, ํ•™์Šต์ด๋‚˜ ์ถ”๋ก  ์‹œ์—๋Š” ํ”ํ•œ ํ‘œํ˜„์ด ๋” ์œ ๋ฆฌํ•˜๋‹ค๋Š” ๊ฒƒ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ฐ์ดํ„ฐ ์„ ๋ณ„์˜ ์ƒˆ๋กœ์šด ๊ธฐ์ค€์„ ์ œ์‹œํ•œ ์ค‘์š”ํ•œ ๋ฐœ๊ฒฌ์ž…๋‹ˆ๋‹ค.

4. ํ•œ๊ณ„์ ๊ณผ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

์ €์ž๊ฐ€ ์–ธ๊ธ‰ํ•œ ํ•œ๊ณ„

๊ฐ€์žฅ ํฐ ํ•œ๊ณ„๋Š” ๋Œ€๋ถ€๋ถ„์˜ ์ตœ์‹  ์–ธ์–ด ๋ชจ๋ธ์ด ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ๊ณต๊ฐœํ•˜์ง€ ์•Š๋Š”๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ด ๋…ผ๋ฌธ์—์„œ ์ œ์•ˆํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ์˜จ๋ผ์ธ ๋ฆฌ์†Œ์Šค๋ฅผ ํ†ตํ•ด ๋ฌธ์žฅ ๋นˆ๋„๋ฅผ ์ถ”์ •ํ•ด์•ผ ํ•˜๋ฏ€๋กœ, ์‹ค์ œ ํ•™์Šต ๋ฐ์ดํ„ฐ์™€์˜ ์ฐจ์ด๊ฐ€ ๋ฐœ์ƒํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, ์ธํ„ฐ๋„ท์—์„œ ํ”ํ•œ ๋ฌธ์žฅ์ด ๋ชจ๋ธ ํ•™์Šต ๋ฐ์ดํ„ฐ์—๋„ ๋งŽ์ด ํฌํ•จ๋˜์–ด ์žˆ๋‹ค๋Š” ๊ฐ€์ •ํ•˜์— ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค.

๊ฐœ์„  ๊ฐ€๋Šฅ์„ฑ

ํ–ฅํ›„ ์—ฐ๊ตฌ์—์„œ๋Š” ๋ชจ๋ธ์˜ ํ•™์Šต ๋ฐ์ดํ„ฐ์— ๋Œ€ํ•œ ์˜์กด๋„๋ฅผ ์ค„์ด๊ณ , ๋ฌธ์žฅ ๋นˆ๋„๋ฅผ ๋” ์ •๊ตํ•˜๊ฒŒ ์ถ”์ •ํ•  ์ˆ˜ ์žˆ๋Š” ๋ฐฉ๋ฒ•์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ํ…์ŠคํŠธ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ ์ด๋ฏธ์ง€๋‚˜ ์˜ค๋””์˜ค ๋“ฑ ๋‹ค๋ฅธ ๋ชจ๋‹ฌ๋ฆฌํ‹ฐ์—์„œ๋„ ์œ ์‚ฌํ•œ ๋นˆ๋„ ๋ฒ•์น™์ด ์„ฑ๋ฆฝํ•˜๋Š”์ง€ ํƒ๊ตฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ ๊ณ ๋นˆ๋„ ๋ฐ์ดํ„ฐ์—์„œ ์ €๋นˆ๋„ ๋ฐ์ดํ„ฐ๋กœ ๋„˜์–ด๊ฐ€๋Š” ๊ตฌ์ฒด์ ์ธ ์ปค๋ฆฌํ˜๋Ÿผ ์ „๋žต(Curriculum Textual Frequency Fine-Tuning)์„ ๋” ์„ธ๋ถ„ํ™”ํ•˜์—ฌ ์—ฐ๊ตฌํ•  ํ•„์š”๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

5. ์‹ค๋ฌด ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ

๋ฐ”๋กœ ์ ์šฉ ๊ฐ€๋Šฅํ•œ ๋ถ„์•ผ

์ด ๊ธฐ์ˆ ์€ RAG(๊ฒ€์ƒ‰ ์ฆ๊ฐ• ์ƒ์„ฑ) ์‹œ์Šคํ…œ์ด๋‚˜ ๊ณ ๊ฐ ์‘๋Œ€ ์ฑ—๋ด‡ ๊ฐœ๋ฐœ์— ์ฆ‰์‹œ ์ ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž๊ฐ€ ๋˜์ง„ ์งˆ๋ฌธ์ด ์•„๋ฌด๋ฆฌ ์ƒ์†Œํ•˜๊ณ  ์–ด์ƒ‰ํ•œ ํ‘œํ˜„์ด๋ผ๋„, ์‹œ์Šคํ…œ ๋‚ด๋ถ€์—์„œ ์ด๋ฅผ ํ”ํžˆ ์“ฐ๋Š” ํ‘œํ˜„์œผ๋กœ ์ •์ œํ•˜์—ฌ ๋ชจ๋ธ์— ์ „๋‹ฌํ•œ๋‹ค๋ฉด ๋‹ต๋ณ€์˜ ํ’ˆ์งˆ์„ ๋†’์ผ ์ˆ˜ ์žˆ๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ, ์ž์ฒด ํŒŒ์ธ ํŠœ๋‹์„ ์ง„ํ–‰ํ•˜๋Š” ๊ธฐ์—…์ด๋ผ๋ฉด ํ•™์Šต ๋ฐ์ดํ„ฐ๋ฅผ ๋นˆ๋„ ์ˆœ์œผ๋กœ ์ •๋ ฌํ•˜์—ฌ ํ•™์Šต ํšจ์œจ์„ ๋†’์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ•„์š”ํ•œ ๋ฆฌ์†Œ์Šค

์ด ๋ฐฉ๋ฒ•์„ ์ ์šฉํ•˜๊ธฐ ์œ„ํ•ด ๊ฑฐ๋Œ€ํ•œ ์—ฐ์‚ฐ ๋Šฅ๋ ฅ์ด ํ•„์š”ํ•œ ๊ฒƒ์€ ์•„๋‹™๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์ž…๋ ฅ ๋ฌธ์žฅ์˜ ๋นˆ๋„๋ฅผ ํ™•์ธํ•˜๊ธฐ ์œ„ํ•ด ๋Œ€๊ทœ๋ชจ ๋ง๋ญ‰์น˜๋‚˜ ๊ฒ€์ƒ‰ ์—”์ง„ API์— ์ ‘๊ทผํ•  ์ˆ˜ ์žˆ๋Š” ํ™˜๊ฒฝ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ์ž…๋ ฅ์„ ๋ฐ”๊ฟ” ๋งํ•˜๊ธฐ(Paraphrasing)ํ•˜๋Š” ๊ณผ์ •์—์„œ ์ถ”๊ฐ€์ ์ธ ์ถ”๋ก  ๋น„์šฉ์ด ๋ฐœ์ƒํ•˜์ง€๋งŒ, ์ด๋Š” ์ „์ฒด ์‹œ์Šคํ…œ์˜ ์„ฑ๋Šฅ ํ–ฅ์ƒ์„ ๊ณ ๋ คํ•  ๋•Œ ์ถฉ๋ถ„ํžˆ ํˆฌ์žํ•  ๋งŒํ•œ ๊ฐ€์น˜๊ฐ€ ์žˆ๋Š” ๋ฆฌ์†Œ์Šค์ž…๋‹ˆ๋‹ค.

6. ์ด ๋…ผ๋ฌธ์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•œ ์‚ฌ์ „ ์ง€์‹

  • LLM (Large Language Model): ๋ฐฉ๋Œ€ํ•œ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šตํ•˜์—ฌ ์‚ฌ๋žŒ์ฒ˜๋Ÿผ ํ…์ŠคํŠธ๋ฅผ ์ดํ•ดํ•˜๊ณ  ์ƒ์„ฑํ•˜๋Š” ์ธ๊ณต์ง€๋Šฅ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.
  • Fine-tuning (ํŒŒ์ธ ํŠœ๋‹): ์ด๋ฏธ ํ•™์Šต๋œ ๊ฑฐ๋Œ€ ๋ชจ๋ธ์„ ํŠน์ • ์ž‘์—…์ด๋‚˜ ๋ฐ์ดํ„ฐ์— ๋งž์ถฐ ์ถ”๊ฐ€๋กœ ํ•™์Šต์‹œํ‚ค๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค.
  • Paraphrasing (๋ฐ”๊ฟ” ๋งํ•˜๊ธฐ): ์›๋ฌธ์˜ ์˜๋ฏธ๋Š” ์œ ์ง€ํ•˜๋ฉด์„œ ๋‹จ์–ด๋‚˜ ๋ฌธ์žฅ ๊ตฌ์กฐ๋ฅผ ๋‹ฌ๋ฆฌํ•˜์—ฌ ๋‹ค์‹œ ํ‘œํ˜„ํ•˜๋Š” ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค.
  • Curriculum Learning (์ปค๋ฆฌํ˜๋Ÿผ ๋Ÿฌ๋‹): ์ธ๊ฐ„์ด ํ•™์Šตํ•˜๋“ฏ์ด ๋ชจ๋ธ์—๊ฒŒ ์‰ฌ์šด ์˜ˆ์ œ๋ถ€ํ„ฐ ์ ์ฐจ ์–ด๋ ค์šด ์˜ˆ์ œ๋ฅผ ์ˆœ์„œ๋Œ€๋กœ ํ•™์Šต์‹œํ‚ค๋Š” ์ „๋žต์ž…๋‹ˆ๋‹ค.
  • BLEU / COMET: ๊ธฐ๊ณ„ ๋ฒˆ์—ญ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ์ง€ํ‘œ๋กœ, ์ƒ์„ฑ๋œ ๋ฌธ์žฅ๊ณผ ์‹ค์ œ ์ •๋‹ต ๋ฌธ์žฅ์˜ ์œ ์‚ฌ๋„๋ฅผ ์ธก์ •ํ•ฉ๋‹ˆ๋‹ค.
  • LoRA (Low-Rank Adaptation): ๋ชจ๋ธ์˜ ์ „์ฒด ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์žฌํ•™์Šต์‹œํ‚ค์ง€ ์•Š๊ณ  ์ผ๋ถ€ ์ ์€ ํŒŒ๋ผ๋ฏธํ„ฐ๋งŒ ํ•™์Šต์‹œ์ผœ ํšจ์œจ์ ์œผ๋กœ ํŒŒ์ธ ํŠœ๋‹ํ•˜๋Š” ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค.
  • Zero-shot / Few-shot Learning: ๋ชจ๋ธ์ด ์ถ”๊ฐ€ ํ•™์Šต ์—†์ด(Zero-shot) ํ˜น์€ ๋ช‡ ๊ฐœ์˜ ์˜ˆ์‹œ๋งŒ ๋ณด๊ณ (Few-shot) ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋Šฅ๋ ฅ์„ ๋งํ•ฉ๋‹ˆ๋‹ค.

๐Ÿ“š ์ด๋ฒˆ ์ฃผ ๊ด€๋ จ Deep Dive

์ˆœ์œ„๋…ผ๋ฌธDeep Dive
๐Ÿฅ‡GrandCode: Achieving Grandmaster Leโ€ฆDD-061
๐ŸฅˆAdamโ€™s Law: Textual Frequency Law oโ€ฆ๐Ÿ“ ํ˜„์žฌ ๋ฌธ์„œ
๐Ÿฅ‰Video-MME-v2: Towards the Next Stagโ€ฆDD-063
4.InCoder-32B-Thinking: Industrial Coโ€ฆDD-064
5.SkillClaw: Let Skills Evolve Collecโ€ฆDD-065

๐Ÿ“… ์ƒ์„ฑ์ผ: 2026-04-12 | ๐Ÿค– GLM-4.7 Deep Dive