โ† ๐Ÿ“š ์ด๋ฒˆ ์ฃผ Weekly Digest๋กœ ๋Œ์•„๊ฐ€๊ธฐ

DD-103 On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters

arXiv: 2606.02437 ๊ธฐ๊ด€: Mind Lab Upvotes: 175 | Comments: 4 ์ˆœ์œ„: ์ด๋ฒˆ ์ฃผ Top 2


๋…ผ๋ฌธ ๋ฆฌ๋ทฐ: On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters

1. ์™œ ์ด ๋…ผ๋ฌธ์ด ์ค‘์š”ํ•œ๊ฐ€?

๊ธฐ์กด์˜ ํŒŒ๋ผ๋ฏธํ„ฐ ํšจ์œจ์  ํŒŒ์ธ ํŠœ๋‹(PEFT) ์—ฐ๊ตฌ๋“ค์€ ์ฃผ๋กœ ๊ฑฐ๋Œ€ ๋ชจ๋ธ์„ ์ „์ฒด ์žฌํ•™์Šตํ•˜๋Š” ๋Œ€์‹  ๋น„์šฉ์„ ์•„๋ผ๊ธฐ ์œ„ํ•œ โ€˜์ €๋ ดํ•œ ๋Œ€์•ˆโ€™์—๋งŒ ์ง‘์ค‘ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ PEFT๋ฅผ ๋‹จ์ˆœํ•œ ๋น„์šฉ ์ ˆ๊ฐ ๋„๊ตฌ๊ฐ€ ์•„๋‹ˆ๋ผ, ํ•˜๋‚˜์˜ ๊ฑฐ๋Œ€ ๊ธฐ๋ฐ˜ ๋ชจ๋ธ ์œ„์—์„œ ์ˆ˜๋ฐฑ๋งŒ ๊ฐœ์˜ ๊ฐœ์ธํ™”๋œ ๋ชจ๋ธ์„ ์šด์˜ํ•  ์ˆ˜ ์žˆ๋Š” โ€˜์ง€์†์ ์ธ ์ƒํƒœ ๊ด€๋ฆฌ ์ฒด๊ณ„โ€™๋กœ ์žฌ์ •์˜ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ์‚ฌ์šฉ์ž๋ณ„ ๋งž์ถคํ˜• AI ์„œ๋น„์Šค๋ฅผ ์••๋„์ ์œผ๋กœ ์ ์€ ๋ฆฌ์†Œ์Šค๋กœ ๋Œ€๊ทœ๋ชจ ํ™•์žฅํ•  ์ˆ˜ ์žˆ๋Š” ๊ธธ์„ ์—ด์—ˆ์Šต๋‹ˆ๋‹ค.

2. ํ•ต์‹ฌ ์•„์ด๋””์–ด ์‰ฝ๊ฒŒ ์ดํ•ดํ•˜๊ธฐ

์ผ์ƒ์ƒํ™œ ๋น„์œ : ์Šค๋งˆํŠธํฐ ์šด์˜์ฒด์ œ์™€ ๊ฐœ์ธ ๋ฐ์ดํ„ฐ

์ด ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ ๊ฐœ๋…์€ ์Šค๋งˆํŠธํฐ์˜ ๊ตฌ์กฐ์™€ ๋งค์šฐ ํก์‚ฌํ•ฉ๋‹ˆ๋‹ค. ๊ฑฐ๋Œ€ ๊ธฐ๋ฐ˜ ๋ชจ๋ธ(Foundation Model)์€ ๋ชจ๋“  ์‚ฌ๋žŒ์ด ๋˜‘๊ฐ™์ด ์‚ฌ์šฉํ•˜๋Š” ์•„์ดํฐ์ด๋‚˜ ์•ˆ๋“œ๋กœ์ด๋“œ ๊ฐ™์€ โ€˜์šด์˜์ฒด์ œ(OS)โ€˜๋ผ๊ณ  ์ƒ๊ฐํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค. OS๋Š” ์ „ํ™” ๊ฑธ๊ธฐ, ์ธํ„ฐ๋„ท ๊ฒ€์ƒ‰ ๋“ฑ ๊ธฐ๋ณธ์ ์ธ ๋Šฅ๋ ฅ์„ ๊ณตํ†ต์ ์œผ๋กœ ์ œ๊ณตํ•ฉ๋‹ˆ๋‹ค.

์—ฌ๊ธฐ์— ์–ด๋Œ‘ํ„ฐ(Adapter)๋Š” ๋‚ด ์Šค๋งˆํŠธํฐ์— ์ €์žฅ๋œ โ€˜๊ฐœ์ธ ์„ค์ •โ€™์ด๋‚˜ โ€˜๋ฉ”๋ชจ์žฅโ€™์ž…๋‹ˆ๋‹ค. OS๋Š” ๋ฐ”๊พธ์ง€ ์•Š์€ ์ฑ„, ๋‚ด๊ฐ€ ์ข‹์•„ํ•˜๋Š” ์•ฑ๋งŒ ๋”ฐ๋กœ ์„ค์น˜ํ•˜๊ฑฐ๋‚˜ ํ™”๋ฉด ๋ฐ๊ธฐ๋ฅผ ์กฐ์ •ํ•˜๋Š” ๊ฒƒ์ฒ˜๋Ÿผ, AI ๋ชจ๋ธ ๋ณธ์ฒด๋Š” ๊ฑด๋“œ๋ฆฌ์ง€ ์•Š๊ณ  ์‚ฌ์šฉ์ž์˜ ์„ฑํ–ฅ์ด๋‚˜ ๊ธฐ์–ต์— ํ•ด๋‹นํ•˜๋Š” ์•„์ฃผ ์ž‘์€ ๋ฉ์–ด๋ฆฌ(์–ด๋Œ‘ํ„ฐ)๋งŒ ๋”ฐ๋กœ ๋ถ™์ด๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ์ˆ˜์–ต ๋ช…์˜ ์‚ฌ์šฉ์ž๊ฐ€ ๊ฐ์ž ์ž์‹ ๋งŒ์˜ ์–ด๋Œ‘ํ„ฐ๋ฅผ ๊ฐ€์ง€๊ณ , ๋งˆ์น˜ ์ž์‹ ๋งŒ์˜ AI๋ฅผ ๊ฐ€์ง„ ๊ฒƒ์ฒ˜๋Ÿผ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋‹จ๊ณ„๋ณ„ ๋™์ž‘ ์›๋ฆฌ

  1. ๊ณต์œ  ๊ธฐ๋ฐ˜ ๋ชจ๋ธ ์ค€๋น„: ์ˆ˜์กฐ ๊ฐœ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ๊ฑฐ๋Œ€ AI ๋ชจ๋ธ์„ ํ•˜๋‚˜ ๋งˆ๋ จํ•˜๊ณ  ์ด๋ฅผ ์–ผ๋ฆฝ๋‹ˆ๋‹ค(Freeze). ์ด ๋ชจ๋ธ์€ ์„ธ์ƒ์˜ ์ผ๋ฐ˜์ ์ธ ์ง€์‹์„ ๋‹ด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.
  2. ์–ด๋Œ‘ํ„ฐ ์ƒ์„ฑ: ์‚ฌ์šฉ์ž๋ณ„๋กœ ํ•„์š”ํ•œ ํ–‰๋™ ์–‘์‹, ์„ ํ˜ธ๋„, ๋„๊ตฌ ์‚ฌ์šฉ ์Šต๊ด€ ๋“ฑ์„ ํ•™์Šตํ•  ์•„์ฃผ ์ž‘์€ ์‹ ๊ฒฝ๋ง ๊ณ„์ธต(Adapters)์„ ๋งŒ๋“ญ๋‹ˆ๋‹ค.
  3. ์ง€์—ญ์  ์—…๋ฐ์ดํŠธ: ๊ฑฐ๋Œ€ ๋ชจ๋ธ ์ „์ฒด๋ฅผ ํ•™์Šต์‹œํ‚ค๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์ด ์ž‘์€ ์–ด๋Œ‘ํ„ฐ๋งŒ ์‚ฌ์šฉ์ž์˜ ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šต์‹œํ‚ต๋‹ˆ๋‹ค.
  4. ์ง€์†์  ๊ด€๋ฆฌ: ํ•™์Šต๋œ ์–ด๋Œ‘ํ„ฐ๋Š” ์‚ฌ์šฉ์ž์˜ ์˜๊ตฌ์ ์ธ ์ƒํƒœ๋กœ ์ €์žฅ๋˜์–ด, ๋ชจ๋ธ์ด ํ˜ธ์ถœ๋  ๋•Œ๋งˆ๋‹ค ๊ธฐ๋ณธ ๋ชจ๋ธ ์œ„์— ์–นํ˜€์ ธ ๊ฐœ์ธํ™”๋œ ๋‹ต๋ณ€์„ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ฐ ์ˆ˜์‹

์ด ๋…ผ๋ฌธ์€ ๋ณต์žกํ•œ ์ƒˆ๋กœ์šด ์ˆ˜์‹์„ ์ œ์•ˆํ•˜๊ธฐ๋ณด๋‹ค๋Š”, ๊ธฐ์กด PEFT ๋ฐฉ์‹์˜ ํ™•์žฅ์„ฑ์„ ์ฒด๊ณ„์ ์œผ๋กœ ๋ถ„์„ํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ๋ณธ์ ์ธ ์•„์ด๋””์–ด๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™์ด ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

$$ W_{final} = W_{base} + \Delta W_{user} $$

์—ฌ๊ธฐ์„œ $W_{base}$๋Š” ์ˆ˜์ •๋˜์ง€ ์•Š๋Š” ๊ฑฐ๋Œ€ ๊ธฐ๋ฐ˜ ๋ชจ๋ธ์˜ ๊ฐ€์ค‘์น˜์ด๋ฉฐ, $\Delta W_{user}$๋Š” ํŠน์ • ์‚ฌ์šฉ์ž๋‚˜ ์ธ์Šคํ„ด์Šค๋ฅผ ์œ„ํ•ด ํ•™์Šต๋œ ์•„์ฃผ ์ž‘์€ ์–ด๋Œ‘ํ„ฐ ๊ฐ€์ค‘์น˜์ž…๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์€ ์ด $\Delta W$๋ฅผ ์–ผ๋งˆ๋‚˜ ์ž‘๊ฒŒ ์ค„์ผ ์ˆ˜ ์žˆ๋Š”์ง€(Scale Down), ๊ธฐ๋ฐ˜ ๋ชจ๋ธ์ด ์ปค์งˆ ๋•Œ ํšจ๊ณผ๊ฐ€ ์–ด๋–ป๊ฒŒ ๋ณ€ํ•˜๋Š”์ง€(Scale Up), ๊ทธ๋ฆฌ๊ณ  ์ด๋Ÿฌํ•œ ์–ด๋Œ‘ํ„ฐ ์ˆ˜๋ฐฑ๋งŒ ๊ฐœ๋ฅผ ์–ด๋–ป๊ฒŒ ํšจ์œจ์ ์œผ๋กœ ๊ด€๋ฆฌํ•˜๋Š”์ง€(Scale Out)๋ฅผ ํƒ๊ตฌํ•ฉ๋‹ˆ๋‹ค.

3. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ถ„์„

์ด ๋…ผ๋ฌธ์€ ํŠน์ • ๋ฒค์น˜๋งˆํฌ ์ ์ˆ˜ ํ•˜๋‚˜๋ฅผ ์˜ฌ๋ฆฌ๋Š” ๊ฒƒ๋ณด๋‹ค, ์‹œ์Šคํ…œ ์ „์ฒด์˜ ํ™•์žฅ ๊ฐ€๋Šฅ์„ฑ์„ ์ž…์ฆํ•˜๋Š” ๋ฐ ์ค‘์ ์„ ๋‘์—ˆ์Šต๋‹ˆ๋‹ค.

  • ํ™•์žฅ ์ถ•(Scale Axes)์— ๋”ฐ๋ฅธ ๋ถ„์„: ์ €์ž๋“ค์€ Scale Up(๊ธฐ๋ฐ˜ ๋ชจ๋ธ ์„ฑ๋Šฅ ํ–ฅ์ƒ ์‹œ ์–ด๋Œ‘ํ„ฐ์˜ ํšจ์šฉ์„ฑ ์ฆ๊ฐ€), Scale Down(์–ด๋Œ‘ํ„ฐ ํฌ๊ธฐ ์ตœ์†Œํ™”์— ๋”ฐ๋ฅธ ์‹ ๋ขฐ์„ฑ ์œ ์ง€), Scale Out(๋‹ค์ˆ˜์˜ ์–ด๋Œ‘ํ„ฐ ๊ณต์กด)์˜ ์„ธ ๊ฐ€์ง€ ์ถ•์„ ์„ค์ •ํ•˜์—ฌ ์‹คํ—˜ํ–ˆ์Šต๋‹ˆ๋‹ค.
  • ๊ธฐ์กด ๋ฐฉ์‹ ๋Œ€๋น„ ํšจ์œจ์„ฑ: ๊ธฐ์กด์˜ Full Fine-tuning(์ „์ฒด ํŒŒ์ธ ํŠœ๋‹) ๋ฐฉ์‹์€ ๋ชจ๋ธ ์ „์ฒด๋ฅผ ๋ณต์‚ฌํ•ด์•ผ ํ–ˆ๊ธฐ ๋•Œ๋ฌธ์— ์‚ฌ์šฉ์ž 100๋ช…๋‹น ๋ชจ๋ธ 100๊ฐœ๊ฐ€ ํ•„์š”ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด ์ด ๋…ผ๋ฌธ์˜ ์ ‘๊ทผ ๋ฐฉ์‹์€ ๊ธฐ๋ณธ ๋ชจ๋ธ 1๊ฐœ์™€ ์•„์ฃผ ์ž‘์€ ์–ด๋Œ‘ํ„ฐ ํŒŒ์ผ๋“ค๋งŒ ์žˆ์œผ๋ฉด ๋˜๋ฏ€๋กœ, ์ €์žฅ ๊ณต๊ฐ„๊ณผ ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰์—์„œ ํš๊ธฐ์ ์ธ ๊ฐœ์„ ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.
  • MinT ์ธํ”„๋ผ ๋ฐ๋ชจ: ์ˆ˜๋ฐฑ๋งŒ ๊ฐœ์˜ ์–ด๋Œ‘ํ„ฐ ์‹๋ณ„, ๋ฒ„์ „ ๊ด€๋ฆฌ, ์ถœ์ฒ˜ ์ถ”์ (Provenance), ํ‰๊ฐ€, ์„œ๋น™์„ ๊ด€๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” MinT๋ผ๋Š” ์ธํ”„๋ผ ์˜ˆ์‹œ๋ฅผ ์ œ์‹œํ•˜๋ฉฐ, ์‹ค์ œ๋กœ ์ด๋Ÿฌํ•œ ๊ฐœ์ธ ๋ชจ๋ธ๋“ค์„ ๋Œ€๊ทœ๋ชจ๋กœ ์šด์˜ํ•  ์ˆ˜ ์žˆ์Œ์„ ์ฆ๋ช…ํ–ˆ์Šต๋‹ˆ๋‹ค.

4. ํ•œ๊ณ„์ ๊ณผ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

  • ๊ด€๋ฆฌ์˜ ๋ณต์žก์„ฑ: ์ €์ž๋“ค์€ ๋ชจ๋ธ ํ•™์Šต ์ž์ฒด์˜ ๋น„์šฉ ๋ฌธ์ œ๊ฐ€ ํ•ด๊ฒฐ๋˜๋ฉด์„œ, ์ด์ œ๋Š” ์ˆ˜๋งŽ์€ ์–ด๋Œ‘ํ„ฐ์˜ โ€˜์‹๋ณ„โ€™, โ€˜๋ฒ„์ „ ๊ด€๋ฆฌโ€™, โ€˜ํ‰๊ฐ€โ€™์™€ ๊ฐ™์€ ์†Œํ”„ํŠธ์›จ์–ด์  ๊ด€๋ฆฌ ๋ฌธ์ œ๊ฐ€ ์ƒˆ๋กœ์šด ๋ณ‘๋ชฉ์ด ๋  ์ˆ˜ ์žˆ์Œ์„ ์ง€์ ํ–ˆ์Šต๋‹ˆ๋‹ค.
  • ์–ด๋Œ‘ํ„ฐ ๊ฐ„ ๊ฐ„์„ญ: ์ˆ˜๋งŽ์€ ์–ด๋Œ‘ํ„ฐ๊ฐ€ ๊ณต์กดํ•  ๋•Œ, ํ˜น์€ ๊ธฐ๋ฐ˜ ๋ชจ๋ธ์ด ์—…๋ฐ์ดํŠธ๋  ๋•Œ ๊ธฐ์กด ์–ด๋Œ‘ํ„ฐ๋“ค์˜ ์„ฑ๋Šฅ์ด ์ €ํ•˜๋˜๊ฑฐ๋‚˜ ์ถฉ๋Œํ•˜๋Š” ๋ฌธ์ œ(Catastrophic Forgetting์˜ ๋ณ€ํ˜•)์— ๋Œ€ํ•œ ์ง€์†์ ์ธ ์—ฐ๊ตฌ๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.
  • ์ตœ์†Œ ํฌ๊ธฐ ํƒ๊ตฌ: Scale Down ๊ด€์ ์—์„œ ์–ด๋Œ‘ํ„ฐ๋ฅผ ์–ด๋””๊นŒ์ง€ ์ž‘๊ฒŒ ์ค„์—ฌ๋„ ์—ฌ์ „ํžˆ ์‹ ๋ขฐํ•  ์ˆ˜ ์žˆ๋Š” ์„ฑ๋Šฅ์„ ๋‚ด๋Š”์ง€์— ๋Œ€ํ•œ ์ด๋ก ์ , ์‹ค๋ฌด์  ํ•œ๊ณ„๋ฅผ ๋” ํŒŒ๊ณ ๋“ค์–ด์•ผ ํ•ฉ๋‹ˆ๋‹ค.

5. ์‹ค๋ฌด ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ

  • ์ ์šฉ ๋ถ„์•ผ: ๋ชจ๋“  ์‚ฌ์šฉ์ž์—๊ฒŒ ์™„๋ฒฝํžˆ ๊ฐœ์ธํ™”๋œ ๋น„์„œ ์„œ๋น„์Šค, ๊ธฐ์—… ๋‚ด ์ง์›๋ณ„ ๋งž์ถคํ˜• ๋ฌธ์„œ ์ž‘์„ฑ ๋„๊ตฌ, ๊ฒŒ์ด๋จธ์˜ ์Šคํƒ€์ผ์„ ํ•™์Šตํ•˜๋Š” NPC(๋น„ํ”Œ๋ ˆ์ด์–ด ์บ๋ฆญํ„ฐ) ๋“ฑ์— ์ฆ‰์‹œ ์ ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ํ•„์š”ํ•œ ๋ฆฌ์†Œ์Šค:
    • ํ•™์Šต ๋‹จ๊ณ„: ๊ฑฐ๋Œ€ ๊ธฐ๋ฐ˜ ๋ชจ๋ธ์„ ํ˜ธ์ŠคํŒ…ํ•  ๊ฐ•๋ ฅํ•œ GPU ์„œ๋ฒ„๊ฐ€ 1๋Œ€(๋˜๋Š” ์†Œ์ˆ˜) ํ•„์š”ํ•˜๋ฉฐ, ์–ด๋Œ‘ํ„ฐ ํ•™์Šต ์ž์ฒด๋Š” ๊ฐ€๋ฒผ์šฐ๋ฏ€๋กœ ์ผ๋ฐ˜์ ์ธ ์†Œ๋น„์ž์šฉ GPU๋‚˜ ์‹ฌ์ง€์–ด CPU๋กœ๋„ ์ถฉ๋ถ„ํžˆ ๊ฐ€๋Šฅํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
    • ์„œ๋น™ ๋‹จ๊ณ„: ์ถ”๋ก  ์‹œ ๊ธฐ๋ฐ˜ ๋ชจ๋ธ๊ณผ ์‚ฌ์šฉ์ž์˜ ์–ด๋Œ‘ํ„ฐ๋ฅผ ๋กœ๋“œํ•ด์•ผ ํ•˜๋ฏ€๋กœ, ๋น ๋ฅธ ์ €์žฅ ์žฅ์น˜(SSD)์™€ ํšจ์œจ์ ์ธ ๋ชจ๋ธ ์„œ๋น™ ํ”„๋ ˆ์ž„์›Œํฌ(์˜ˆ: vLLM, TensorRT-LLM)๊ฐ€ ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค.

6. ์ด ๋…ผ๋ฌธ์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•œ ์‚ฌ์ „ ์ง€์‹

  • ํŒŒ์ธ ํŠœ๋‹(Fine-tuning): ์‚ฌ์ „ ํ•™์Šต๋œ ๋ชจ๋ธ์„ ํŠน์ • ์ž‘์—…์— ๋งž์ถฐ ์ถ”๊ฐ€๋กœ ํ•™์Šต์‹œํ‚ค๋Š” ๊ณผ์ •.
  • ํŒŒ๋ผ๋ฏธํ„ฐ ํšจ์œจ์  ํŒŒ์ธ ํŠœ๋‹(PEFT): ๋ชจ๋ธ์˜ ์ผ๋ถ€ ํŒŒ๋ผ๋ฏธํ„ฐ๋งŒ ํ•™์Šต์‹œ์ผœ ์ „์ฒด ํ•™์Šต๊ณผ ์œ ์‚ฌํ•œ ํšจ๊ณผ๋ฅผ ๋‚ด๋Š” ๊ธฐ๋ฒ•.
  • ์–ด๋Œ‘ํ„ฐ(Adapter): ์‹ ๊ฒฝ๋ง ๋ชจ๋ธ ์ค‘๊ฐ„์— ์‚ฝ์ž…ํ•˜๋Š” ์ž‘์€ ์ถ”๊ฐ€ ๊ณ„์ธต์œผ๋กœ, ์ƒˆ๋กœ์šด ๊ธฐ๋Šฅ์„ ํ•™์Šตํ•˜๊ธฐ ์œ„ํ•ด ์ˆ˜์ •ํ•˜๋Š” ๋Œ€์ƒ.
  • ๊ฑฐ๋Œ€ ์–ธ์–ด ๋ชจ๋ธ(LLM): ์ˆ˜์‹ญ์–ต ๊ฐœ ์ด์ƒ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ.
  • ์ถ”๋ก (Inference): ํ•™์Šต์ด ์™„๋ฃŒ๋œ ๋ชจ๋ธ์„ ์‚ฌ์šฉํ•˜์—ฌ ์‹ค์ œ๋กœ ๊ฒฐ๊ณผ๋ฅผ ์˜ˆ์ธกํ•˜๊ฑฐ๋‚˜ ์ƒ์„ฑํ•˜๋Š” ๊ณผ์ •.
  • ํ”„๋กฌํ”„ํŠธ ์—”์ง€๋‹ˆ์–ด๋ง(Prompt Engineering): ๋ชจ๋ธ์ด ์›ํ•˜๋Š” ๊ฒฐ๊ณผ๋ฅผ ๋‚ด๋„๋ก ์ž…๋ ฅ ๋ฌธ์žฅ์„ ์ตœ์ ํ™”ํ•˜๋Š” ๊ธฐ์ˆ .
  • ๋ชจ๋ธ ์„œ๋น™(Model Serving): ํ•™์Šต๋œ ๋ชจ๋ธ์„ ์‹ค์ œ ์„œ๋น„์Šค ํ™˜๊ฒฝ์— ๋ฐฐํฌํ•˜์—ฌ ์‚ฌ์šฉ์ž์˜ ์š”์ฒญ์— ์‹ค์‹œ๊ฐ„์œผ๋กœ ์‘๋‹ตํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋งŒ๋“œ๋Š” ์ธํ”„๋ผ ๊ตฌ์ถ• ์ž‘์—….

๐Ÿ“š ์ด๋ฒˆ ์ฃผ ๊ด€๋ จ Deep Dive

์ˆœ์œ„๋…ผ๋ฌธDeep Dive
๐Ÿฅ‡Crafter: A Multi-Agent Harness for โ€ฆDD-102
๐ŸฅˆOn the Scaling of PEFT: Towards Milโ€ฆ๐Ÿ“ ํ˜„์žฌ ๋ฌธ์„œ
๐Ÿฅ‰Domino: Decoupling Causal Modeling โ€ฆDD-104
4.COLLEAGUE.SKILL: Automated AI Skillโ€ฆDD-105
5.GrepSeek: Training Search Agents foโ€ฆDD-106

๐Ÿ“… ์ƒ์„ฑ์ผ: 2026-06-07 | ๐Ÿค– GLM-4.7 Deep Dive