โ ๐ ์ด๋ฒ ์ฃผ Weekly Digest๋ก ๋์๊ฐ๊ธฐ
DD-103 On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters
arXiv: 2606.02437 ๊ธฐ๊ด: Mind Lab Upvotes: 175 | Comments: 4 ์์: ์ด๋ฒ ์ฃผ Top 2
๋ ผ๋ฌธ ๋ฆฌ๋ทฐ: On the Scaling of PEFT: Towards Million Personal Models of Trillion Parameters
1. ์ ์ด ๋ ผ๋ฌธ์ด ์ค์ํ๊ฐ?
๊ธฐ์กด์ ํ๋ผ๋ฏธํฐ ํจ์จ์ ํ์ธ ํ๋(PEFT) ์ฐ๊ตฌ๋ค์ ์ฃผ๋ก ๊ฑฐ๋ ๋ชจ๋ธ์ ์ ์ฒด ์ฌํ์ตํ๋ ๋์ ๋น์ฉ์ ์๋ผ๊ธฐ ์ํ โ์ ๋ ดํ ๋์โ์๋ง ์ง์คํ์ต๋๋ค. ์ด ๋ ผ๋ฌธ์ PEFT๋ฅผ ๋จ์ํ ๋น์ฉ ์ ๊ฐ ๋๊ตฌ๊ฐ ์๋๋ผ, ํ๋์ ๊ฑฐ๋ ๊ธฐ๋ฐ ๋ชจ๋ธ ์์์ ์๋ฐฑ๋ง ๊ฐ์ ๊ฐ์ธํ๋ ๋ชจ๋ธ์ ์ด์ํ ์ ์๋ โ์ง์์ ์ธ ์ํ ๊ด๋ฆฌ ์ฒด๊ณโ๋ก ์ฌ์ ์ํ์ต๋๋ค. ์ด๋ฅผ ํตํด ์ฌ์ฉ์๋ณ ๋ง์ถคํ AI ์๋น์ค๋ฅผ ์๋์ ์ผ๋ก ์ ์ ๋ฆฌ์์ค๋ก ๋๊ท๋ชจ ํ์ฅํ ์ ์๋ ๊ธธ์ ์ด์์ต๋๋ค.
2. ํต์ฌ ์์ด๋์ด ์ฝ๊ฒ ์ดํดํ๊ธฐ
์ผ์์ํ ๋น์ : ์ค๋งํธํฐ ์ด์์ฒด์ ์ ๊ฐ์ธ ๋ฐ์ดํฐ
์ด ๋ ผ๋ฌธ์ ํต์ฌ ๊ฐ๋ ์ ์ค๋งํธํฐ์ ๊ตฌ์กฐ์ ๋งค์ฐ ํก์ฌํฉ๋๋ค. ๊ฑฐ๋ ๊ธฐ๋ฐ ๋ชจ๋ธ(Foundation Model)์ ๋ชจ๋ ์ฌ๋์ด ๋๊ฐ์ด ์ฌ์ฉํ๋ ์์ดํฐ์ด๋ ์๋๋ก์ด๋ ๊ฐ์ โ์ด์์ฒด์ (OS)โ๋ผ๊ณ ์๊ฐํ๋ฉด ๋ฉ๋๋ค. OS๋ ์ ํ ๊ฑธ๊ธฐ, ์ธํฐ๋ท ๊ฒ์ ๋ฑ ๊ธฐ๋ณธ์ ์ธ ๋ฅ๋ ฅ์ ๊ณตํต์ ์ผ๋ก ์ ๊ณตํฉ๋๋ค.
์ฌ๊ธฐ์ ์ด๋ํฐ(Adapter)๋ ๋ด ์ค๋งํธํฐ์ ์ ์ฅ๋ โ๊ฐ์ธ ์ค์ โ์ด๋ โ๋ฉ๋ชจ์ฅโ์ ๋๋ค. OS๋ ๋ฐ๊พธ์ง ์์ ์ฑ, ๋ด๊ฐ ์ข์ํ๋ ์ฑ๋ง ๋ฐ๋ก ์ค์นํ๊ฑฐ๋ ํ๋ฉด ๋ฐ๊ธฐ๋ฅผ ์กฐ์ ํ๋ ๊ฒ์ฒ๋ผ, AI ๋ชจ๋ธ ๋ณธ์ฒด๋ ๊ฑด๋๋ฆฌ์ง ์๊ณ ์ฌ์ฉ์์ ์ฑํฅ์ด๋ ๊ธฐ์ต์ ํด๋นํ๋ ์์ฃผ ์์ ๋ฉ์ด๋ฆฌ(์ด๋ํฐ)๋ง ๋ฐ๋ก ๋ถ์ด๋ ๊ฒ์ ๋๋ค. ์ด๋ ๊ฒ ํ๋ฉด ์์ต ๋ช ์ ์ฌ์ฉ์๊ฐ ๊ฐ์ ์์ ๋ง์ ์ด๋ํฐ๋ฅผ ๊ฐ์ง๊ณ , ๋ง์น ์์ ๋ง์ AI๋ฅผ ๊ฐ์ง ๊ฒ์ฒ๋ผ ์ฌ์ฉํ ์ ์์ต๋๋ค.
๋จ๊ณ๋ณ ๋์ ์๋ฆฌ
- ๊ณต์ ๊ธฐ๋ฐ ๋ชจ๋ธ ์ค๋น: ์์กฐ ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ๊ฑฐ๋ AI ๋ชจ๋ธ์ ํ๋ ๋ง๋ จํ๊ณ ์ด๋ฅผ ์ผ๋ฆฝ๋๋ค(Freeze). ์ด ๋ชจ๋ธ์ ์ธ์์ ์ผ๋ฐ์ ์ธ ์ง์์ ๋ด๊ณ ์์ต๋๋ค.
- ์ด๋ํฐ ์์ฑ: ์ฌ์ฉ์๋ณ๋ก ํ์ํ ํ๋ ์์, ์ ํธ๋, ๋๊ตฌ ์ฌ์ฉ ์ต๊ด ๋ฑ์ ํ์ตํ ์์ฃผ ์์ ์ ๊ฒฝ๋ง ๊ณ์ธต(Adapters)์ ๋ง๋ญ๋๋ค.
- ์ง์ญ์ ์ ๋ฐ์ดํธ: ๊ฑฐ๋ ๋ชจ๋ธ ์ ์ฒด๋ฅผ ํ์ต์ํค๋ ๊ฒ์ด ์๋๋ผ, ์ด ์์ ์ด๋ํฐ๋ง ์ฌ์ฉ์์ ๋ฐ์ดํฐ๋ก ํ์ต์ํต๋๋ค.
- ์ง์์ ๊ด๋ฆฌ: ํ์ต๋ ์ด๋ํฐ๋ ์ฌ์ฉ์์ ์๊ตฌ์ ์ธ ์ํ๋ก ์ ์ฅ๋์ด, ๋ชจ๋ธ์ด ํธ์ถ๋ ๋๋ง๋ค ๊ธฐ๋ณธ ๋ชจ๋ธ ์์ ์นํ์ ธ ๊ฐ์ธํ๋ ๋ต๋ณ์ ์์ฑํฉ๋๋ค.
ํต์ฌ ์๊ณ ๋ฆฌ์ฆ ๋ฐ ์์
์ด ๋ ผ๋ฌธ์ ๋ณต์กํ ์๋ก์ด ์์์ ์ ์ํ๊ธฐ๋ณด๋ค๋, ๊ธฐ์กด PEFT ๋ฐฉ์์ ํ์ฅ์ฑ์ ์ฒด๊ณ์ ์ผ๋ก ๋ถ์ํฉ๋๋ค. ๊ธฐ๋ณธ์ ์ธ ์์ด๋์ด๋ ๋ค์๊ณผ ๊ฐ์ด ํํํ ์ ์์ต๋๋ค.
$$ W_{final} = W_{base} + \Delta W_{user} $$
์ฌ๊ธฐ์ $W_{base}$๋ ์์ ๋์ง ์๋ ๊ฑฐ๋ ๊ธฐ๋ฐ ๋ชจ๋ธ์ ๊ฐ์ค์น์ด๋ฉฐ, $\Delta W_{user}$๋ ํน์ ์ฌ์ฉ์๋ ์ธ์คํด์ค๋ฅผ ์ํด ํ์ต๋ ์์ฃผ ์์ ์ด๋ํฐ ๊ฐ์ค์น์ ๋๋ค. ๋ ผ๋ฌธ์ ์ด $\Delta W$๋ฅผ ์ผ๋ง๋ ์๊ฒ ์ค์ผ ์ ์๋์ง(Scale Down), ๊ธฐ๋ฐ ๋ชจ๋ธ์ด ์ปค์ง ๋ ํจ๊ณผ๊ฐ ์ด๋ป๊ฒ ๋ณํ๋์ง(Scale Up), ๊ทธ๋ฆฌ๊ณ ์ด๋ฌํ ์ด๋ํฐ ์๋ฐฑ๋ง ๊ฐ๋ฅผ ์ด๋ป๊ฒ ํจ์จ์ ์ผ๋ก ๊ด๋ฆฌํ๋์ง(Scale Out)๋ฅผ ํ๊ตฌํฉ๋๋ค.
3. ์คํ ๊ฒฐ๊ณผ ๋ถ์
์ด ๋ ผ๋ฌธ์ ํน์ ๋ฒค์น๋งํฌ ์ ์ ํ๋๋ฅผ ์ฌ๋ฆฌ๋ ๊ฒ๋ณด๋ค, ์์คํ ์ ์ฒด์ ํ์ฅ ๊ฐ๋ฅ์ฑ์ ์ ์ฆํ๋ ๋ฐ ์ค์ ์ ๋์์ต๋๋ค.
- ํ์ฅ ์ถ(Scale Axes)์ ๋ฐ๋ฅธ ๋ถ์: ์ ์๋ค์ Scale Up(๊ธฐ๋ฐ ๋ชจ๋ธ ์ฑ๋ฅ ํฅ์ ์ ์ด๋ํฐ์ ํจ์ฉ์ฑ ์ฆ๊ฐ), Scale Down(์ด๋ํฐ ํฌ๊ธฐ ์ต์ํ์ ๋ฐ๋ฅธ ์ ๋ขฐ์ฑ ์ ์ง), Scale Out(๋ค์์ ์ด๋ํฐ ๊ณต์กด)์ ์ธ ๊ฐ์ง ์ถ์ ์ค์ ํ์ฌ ์คํํ์ต๋๋ค.
- ๊ธฐ์กด ๋ฐฉ์ ๋๋น ํจ์จ์ฑ: ๊ธฐ์กด์ Full Fine-tuning(์ ์ฒด ํ์ธ ํ๋) ๋ฐฉ์์ ๋ชจ๋ธ ์ ์ฒด๋ฅผ ๋ณต์ฌํด์ผ ํ๊ธฐ ๋๋ฌธ์ ์ฌ์ฉ์ 100๋ช ๋น ๋ชจ๋ธ 100๊ฐ๊ฐ ํ์ํ์ต๋๋ค. ๋ฐ๋ฉด ์ด ๋ ผ๋ฌธ์ ์ ๊ทผ ๋ฐฉ์์ ๊ธฐ๋ณธ ๋ชจ๋ธ 1๊ฐ์ ์์ฃผ ์์ ์ด๋ํฐ ํ์ผ๋ค๋ง ์์ผ๋ฉด ๋๋ฏ๋ก, ์ ์ฅ ๊ณต๊ฐ๊ณผ ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์์ ํ๊ธฐ์ ์ธ ๊ฐ์ ์ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
- MinT ์ธํ๋ผ ๋ฐ๋ชจ: ์๋ฐฑ๋ง ๊ฐ์ ์ด๋ํฐ ์๋ณ, ๋ฒ์ ๊ด๋ฆฌ, ์ถ์ฒ ์ถ์ (Provenance), ํ๊ฐ, ์๋น์ ๊ด๋ฆฌํ ์ ์๋ MinT๋ผ๋ ์ธํ๋ผ ์์๋ฅผ ์ ์ํ๋ฉฐ, ์ค์ ๋ก ์ด๋ฌํ ๊ฐ์ธ ๋ชจ๋ธ๋ค์ ๋๊ท๋ชจ๋ก ์ด์ํ ์ ์์์ ์ฆ๋ช ํ์ต๋๋ค.
4. ํ๊ณ์ ๊ณผ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
- ๊ด๋ฆฌ์ ๋ณต์ก์ฑ: ์ ์๋ค์ ๋ชจ๋ธ ํ์ต ์์ฒด์ ๋น์ฉ ๋ฌธ์ ๊ฐ ํด๊ฒฐ๋๋ฉด์, ์ด์ ๋ ์๋ง์ ์ด๋ํฐ์ โ์๋ณโ, โ๋ฒ์ ๊ด๋ฆฌโ, โํ๊ฐโ์ ๊ฐ์ ์ํํธ์จ์ด์ ๊ด๋ฆฌ ๋ฌธ์ ๊ฐ ์๋ก์ด ๋ณ๋ชฉ์ด ๋ ์ ์์์ ์ง์ ํ์ต๋๋ค.
- ์ด๋ํฐ ๊ฐ ๊ฐ์ญ: ์๋ง์ ์ด๋ํฐ๊ฐ ๊ณต์กดํ ๋, ํน์ ๊ธฐ๋ฐ ๋ชจ๋ธ์ด ์ ๋ฐ์ดํธ๋ ๋ ๊ธฐ์กด ์ด๋ํฐ๋ค์ ์ฑ๋ฅ์ด ์ ํ๋๊ฑฐ๋ ์ถฉ๋ํ๋ ๋ฌธ์ (Catastrophic Forgetting์ ๋ณํ)์ ๋ํ ์ง์์ ์ธ ์ฐ๊ตฌ๊ฐ ํ์ํฉ๋๋ค.
- ์ต์ ํฌ๊ธฐ ํ๊ตฌ: Scale Down ๊ด์ ์์ ์ด๋ํฐ๋ฅผ ์ด๋๊น์ง ์๊ฒ ์ค์ฌ๋ ์ฌ์ ํ ์ ๋ขฐํ ์ ์๋ ์ฑ๋ฅ์ ๋ด๋์ง์ ๋ํ ์ด๋ก ์ , ์ค๋ฌด์ ํ๊ณ๋ฅผ ๋ ํ๊ณ ๋ค์ด์ผ ํฉ๋๋ค.
5. ์ค๋ฌด ์ ์ฉ ๊ฐ๋ฅ์ฑ
- ์ ์ฉ ๋ถ์ผ: ๋ชจ๋ ์ฌ์ฉ์์๊ฒ ์๋ฒฝํ ๊ฐ์ธํ๋ ๋น์ ์๋น์ค, ๊ธฐ์ ๋ด ์ง์๋ณ ๋ง์ถคํ ๋ฌธ์ ์์ฑ ๋๊ตฌ, ๊ฒ์ด๋จธ์ ์คํ์ผ์ ํ์ตํ๋ NPC(๋นํ๋ ์ด์ด ์บ๋ฆญํฐ) ๋ฑ์ ์ฆ์ ์ ์ฉํ ์ ์์ต๋๋ค.
- ํ์ํ ๋ฆฌ์์ค:
- ํ์ต ๋จ๊ณ: ๊ฑฐ๋ ๊ธฐ๋ฐ ๋ชจ๋ธ์ ํธ์คํ ํ ๊ฐ๋ ฅํ GPU ์๋ฒ๊ฐ 1๋(๋๋ ์์) ํ์ํ๋ฉฐ, ์ด๋ํฐ ํ์ต ์์ฒด๋ ๊ฐ๋ฒผ์ฐ๋ฏ๋ก ์ผ๋ฐ์ ์ธ ์๋น์์ฉ GPU๋ ์ฌ์ง์ด CPU๋ก๋ ์ถฉ๋ถํ ๊ฐ๋ฅํ ์ ์์ต๋๋ค.
- ์๋น ๋จ๊ณ: ์ถ๋ก ์ ๊ธฐ๋ฐ ๋ชจ๋ธ๊ณผ ์ฌ์ฉ์์ ์ด๋ํฐ๋ฅผ ๋ก๋ํด์ผ ํ๋ฏ๋ก, ๋น ๋ฅธ ์ ์ฅ ์ฅ์น(SSD)์ ํจ์จ์ ์ธ ๋ชจ๋ธ ์๋น ํ๋ ์์ํฌ(์: vLLM, TensorRT-LLM)๊ฐ ํ์์ ์ ๋๋ค.
6. ์ด ๋ ผ๋ฌธ์ ์ดํดํ๊ธฐ ์ํ ์ฌ์ ์ง์
- ํ์ธ ํ๋(Fine-tuning): ์ฌ์ ํ์ต๋ ๋ชจ๋ธ์ ํน์ ์์ ์ ๋ง์ถฐ ์ถ๊ฐ๋ก ํ์ต์ํค๋ ๊ณผ์ .
- ํ๋ผ๋ฏธํฐ ํจ์จ์ ํ์ธ ํ๋(PEFT): ๋ชจ๋ธ์ ์ผ๋ถ ํ๋ผ๋ฏธํฐ๋ง ํ์ต์์ผ ์ ์ฒด ํ์ต๊ณผ ์ ์ฌํ ํจ๊ณผ๋ฅผ ๋ด๋ ๊ธฐ๋ฒ.
- ์ด๋ํฐ(Adapter): ์ ๊ฒฝ๋ง ๋ชจ๋ธ ์ค๊ฐ์ ์ฝ์ ํ๋ ์์ ์ถ๊ฐ ๊ณ์ธต์ผ๋ก, ์๋ก์ด ๊ธฐ๋ฅ์ ํ์ตํ๊ธฐ ์ํด ์์ ํ๋ ๋์.
- ๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ(LLM): ์์ญ์ต ๊ฐ ์ด์์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ.
- ์ถ๋ก (Inference): ํ์ต์ด ์๋ฃ๋ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ์ค์ ๋ก ๊ฒฐ๊ณผ๋ฅผ ์์ธกํ๊ฑฐ๋ ์์ฑํ๋ ๊ณผ์ .
- ํ๋กฌํํธ ์์ง๋์ด๋ง(Prompt Engineering): ๋ชจ๋ธ์ด ์ํ๋ ๊ฒฐ๊ณผ๋ฅผ ๋ด๋๋ก ์ ๋ ฅ ๋ฌธ์ฅ์ ์ต์ ํํ๋ ๊ธฐ์ .
- ๋ชจ๋ธ ์๋น(Model Serving): ํ์ต๋ ๋ชจ๋ธ์ ์ค์ ์๋น์ค ํ๊ฒฝ์ ๋ฐฐํฌํ์ฌ ์ฌ์ฉ์์ ์์ฒญ์ ์ค์๊ฐ์ผ๋ก ์๋ตํ ์ ์๊ฒ ๋ง๋๋ ์ธํ๋ผ ๊ตฌ์ถ ์์ .
๐ ์ด๋ฒ ์ฃผ ๊ด๋ จ Deep Dive
| ์์ | ๋ ผ๋ฌธ | Deep Dive |
|---|---|---|
| ๐ฅ | Crafter: A Multi-Agent Harness for โฆ | DD-102 |
| ๐ฅ | On the Scaling of PEFT: Towards Milโฆ | ๐ ํ์ฌ ๋ฌธ์ |
| ๐ฅ | Domino: Decoupling Causal Modeling โฆ | DD-104 |
| 4. | COLLEAGUE.SKILL: Automated AI Skillโฆ | DD-105 |
| 5. | GrepSeek: Training Search Agents foโฆ | DD-106 |
๐ ์์ฑ์ผ: 2026-06-07 | ๐ค GLM-4.7 Deep Dive