โ ๐ ์ด๋ฒ ์ฃผ Weekly Digest๋ก ๋์๊ฐ๊ธฐ
DD-087 MinT: Managed Infrastructure for Training and Serving Millions of LLMs
arXiv: 2605.13779 ๊ธฐ๊ด: Mind Lab Upvotes: 205 | Comments: 3 ์์: ์ด๋ฒ ์ฃผ Top 1
๋ ผ๋ฌธ ๋ถ์: MinT (Managed Infrastructure for Training and Serving Millions of LLMs)
1. ์ ์ด ๋ ผ๋ฌธ์ด ์ค์ํ๊ฐ?
๊ธฐ์กด์ ๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ(LLM) ์ด์ ํ๊ฒฝ์์๋ ์๋ก์ด ์ ์ฑ ์ด๋ ์์ด์ ํธ๋ฅผ ๋ง๋ค ๋๋ง๋ค ๋ชจ๋ธ ์ ์ฒด๋ฅผ ๋ณต์ฌํ๊ฑฐ๋ ํฉ์ณ์ ์ ์ฅํด์ผ ํ์ต๋๋ค. ์ด๋ ์์กฐ ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ๋ชจ๋ธ์ ์๋ฐฑ๋ง ๊ฐ์ ๋ณํ์ผ๋ก ๋ง๋ค์ด์ผ ํ๋ ํ์ค์ ์ธ ์๊ตฌ์ฌํญ์ ์ถฉ์กฑํ๊ธฐ์ ์ ์ฅ ๋น์ฉ๊ณผ ๊ด๋ฆฌ ๋ณต์ก๋๊ฐ ๋๋ฌด ๋์์ต๋๋ค. ์ด ๋ ผ๋ฌธ์ ๊ฑฐ๋ ๊ธฐ๋ณธ ๋ชจ๋ธ์ ๋ฉ๋ชจ๋ฆฌ์ ๊ณ ์ ํด ๋๊ณ , ๋ณ๊ฒฝ๋๋ ์์ ๋ถ๋ถ์ธ LoRA ์ด๋ํฐ๋ง ํจ์จ์ ์ผ๋ก ๊ด๋ฆฌํ์ฌ ์๋ฐฑ๋ง ๊ฐ์ ๋ชจ๋ธ์ ํ์ตํ๊ณ ์๋นํ ์ ์๋ ์ธํ๋ผ๋ฅผ ์ ์ํฉ๋๋ค. ์ด๋ฅผ ํตํด ํ๋์จ์ด ๋ฆฌ์์ค ์ฌ์ฉ์ ํ๊ธฐ์ ์ผ๋ก ์ค์ด๊ณ , ์์ด์ ํธํ ๋ชจ๋ธ์ ์ง์์ ์ธ ํ์ต๊ณผ ๋ฐฐํฌ๋ฅผ ๊ฐ๋ฅํ๊ฒ ๋ง๋ค์์ต๋๋ค.
2. ํต์ฌ ์์ด๋์ด ์ฝ๊ฒ ์ดํดํ๊ธฐ
์ผ์์ํ ๋น์ : โ๊ฑฐ๋ ์ํํธ ๋จ์ง์ ๊ฐ๊ตฌ ๋ฐฐ์นโ
์ด ์์คํ ์ ์ดํดํ๋ ๊ฐ์ฅ ์ฌ์ด ๋ฐฉ๋ฒ์ โ๊ฑฐ๋ ์ํํธ ๋จ์งโ๋ฅผ ๋น์ ๋ก ๋๋ ๊ฒ์ ๋๋ค.
- **๊ธฐ๋ณธ ๋ชจ๋ธ(Base Model)**์ ์ํํธ ๊ฑด๋ฌผ ์์ฒด์ ๋๋ค. ๋งค์ฐ ๋น์ธ๊ณ ํฌ๊ธฐ ๋๋ฌธ์ ํ ๋ฒ ์ง์ด ๋์ผ๋ฉด ์ฌ๋งํด์๋ ํ๋ฌผ๊ฑฐ๋ ์ด๋ํ ์ ์์ต๋๋ค.
- **LoRA ์ด๋ํฐ(Adapter)**๋ ๊ฐ ์ธ๋์ ๋ค์ด๊ฐ๋ โ๊ฐ๊ตฌโ๋ โ์ธํ ๋ฆฌ์ดโ ์คํ์ผ์ ๋๋ค. ๊ฑฐ์ฃผ์(์ฌ์ฉ์)๋ ์ฉ๋(์ ๋ฌด)์ ๋ฐ๋ผ ๊ฐ๊ตฌ๋ ๊ณ์ ๋ฐ๋์ง๋ง, ๊ฑด๋ฌผ ์์ฒด๋ ๊ทธ๋๋ก ๋จ์ ์์ต๋๋ค.
- ๊ธฐ์กด ๋ฐฉ์์ ์๋ก์ด ๊ฑฐ์ฃผ์๊ฐ ๋ค์ด์ฌ ๋๋ง๋ค ๊ฑด๋ฌผ์ ํต์งธ๋ก ๋ณต์ฌํด์ ์๋ก ์ง๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. ๋๋ฌด ๋นํจ์จ์ ์ด์ฃ .
- MinT๋ ๊ฑด๋ฌผ์ ๊ทธ๋๋ก ๋ ์ฑ, ์๋ฆฌ๋ฒ ์ดํฐ์ ์ด์ฟ์ง ์ผํฐ(์์คํ )๋ฅผ ํตํด ๊ฐ๊ตฌ(์ด๋ํฐ)๋ง ์ค์๊ฐ์ผ๋ก ๊ต์ฒดํด ์ฃผ๋ ์ด๊ณ ํจ์ฌ ๊ด๋ฆฌ ์์คํ ์ ๋๋ค.
๋จ๊ณ๋ณ ๋์ ๊ณผ์
MinT๋ ์ด๋ํฐ์ ์์ ์ฃผ๊ธฐ๋ฅผ ๊ด๋ฆฌํ๋ ํ์ดํ๋ผ์ธ์ ๊ตฌ์ถํ์ฌ ๋์ํฉ๋๋ค.
- ๊ธฐ๋ณธ ๋ชจ๋ธ ์์ฃผ(Resident Base Model): ์์กฐ ๊ฐ์ ํ๋ผ๋ฏธํฐ๋ฅผ ๊ฐ์ง ๊ธฐ๋ณธ ๋ชจ๋ธ์ GPU ๋ฉ๋ชจ๋ฆฌ์ ํญ์ ๋์๋ก๋๋ค. ์ด ๋ฌด๊ฑฐ์ด ๋ชจ๋ธ์ ์์ง์ด์ง ์์ต๋๋ค.
- ์ด๋ํฐ ์ํ(Adapter-Revision Path): ์ฌ์ฉ์๊ฐ ์๋ก์ด ๋ฐ์ดํฐ๋ ๋ณด์์ ์ฃผ๋ฉด, ์์คํ ์ ์ด๋ฅผ ๋ฐํ์ผ๋ก ์์ ํฌ๊ธฐ์ LoRA ์ด๋ํฐ๋ฅผ ์์ฑํ๊ฑฐ๋ ์ ๋ฐ์ดํธํฉ๋๋ค.
- ์๋น์ค ์ธํฐํ์ด์ค(Service Interface): ํ์ต, ํ๊ฐ, ์๋น, ๋กค๋ฐฑ๊ณผ ๊ฐ์ ๋ณต์กํ ๊ณผ์ ์ ์ฌ์ฉ์๊ฐ ์ ๊ฒฝ ์ฐ์ง ์๋๋ก ์จ๊ฒจ๋ก๋๋ค. ์ฌ์ฉ์๋ ๊ทธ์ ๋ฐ์ดํฐ๋ฅผ ๋ฃ๊ณ ๊ฒฐ๊ณผ๋ฅผ ๋ฐ์ ๋ฟ, ๋ด๋ถ์ ์ผ๋ก ๋ถ์ฐ ์ปดํจํ ์ด ์ด๋ป๊ฒ ์ค์ผ์ค๋ง๋๋์ง ์ ํ์๊ฐ ์์ต๋๋ค.
- ๋์ ๊ต์ฒด: ์๋น ๋จ๊ณ์์ ๊ธฐ๋ณธ ๋ชจ๋ธ์ ์ด๋ค ์ด๋ํฐ๋ฅผ ์ฌ๋ฆด์ง ์ฆ์ ๊ฒฐ์ ํ์ฌ ๊ฒฐํฉํฉ๋๋ค. ๋ง์น ์ํํธ ๊ฑด๋ฌผ์ ์ ์ฅํด์ ํด๋น ์ธ๋์ ์ธํ ๋ฆฌ์ด๋ก ์ฆ์ ๊พธ๋ฏธ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค.
ํต์ฌ ๊ธฐ์ ์๋ฆฌ
์ด ์์คํ ์ ์ํ์ ๋ฐฐ๊ฒฝ์ LoRA(Low-Rank Adaptation)์ ๊ธฐ๋ฐํฉ๋๋ค. ๊ฑฐ๋ ๋ชจ๋ธ์ ๊ฐ์ค์น ํ๋ ฌ $W$๋ฅผ ์ ๋ฐ์ดํธํ ๋, ํ๋ ฌ ์ ์ฒด๋ฅผ ์ ๋ฐ์ดํธํ๋ ๋์ ๋ ๊ฐ์ ์์ ํ๋ ฌ $A$์ $B$์ ๊ณฑ์ผ๋ก ์ ๋ฐ์ดํธ๋ $\Delta W$๋ฅผ ํํํฉ๋๋ค.
$$W_{new} = W_{base} + \Delta W = W_{base} + B \times A$$
์ฌ๊ธฐ์ $W_{base}$๋ ๊ณ ์ ๋์ด ์๊ณ (์ํํธ ๊ฑด๋ฌผ), $B$์ $A$๋ง ํ์ตํ๊ณ ์ด๋์ํค๋ฉด ๋ฉ๋๋ค(๊ฐ๊ตฌ). MinT๋ ์ด ์์ ํ๋ ฌ๋ค์ ์ ์ฅ, ์ ์ก, ๋ก๋ํ๋ ๋ฐ ํนํ๋ ์ธํ๋ผ๋ฅผ ์ ๊ณตํฉ๋๋ค.
3. ์คํ ๊ฒฐ๊ณผ ๋ถ์
์ด ๋ ผ๋ฌธ์ ์คํ ๊ฒฐ๊ณผ๋ โ๊ท๋ชจ์ ๊ฒฝ์ โ๋ฅผ ์ค์ฆํ๋ ๋ฐ ์ด์ ์ ๋ง์ถ๊ณ ์์ต๋๋ค.
- ๋ฒค์น๋งํฌ: ์ฐ๊ตฌ์ง์ ๋ค์ํ ํฌ๊ธฐ์ LLM(์์ญ์ต ํ๋ผ๋ฏธํฐ๋ถํฐ ์์กฐ ํ๋ผ๋ฏธํฐ๊น์ง)์ ์ฌ์ฉํ์ฌ, LoRA ๊ธฐ๋ฐ ๊ฐํ ํ์ต(RL) ์ํฌ๋ก๋์ ๊ฐ์ธํ๋ ์๋น ์๋๋ฆฌ์ค๋ฅผ ์๋ฎฌ๋ ์ด์ ํ์ต๋๋ค.
- ๊ธฐ์กด ๋ฐฉ์ ๋๋น ํจ์จ์ฑ: ์ ์ฒด ์ฒดํฌํฌ์ธํธ(Full Checkpoint)๋ฅผ ๋งค๋ฒ ๋ณต์ฌํด์ ์ ์ฅํ๋ ์ ํต์ ์ธ ๋ฐฉ์๊ณผ ๋น๊ตํ์ ๋, MinT๋ ์คํ ๋ฆฌ์ง ๊ณต๊ฐ ์ฌ์ฉ๋์ 1,000๋ฐฐ ์ด์ ์ ๊ฐํ์ต๋๋ค.
- ์ด์ ์๋ ๋ฐ ์ฒ๋ฆฌ๋: ๋ชจ๋ธ ๋ก๋ฉ ์๊ฐ(Cold Start)์ด ๊ธฐ์กด ๋ฐฉ์์ ๋ช ๋ถ์์ ๋ช ์ด๋ก ๋จ์ถ๋์์ต๋๋ค. ์๋ฐฑ๋ง ๊ฐ์ ์ด๋ํฐ ๋ฒ์ ์ ๊ด๋ฆฌํ๋ฉด์๋, ๋จ์ผ ๊ธฐ๋ณธ ๋ชจ๋ธ์ ํตํด ์ด๋น ์๋ง ๊ฐ์ ์์ฒญ์ ์ฒ๋ฆฌํ ์ ์๋ ๋์ ์ฒ๋ฆฌ๋(Throughput)์ ๋ณด์ฌ์ฃผ์์ต๋๋ค.
- ์ฃผ๋ชฉํ ๋งํ ์ฑ๊ณผ: ๋ฌด์๋ณด๋ค โ์๋ฐฑ๋ง ๊ฐ์ ์ ์ฑ (Policies)โ์ ์จ๋ผ์ธ ์์์ ๋์์ ์ด์ํ๊ณ , ์ง์์ ์ธ ๊ฒฝํ์ ํตํ ํ์ต(Lifelong Learning)์ ์ํํ ์ ์์์ ์ ์ฆํ์ต๋๋ค. ์ด๋ AI ์์ด์ ํธ๊ฐ ์ค์๊ฐ์ผ๋ก ํ๊ฒฝ๊ณผ ์ํธ์์ฉํ๋ฉฐ ์ค์ค๋ก ๋ฐ์ ํ๋ ๋ฐ ํ์์ ์ธ ์ธํ๋ผ์ ๋๋ค.
4. ํ๊ณ์ ๊ณผ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
์ ์๊ฐ ์ธ๊ธํ ํ๊ณ
- ๋คํธ์ํฌ ๋์ญํญ ๋ณ๋ชฉ: ๊ธฐ๋ณธ ๋ชจ๋ธ์ ๋ฉ๋ชจ๋ฆฌ์ ์์ง๋ง, ์๋ง์ ์ด๋ํฐ๊ฐ ๋คํธ์ํฌ๋ฅผ ํตํด ์ด๋ํด์ผ ํ๋ฏ๋ก ๋คํธ์ํฌ ๋์ญํญ์ ๋ฏผ๊ฐํ ์๋ฐ์ ์์ต๋๋ค. ์ด๋ํฐ์ ํฌ๊ธฐ๊ฐ ๋งค์ฐ ์์ง๋ง, ์์ฒญ๋์ด ํญ๋ฐํ ๋ ๋คํธ์ํฌ ์ง์ฐ์ด ๋ฐ์ํ ์ ์์ต๋๋ค.
- ์ค์ผ์ค๋ง ๋ณต์ก์ฑ: ์๋ฐฑ๋ง ๊ฐ์ ์ด๋ํฐ ๋ฒ์ ์ ์ถ์ ํ๊ณ , ํ์ํ ๊ฒ์ ์ ํํ ํ์ด๋ฐ์ GPU ๋ฉ๋ชจ๋ฆฌ์ ๋ก๋ํ๋ ์ค์ผ์ค๋ง ์๊ณ ๋ฆฌ์ฆ์ ๋ณต์ก๋๊ฐ ๋งค์ฐ ๋์ต๋๋ค.
๊ฐ์ ๊ฐ๋ฅ์ฑ ๋ฐ ํฅํ ์ฐ๊ตฌ
- ๋ถ์ฐ ์บ์ฑ ์ต์ ํ: ์์ฃผ ์ฌ์ฉ๋๋ ์ด๋ํฐ๋ฅผ ๋ก์ปฌ GPU ๋ฉ๋ชจ๋ฆฌ๋ ๋ ๊ฐ๊น์ด ์บ์ ๋ ์ด์ด์ ๋๋ ์ ๋ต์ด ํฅํ ์ฐ๊ตฌ ์ฃผ์ ๊ฐ ๋ ๊ฒ์ ๋๋ค.
- ํผํฉ ์ ๋ฐ๋ ๋ฐ ์์ถ: ์ด๋ํฐ ์์ฒด์ ํฌ๊ธฐ๋ฅผ ๋ ์ค์ด๊ธฐ ์ํ ์์ํ(Quantization) ๊ธฐ๋ฒ ์ ์ฉ์ด๋ ์์ถ ์๊ณ ๋ฆฌ์ฆ์ ๋์ ์ด ์์๋ฉ๋๋ค.
- ๋ค์ค ๋ชจ๋ฌ ํ์ฅ: ํ ์คํธ๋ฟ๋ง ์๋๋ผ ์ด๋ฏธ์ง, ๋น๋์ค๋ฅผ ์ฒ๋ฆฌํ๋ ๋ค์ค ๋ชจ๋ฌ ๊ธฐ๋ณธ ๋ชจ๋ธ๋ก์ ํ์ฅ์ฑ ๊ฒ์ฆ์ด ํ์ํฉ๋๋ค.
5. ์ค๋ฌด ์ ์ฉ ๊ฐ๋ฅ์ฑ
๋ฐ๋ก ์ ์ฉ ๊ฐ๋ฅํ ๋ถ์ผ
- ๋๊ท๋ชจ ๊ฐ์ธํ ๋น์: ์์ฒ๋ง ๋ช ์ ์ฌ์ฉ์ ๊ฐ๊ฐ์ด ์์ ๋ง์ ์คํ์ผ๊ณผ ์ ํธ๋๋ฅผ ๊ฐ์ง AI ์ด์์คํดํธ๋ฅผ ์ฌ์ฉํ ๋, ์ฌ์ฉ์๋ณ ๋ง์ถคํ LoRA๋ฅผ ์ ์ฉํ์ฌ ์๋น์ค ์ ๊ณต.
- ๊ฒ์ ๋ฐ ๋ฉํ๋ฒ์ค NPC: ์๋ง ๋ช ์ NPC(๋นํ๋ ์ด์ด ์บ๋ฆญํฐ)๊ฐ ๊ฐ์ ๋ ํนํ ์ฑ๊ฒฉ๊ณผ ํ๋ ํจํด(์ ์ฑ )์ ๊ฐ์ง๊ณ ์ํธ์์ฉํด์ผ ํ๋ ์จ๋ผ์ธ ๊ฒ์ ํ๊ฒฝ.
- ๊ธฐ์ ์ฉ AI ์์ด์ ํธ ํ๋ซํผ: ํ๋์ ๊ธฐ๋ณธ ๋ชจ๋ธ์ ์ฌ์ฉํ๋, ๋ถ์๋ณ ํน์ ํ๋ก์ ํธ๋ณ๋ก ์ ๋ฌธํ๋ ์์ด์ ํธ๋ฅผ ๋น ๋ฅด๊ฒ ์์ฑํ๊ณ ๋ฐฐํฌํด์ผ ํ๋ SaaS ๊ธฐ์ .
ํ์ํ ๋ฆฌ์์ค
- ํ๋์จ์ด: ๊ณ ๋์ญํญ ๋ฉ๋ชจ๋ฆฌ(HBM)๊ฐ ์ฅ์ฐฉ๋ ์ต์ GPU ํด๋ฌ์คํฐ(์: NVIDIA H100 ๋๋ A100 ํด๋ฌ์คํฐ)๊ฐ ํ์์ ์ ๋๋ค.
- ๋ฐ์ดํฐ: ๊ฐ ์์ด์ ํธ๋ ์ ์ฑ ์ ํ๋ จ์ํค๊ธฐ ์ํ ๊ณ ํ์ง์ ์ํธ์์ฉ ๋ฐ์ดํฐ ๋ฐ ๋ณด์ ํผ๋๋ฐฑ ๋ฐ์ดํฐ๊ฐ ํ์ํฉ๋๋ค.
- ์ํํธ์จ์ด: Kubernetes์ ๊ฐ์ ์ปจํ ์ด๋ ์ค์ผ์คํธ๋ ์ด์ ๊ณผ ๋ถ์ฐ ์คํ ๋ฆฌ์ง ์์คํ ์ด ๊ตฌ์ถ๋ ํ๊ฒฝ์ด์ด์ผ MinT์ ์ฅ์ ์ ์ด๋ฆด ์ ์์ต๋๋ค.
6. ์ด ๋ ผ๋ฌธ์ ์ดํดํ๊ธฐ ์ํ ์ฌ์ ์ง์
- LoRA (Low-Rank Adaptation): ๊ฑฐ๋ ๋ชจ๋ธ์ ํ๋ผ๋ฏธํฐ ์ ์ฒด๋ฅผ ์ฌํ์ต์ํค๋ ๋์ , ์ผ๋ถ๋ถ๋ง ์ถ๊ฐํ์ฌ ํจ์จ์ ์ผ๋ก ๋ฏธ์ธ ์กฐ์ ํ๋ ๊ธฐ๋ฒ.
- LLM Inference (์ถ๋ก ): ํ์ต๋ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ์ฌ์ฉ์์ ์ง๋ฌธ์ ๋ต๋ณ์ ์์ฑํ๋ ๊ณผ์ .
- RLHF (Reinforcement Learning from Human Feedback): ์ธ๊ฐ์ ํผ๋๋ฐฑ์ ๋ณด์์ผ๋ก ์ฌ์ฉํ์ฌ ๋ชจ๋ธ์ด ์ธ๊ฐ์ด ์ํ๋ ๋ฐฉํฅ์ผ๋ก ๋ต๋ณํ๋๋ก ํ๋ จ์ํค๋ ๊ฐํ ํ์ต ๋ฐฉ๋ฒ.
- Checkpoint (์ฒดํฌํฌ์ธํธ): ํ์ต ์ค๊ฐ ๋จ๊ณ์ ๋ชจ๋ธ ์ํ(ํ๋ผ๋ฏธํฐ ๊ฐ ๋ฑ)๋ฅผ ์ ์ฅํด ๋ ํ์ผ.
- Throughput (์ฒ๋ฆฌ๋): ์์คํ ์ด ๋จ์ ์๊ฐ๋น ์ฒ๋ฆฌํ ์ ์๋ ์์ ์ ์ (์: ์ด๋น ์ฒ๋ฆฌ ์์ฒญ ์).
- Serving (์๋น): ํ์ต๋ ๋ชจ๋ธ์ ์ค์ ์ฌ์ฉ์๊ฐ ์ฌ์ฉํ ์ ์๋๋ก ์๋ฒ ํํ๋ก ๋ฐฐํฌํ๊ณ ์ด์ํ๋ ๊ฒ.
- SOTA (State-of-the-Art): ํน์ ๋ถ์ผ์์ ํ์ฌ ๊ฐ์ฅ ์ฑ๋ฅ์ด ์ข๊ฑฐ๋ ์ต์ ์ธ ๊ธฐ์ ์์ค.
๐ ์ด๋ฒ ์ฃผ ๊ด๋ จ Deep Dive
| ์์ | ๋ ผ๋ฌธ | Deep Dive |
|---|---|---|
| ๐ฅ | MinT: Managed Infrastructure for Trโฆ | ๐ ํ์ฌ ๋ฌธ์ |
| ๐ฅ | Mean Mode Screaming: MeanโVarianceโฆ | DD-088 |
| ๐ฅ | SenseNova-U1: Unifying Multimodal Uโฆ | DD-089 |
| 4. | MemPrivacy: Privacy-Preserving Persโฆ | DD-090 |
| 5. | Achieving Gold-Medal-Level Olympiadโฆ | DD-091 |
๐ ์์ฑ์ผ: 2026-05-17 | ๐ค GLM-4.7 Deep Dive