โ ๐ ์ด๋ฒ ์ฃผ Weekly Digest๋ก ๋์๊ฐ๊ธฐ
DD-104 Domino: Decoupling Causal Modeling from Autoregressive Drafting in Speculative Decoding
arXiv: 2605.29707 ๊ธฐ๊ด: Shanghai Jiao Tong University Upvotes: 140 | Comments: 3 ์์: ์ด๋ฒ ์ฃผ Top 3
๋ ผ๋ฌธ ๋ถ์: Domino: Decoupling Causal Modeling from Autoregressive Drafting in Speculative Decoding
1. ์ ์ด ๋ ผ๋ฌธ์ด ์ค์ํ๊ฐ?
๊ธฐ์กด์ ์ถ๋ก ๊ธฐ๋ฒ์ ํ ํฐ์ ๋น ๋ฅด๊ฒ ์์ธกํ๋ ค๋ฉด ์ ํ๋๊ฐ ๋จ์ด์ง๊ณ , ์ ํ๋๋ฅผ ๋์ด๋ ค๋ฉด ์์ฐจ์ ์ธ ์ฒ๋ฆฌ ๋๋ฌธ์ ์๋๊ฐ ๋๋ ค์ง๋ ๋๋ ๋ง๊ฐ ์์์ต๋๋ค. ์ด ๋ ผ๋ฌธ์ ๋ณ๋ ฌ ์ฒ๋ฆฌ์ ๋น ๋ฅธ ์๋์ ์ธ๊ณผ์ ๋ชจ๋ธ๋ง์ ์ ํํจ์ ๊ฒฐํฉํ์ฌ, ๋ณ๋์ ์ถ๊ฐ ๋น์ฉ ์์ด๋ ๋ ๊ธด ํ ํฐ์ ๋น ๋ฅด๊ฒ ์์ฑํ๋ ์๋ก์ด ํ๋ ์์ํฌ์ธ Domino๋ฅผ ์ ์ํฉ๋๋ค. ์ด๋ฅผ ํตํด ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ์ ์ถ๋ก ์๋๋ฅผ ํ๊ธฐ์ ์ผ๋ก ๋์ด๋ฉด์๋ ์์ฑ ํ์ง์ ์ ์งํ๋ ๊ธธ์ ์ด์๋ค๋ ์ ์์ ํฐ ์์๊ฐ ์์ต๋๋ค.
2. ํต์ฌ ์์ด๋์ด ์ฝ๊ฒ ์ดํดํ๊ธฐ
์ผ์์ํ ๋น์ : ์์ค ์งํ์ ๋ ๋จ๊ณ
์ด ๋ ผ๋ฌธ์ ํต์ฌ์ โ์์ค์ ์ฐ๋ ๊ณผ์ โ์ ๋น์ ํด ๋ณด๊ฒ ์ต๋๋ค. ์ผ๋ฐ์ ์ธ ์ธ์ด ๋ชจ๋ธ์ ์๊ฐ๊ฐ ํ ๋ฌธ์ฅ์ ์ฐ๊ณ , ๊ทธ ๋ค์ ๋ฌธ์ฅ์ ์ฐ๋ ์์ผ๋ก ์์ ๋ด์ฉ์ ๋ณด๋ฉด์ ํ๋ํ๋ ์งํํฉ๋๋ค. ์ด ๋ฐฉ์์ ์ ํํ์ง๋ง ์๊ฐ์ด ์์ฃผ ์ค๋ ๊ฑธ๋ฆฝ๋๋ค. ๋ฐ๋ฉด, ๊ธฐ์กด์ ๋ณ๋ ฌ ์ฒ๋ฆฌ ๋ฐฉ์์ ์ด์ ์์ฑ์์๊ฒ โ์ฌ๊ธฐ 10๋ฌธ์ฅ์ ํ ๋ฒ์ ์จ๋ดโ๋ผ๊ณ ์ํค๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. ์๋๋ ๋น ๋ฅด์ง๋ง, ์๋ค ๋ฌธ๋งฅ์ด ์ ๋ง์ ์๋ฑํ ์ด์ผ๊ธฐ๊ฐ ๋ ํ๋ฅ ์ด ๋์ต๋๋ค.
Domino๋ ์ด ๋์ ๊ฒฐํฉํ โ์ง๋ฅํ ํธ์ง ํโ๊ณผ ๊ฐ์ต๋๋ค. ๋จผ์ ์ด์ ์์ฑ์๊ฐ ์ ์ฒด์ ์ธ ์ค๊ฑฐ๋ฆฌ๋ฅผ ํ๊ฐ๊ฒจ ์๋๋ค. ์ดํ, ๊ต์ ๋ด๋น์๊ฐ ๊ทธ ์ด์์ ํ ์ค์ฉ ์ฝ์ด ๋ด๋ ค๊ฐ๋ฉฐ, ๋ฐ๋ก ์์ ๋ฌธ์ฅ๊ณผ ์ด์ด์ง๋๋ก ๋ด์ฉ์ ์์ฃผ ์ด์ง ์์ ํฉ๋๋ค. ์ด๋ ๊ฒ ํ๋ฉด ์ด์ ์์ฑ์์ ๋น ๋ฅธ ์๋์ ๊ต์ ๋ด๋น์์ ๋ฌธ๋งฅ ํ์ ๋ฅ๋ ฅ์ ๋์์ ํ์ฉํ์ฌ, ๋น ๋ฅด๊ณ ์ ํํ ์์ค์ ์์ฑํ ์ ์์ต๋๋ค.
๋จ๊ณ๋ณ ๋์ ์๋ฆฌ
Domino๋ ํฌ๊ฒ ๋ ๊ฐ์ง ๋ถ๋ถ์ผ๋ก ๋๋ฉ๋๋ค.
์ฒซ ๋ฒ์งธ๋ ๋ณ๋ ฌ ๊ธฐ๊ณจ๊ฒฉ์ ๋๋ค. ์ด ๋ถ๋ถ์ ์ ๋ ฅ๋ ๋ฌธ๋งฅ์ ๋ฐํ์ผ๋ก ๋ฏธ๋์ ๋์ฌ ํ ํฐ๋ค์ ์์์ ์๊ด์์ด ํ๊บผ๋ฒ์ ์์ธกํฉ๋๋ค. ๋ง์น ์ฌ๋ฌ ์ฅ์ ๊ทธ๋ฆผ์ ๋์์ ๊ทธ๋ ค๋๋ ๊ฒ์ฒ๋ผ ๋งค์ฐ ๋น ๋ฅด๊ฒ ๋์ํฉ๋๋ค. ํ์ง๋ง ์ด ๊ณผ์ ์์๋ ํ ํฐ ๊ฐ์ ์๋ค ์ฐ๊ฒฐ ๊ณ ๋ฆฌ, ์ฆ ์ธ๊ณผ ๊ด๊ณ๊ฐ ๋ฌด์๋ ์ ์์ต๋๋ค.
๋ ๋ฒ์งธ๋ ๋๋ฏธ๋ ธ ํค๋์ ๋๋ค. ์ด ๊ฐ๋ฒผ์ด ๋ชจ๋์ ๋ณ๋ ฌ ๊ธฐ๊ณจ๊ฒฉ์ด ๋ง๋ ์ด์ ํ ํฐ๋ค์ ์์ฐจ์ ์ผ๋ก ์ดํด๋ด ๋๋ค. ๋ฐ๋ก ์ง์ ์ ์์ฑ๋ ํ ํฐ์ ์ฐธ๊ณ ํ์ฌ, ํ์ฌ ํ ํฐ์ ํ๋ฅ ๋ถํฌ๋ฅผ ๋ฏธ์ธํ๊ฒ ์กฐ์ ํฉ๋๋ค. ์ด๋ฅผ ํตํด ๋ณ๋ ฌ ์ฒ๋ฆฌ์ ์๋๋ ์ ์งํ๋ฉด์๋, ํ ํฐ ๊ฐ์ ์์ฐ์ค๋ฌ์ด ํ๋ฆ์ ๋ณต์ํฉ๋๋ค.
ํต์ฌ ์๊ณ ๋ฆฌ์ฆ ๋ฐ ์์
๋๋ฏธ๋ ธ์ ํต์ฌ์ โ๋ณด์ (Correction)โ์ ๋๋ค. ๋ณ๋ ฌ ๊ธฐ๊ณจ๊ฒฉ์ด ์์ธกํ ๊ธฐ๋ณธ ๋ก์ง ๊ฐ์, ๋๋ฏธ๋ ธ ํค๋๊ฐ ๊ณ์ฐํ ๋ณด์ ๊ฐ์ ๋ํ๋ ๋ฐฉ์์ผ๋ก ์ต์ข ์์ธก์ ๋ง๋ญ๋๋ค.
์์์ผ๋ก ํํํ๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค. ์ต์ข ํ ํฐ์ ์์ธก ๋ถํฌ๋ ๊ธฐ๋ณธ ๋ก์ง๊ณผ ๋ณด์ ๋ก์ง์ ํฉ์ผ๋ก ๊ฒฐ์ ๋ฉ๋๋ค.
$$ l_i^{\text{final}} = l_i^{\text{base}} + c_i $$
์ฌ๊ธฐ์ $l_i^{\text{base}}$๋ ๋ณ๋ ฌ ๊ธฐ๊ณจ๊ฒฉ์ด ๋น ๋ฅด๊ฒ ์์ธกํ ๊ฐ์ด๊ณ , $c_i$๋ ์ด์ ํ ํฐ๋ค์ ์ ๋ณด๋ฅผ ๋ด์ ๋๋ฏธ๋ ธ ํค๋๊ฐ ๊ณ์ฐํ ์๋ ๊ฐ์ ๋๋ค. ์ด ๋ ๊ฐ์ด ํฉ์ณ์ ธ ์ต์ข ์ ์ผ๋ก ๋ ์ ํํ ํ ํฐ์ด ์ํ๋ง๋ฉ๋๋ค.
3. ์คํ ๊ฒฐ๊ณผ ๋ถ์
๋ฒค์น๋งํฌ ๋ฐ ํ๊ฒฝ
์ฐ๊ตฌ์ง์ ์ํ์ ์ถ๋ก ๋ฅ๋ ฅ์ ํ๊ฐํ๋ GSM8K ๋ฐ์ดํฐ์ ์ ์ฃผ์ ๋ฒค์น๋งํฌ๋ก ์ฌ์ฉํ์ต๋๋ค. ํ๊ฒ ๋ชจ๋ธ๋ก๋ Qwen3-8B๋ฅผ ํ์ฉํ์์ผ๋ฉฐ, ์ถ๋ก ์ NVIDIA A100 GPU(์ปจํ ์คํธ ๊ธธ์ด 1024) ํ๊ฒฝ์์ ์ํ๋์์ต๋๋ค. ๋น๊ต ๋์์ผ๋ก๋ ๊ธฐ์กด์ ๋ณ๋ ฌ ๊ธฐ๋ฐ ๋ฐฉ์์ธ DFlash์ ์๊ธฐํ๊ท ๊ธฐ๋ฐ ๋ฐฉ์์ธ EAGLE-3๋ฅผ ์ ์ ํ์ต๋๋ค.
์ฑ๋ฅ ํฅ์ ์์น
์คํ ๊ฒฐ๊ณผ, ๋๋ฏธ๋ ธ๋ ๊ธฐ์กด ๋ฐฉ์ ๋๋น ์๋ฑํ ์ฑ๋ฅ์ ๋ณด์์ต๋๋ค. ํนํ ์๊ธฐํ๊ท ๋ฐฉ์์ธ EAGLE-3์ ๋นํด ์ถ๋ก ์ง์ฐ ์๊ฐ์ด ํจ์ฌ ์งง์ผ๋ฉด์๋, ๋ณ๋ ฌ ๋ฐฉ์์ธ DFlash๋ณด๋ค ํจ์ฌ ๊ธด ์์ฉ ๊ธธ์ด๋ฅผ ๊ธฐ๋กํ์ต๋๋ค. ์ฆ, ํ๊ฒ ๋ชจ๋ธ์ด ํ ๋ฒ์ ๊ฒ์ฆ ๊ณผ์ ์์ ๋ฐ์๋ค์ด๋ ํ ํฐ์ ์๊ฐ ๋์ด๋ฌ๋ค๋ ๋ป์ ๋๋ค. ์ข ํฉ์ ์ธ ์๋ ํฅ์ ํญ์ธ ์คํผ๋์ ์์น์์๋ ๋๋ฏธ๋ ธ๋ ๋ชจ๋ ๋น๊ต๊ตฐ์ ์๋ํ๋ฉฐ, Qwen3-8B ๋ชจ๋ธ ๊ธฐ์ค์ผ๋ก ๊ธฐ์กด ์๊ธฐํ๊ท ๋์ฝ๋ฉ ๋๋น ์๋์ ์ธ ์ฒ๋ฆฌ ์๋ ๊ฐ์ ํจ๊ณผ๋ฅผ ์ ์ฆํ์ต๋๋ค.
์ฃผ๋ชฉํ ๋งํ ์ฑ๊ณผ
๊ฐ์ฅ ์ธ์์ ์ธ ์ ์ ํ ํฐ ์๋ฝ๋ฅ ๊ณผ ์ถ๋ก ์๋ ์ฌ์ด์ ํธ๋ ์ด๋์คํ๋ฅผ ํด๊ฒฐํ๋ค๋ ๊ฒ์ ๋๋ค. ์ผ๋ฐ์ ์ผ๋ก ์๋ฝ๋ฅ ์ ๋์ด๋ ค๋ฉด ๋ชจ๋ธ ์ฐ์ฐ ๋น์ฉ์ด ๋์ด๋๋๋ฐ, ๋๋ฏธ๋ ธ๋ ๊ฐ๋ฒผ์ด ํค๋๋ฅผ ์ถ๊ฐํ๋ ๊ฒ๋ง์ผ๋ก ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ์ต๋๋ค. ๊ทธ๋ฆผ 1์ ์ง์ฐ ์๊ฐ ๋ถ์์ ๋ณด๋ฉด, ๋๋ฏธ๋ ธ์ ๋์ ์ผ๋ก ์ธํ ์ถ๊ฐ ์ฐ์ฐ ๋น์ฉ์ ๋ฏธ๋ฏธํ ๋ฐ๋ฉด, ๊ฒ์ฆ ๋จ๊ณ์์์ ํจ์จ์ฑ์ ํฌ๊ฒ ์ฆ๊ฐํ์ฌ ์ ์ฒด์ ์ธ ์ฒ๋ฆฌ๋์ด ๊ฐ์ ๋์์์ ์ ์ ์์ต๋๋ค.
4. ํ๊ณ์ ๊ณผ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
์ ์๊ฐ ์ธ๊ธํ ํ๊ณ
์ ์๋ค์ ๋๋ฏธ๋ ธ์ ํ์ต ๊ณผ์ ์ด ๋จ์ํ์ง ์๋ค๋ ์ ์ ์ธ์ ํ๊ณ ์์ต๋๋ค. ํนํ ๊ต์ฌ ๊ฐ์ ๊ธฐ๋ฐ์ ์ธ๊ณผ์ ์ธ์ฝ๋ฉ์ ์์ ์ํค๊ธฐ ์ํด ํน๋ณํ ์ปค๋ฆฌํ๋ผ์ ๋์ ํ๋๋ฐ, ์ด ํ์ต ๊ณผ์ ์ด ์ต์ ํ๋์ง ์์ผ๋ฉด ์ฑ๋ฅ์ด ๋ณด์ฅ๋์ง ์์ ์ ์์ต๋๋ค. ๋ํ, ํ์ฌ ๊ตฌํ์ ํน์ ์ํคํ ์ฒ(DFlash ๋ฑ)์ ์์กด์ ์ธ ๋ถ๋ถ์ด ์์ด, ๋ชจ๋ ๋ชจ๋ธ ๊ตฌ์กฐ์ ๋์ผํ๊ฒ ์ ์ฉํ๊ธฐ ์ํด์๋ ์ถ๊ฐ์ ์ธ ์กฐ์ ์ด ํ์ํ ์ ์์ต๋๋ค.
๊ฐ์ ๊ฐ๋ฅํ ์
ํฅํ ์ฐ๊ตฌ์์๋ ๋๋ฏธ๋ ธ ํค๋์ ๊ตฌ์กฐ๋ฅผ ๋์ฑ ๊ฒฝ๋ํํ๊ฑฐ๋, ๋ค์ํ ์ข ๋ฅ์ ํ๊ฒ ๋ชจ๋ธ ์ํคํ ์ฒ์ ์ผ๋ฐํ๋ ์ ์๋์ง ํ๊ตฌํ ํ์๊ฐ ์์ต๋๋ค. ๋ํ, ํ์ฌ๋ ํ ์คํธ ์์ฑ์ ์ด์ ์ ๋ง์ถ๊ณ ์์ง๋ง, ๋ฉํฐ๋ชจ๋ฌ(์ด๋ฏธ์ง-ํ ์คํธ) ์์ฑ๊ณผ ๊ฐ์ ๋ ๋ณต์กํ ๋๋ฉ์ธ์ผ๋ก ํ์ฅํ์ฌ ๊ทธ ํจ๊ณผ๋ฅผ ๊ฒ์ฆํ๋ ๊ฒ๋ ํฅ๋ฏธ๋ก์ด ๋ฐฉํฅ์ด ๋ ๊ฒ์ ๋๋ค.
5. ์ค๋ฌด ์ ์ฉ ๊ฐ๋ฅ์ฑ
๋ฐ๋ก ์ ์ฉ ๊ฐ๋ฅํ ๋ถ์ผ
์ด ๊ธฐ์ ์ LLM ์๋น์ค๋ฅผ ์ ๊ณตํ๋ ๋ชจ๋ ๋ถ์ผ์ ์ฆ์ ์ ์ฉํ ์ ์์ต๋๋ค. ํนํ ์ฑ๋ด, ์ฝ๋ฉ ๋์ฐ๋ฏธ, ๋ฌธ์ ์์ฑ ๋น์์ ๊ฐ์ด ์ค์๊ฐ์ผ๋ก ๋น ๋ฅธ ์๋ต ์๋๊ฐ ์ค์ํ ์๋น์ค์์ ์ฌ์ฉ์ ๊ฒฝํ์ ํฌ๊ฒ ํฅ์์ํฌ ์ ์์ต๋๋ค. ๊ธด ๋ฌธ๋งฅ์ ์ฒ๋ฆฌํด์ผ ํ๋ RAG(๊ฒ์ ์ฆ๊ฐ ์์ฑ) ์์คํ ์ด๋ ๊ธด ์ฝ๋๋ฅผ ์์ฑํ๋ ํ๋ก๊ทธ๋๋ฐ ๋ณด์กฐ ๋๊ตฌ์์๋ ๊ทธ ์ง๊ฐ๋ฅผ ๋ฐํํ ๊ฒ์ ๋๋ค.
ํ์ํ ๋ฆฌ์์ค
๋๋ฏธ๋ ธ๋ฅผ ์ ์ฉํ๊ธฐ ์ํด์๋ ํ๊ฒ ๋ชจ๋ธ ์ธ์ ๋ณ๋์ ์์ ๋๋ํํธ ๋ชจ๋ธ(Backbone)๊ณผ ๋๋ฏธ๋ ธ ํค๋๋ฅผ ํ์ต์์ผ์ผ ํฉ๋๋ค. ํ์ต์๋ ์๋นํ ์์ ํ ์คํธ ๋ฐ์ดํฐ์ ์ด ํ์ํ๋ฉฐ, GPU ๋ฆฌ์์ค๋ ๋ชจ๋ธ ํฌ๊ธฐ์ ๋ฐ๋ผ ๋ค๋ฅด์ง๋ง ์ผ๋ฐ์ ์ธ ํ์ธํ๋ ํ๊ฒฝ๊ณผ ์ ์ฌํ ์์ค์ ๋๋ค. ๋ค๋ง, ์ถ๋ก ์์๋ ์ถ๊ฐ์ ์ธ ๋ชจ๋ธ์ ๋ก๋ํด์ผ ํ๋ฏ๋ก ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ด ์ฝ๊ฐ ์ฆ๊ฐํ ์ ์์ง๋ง, ์ ์ฒด ์ถ๋ก ์๋๊ฐ ๋นจ๋ผ์ง๋ฏ๋ก ์ ์ฒด์ ์ธ ๋น์ฉ ํจ์จ์ ๋์์ง ๊ฒ์ ๋๋ค.
6. ์ด ๋ ผ๋ฌธ์ ์ดํดํ๊ธฐ ์ํ ์ฌ์ ์ง์
-
Speculative Decoding (์ถ์ ์ ๋์ฝ๋ฉ) ํฐ ๋ชจ๋ธ์ด ํ ํฐ์ ์์ฑํ๊ธฐ ์ ์ ์์ ๋ชจ๋ธ์ด ๋ฏธ๋ฆฌ ํ๋ณด ํ ํฐ๋ค์ ๋ง๋ค์ด ์ ์ํ๊ณ , ํฐ ๋ชจ๋ธ์ด ์ด๋ฅผ ํ ๋ฒ์ ๊ฒ์ฆํ์ฌ ์๋๋ฅผ ๋์ด๋ ๊ธฐ๋ฒ์ ๋๋ค.
-
Autoregressive Modeling (์๊ธฐํ๊ท ๋ชจ๋ธ๋ง) ์ด์ ์ ์์ฑ๋ ํ ํฐ์ ๋ฐํ์ผ๋ก ๋ค์ ํ ํฐ์ ์์ฐจ์ ์ผ๋ก ์์ธกํ๋ ๋ฐฉ์์ผ๋ก, GPT ๊ณ์ด ๋ชจ๋ธ์ด ์ฌ์ฉํ๋ ์ ํต์ ์ธ ์์ฑ ๋ฐฉ์์ ๋๋ค.
-
Causal Dependency (์ธ๊ณผ์ ์์กด์ฑ) ํ ํฐ์ ์์ฑ ์์๊ฐ ์ค์ํ์ฌ, ๋ค์ ๋์ค๋ ํ ํฐ์ ์์ ๋์จ ํ ํฐ์ ์ํฅ์ ๋ฐ์์ผ๋ง ํ๋ค๋ ์ฑ์ง์ ๋๋ค.
-
Parallel Drafting (๋ณ๋ ฌ ๋๋ํํ ) ์ฌ๋ฌ ํ ํฐ์ ๋์์ ์์ธกํ์ฌ ์์ฑ ์๋๋ฅผ ๋์ด๋ ๋ฐฉ์์ด์ง๋ง, ํ ํฐ ๊ฐ์ ์ธ๊ณผ์ ๊ด๊ณ๋ฅผ ํ์ ํ๊ธฐ ์ด๋ ต๋ค๋ ๋จ์ ์ด ์์ต๋๋ค.
-
Logits (๋ก์ง) ๋ชจ๋ธ์ด ์ถ๋ ฅํ๋ ์๋ณธ ์ ์ ๊ฐ์ผ๋ก, ์ด๋ฅผ ์ํํธ๋งฅ์ค ํจ์์ ํต๊ณผ์ํค๋ฉด ๊ฐ ํ ํฐ์ด ์ ํ๋ ํ๋ฅ ์ด ๋ฉ๋๋ค.
-
Teacher Forcing (๊ต์ฌ ๊ฐ์) ๋ชจ๋ธ์ด ํ์ตํ ๋, ์ด์ ๋จ๊ณ์์ ๋ชจ๋ธ์ด ์์ธกํ ๊ฐ์ ์ ๋ ฅ์ผ๋ก ์ฐ์ง ์๊ณ , ์ ๋ต์ธ ๊ฐ์ ๊ฐ์ ๋ก ์ ๋ ฅ์ผ๋ก ์ฌ์ฉํ์ฌ ํ์ต์ํค๋ ๊ธฐ๋ฒ์ ๋๋ค.
-
Latency (์ง์ฐ ์๊ฐ) ์ฌ์ฉ์๊ฐ ์์ฒญ์ ๋ณด๋ด๊ณ ๊ฒฐ๊ณผ๋ฅผ ๋ฐ๊ธฐ๊น์ง ๊ฑธ๋ฆฌ๋ ์๊ฐ์ผ๋ก, ์ถ๋ก ์๋๋ฅผ ๋ํ๋ด๋ ์ค์ํ ์งํ์ ๋๋ค.
๐ ์ด๋ฒ ์ฃผ ๊ด๋ จ Deep Dive
| ์์ | ๋ ผ๋ฌธ | Deep Dive |
|---|---|---|
| ๐ฅ | Crafter: A Multi-Agent Harness for โฆ | DD-102 |
| ๐ฅ | On the Scaling of PEFT: Towards Milโฆ | DD-103 |
| ๐ฅ | Domino: Decoupling Causal Modeling โฆ | ๐ ํ์ฌ ๋ฌธ์ |
| 4. | COLLEAGUE.SKILL: Automated AI Skillโฆ | DD-105 |
| 5. | GrepSeek: Training Search Agents foโฆ | DD-106 |
๐ ์์ฑ์ผ: 2026-06-07 | ๐ค GLM-4.7 Deep Dive