โ† ๐Ÿ“š ์ด๋ฒˆ ์ฃผ Weekly Digest๋กœ ๋Œ์•„๊ฐ€๊ธฐ

DD-064 InCoder-32B-Thinking: Industrial Code World Model for Thinking

arXiv: 2604.03144 Upvotes: 225 | Comments: 3 ์ˆœ์œ„: ์ด๋ฒˆ ์ฃผ Top 4


1. ์™œ ์ด ๋…ผ๋ฌธ์ด ์ค‘์š”ํ•œ๊ฐ€?

๊ธฐ์กด์˜ ๊ฑฐ๋Œ€ ์–ธ์–ด ๋ชจ๋ธ๋“ค์€ ์ผ๋ฐ˜์ ์ธ ์›น ๊ฐœ๋ฐœ์ด๋‚˜ ํŒŒ์ด์ฌ ์Šคํฌ๋ฆฝํŠธ ์ž‘์„ฑ์—๋Š” ๋Šฅ์ˆ™ํ•˜์ง€๋งŒ, ์นฉ ์„ค๊ณ„๋‚˜ GPU ์ตœ์ ํ™” ๊ฐ™์€ ์‚ฐ์—…์šฉ ์ฝ”๋“œ ์ž‘์„ฑ์—์„œ๋Š” ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ ์กฐ๊ฑด๊ณผ ํƒ€์ด๋ฐ ์˜๋ฏธ๋ฅผ ์ดํ•ดํ•˜์ง€ ๋ชปํ•ด ์ž์ฃผ ์‹คํŒจํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ์‹ค์ œ ํ•˜๋“œ์›จ์–ด ์‹คํ–‰ ํ™˜๊ฒฝ์„ ๋ชจ๋ฐฉํ•˜๋Š” ์„ธ๊ณ„ ๋ชจ๋ธ(World Model)๊ณผ ์˜ค๋ฅ˜๋ฅผ ์Šค์Šค๋กœ ์ˆ˜์ •ํ•˜๋ฉฐ ์‚ฌ๊ณ ํ•˜๋Š” ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ฒฐํ•ฉํ•˜์—ฌ, ์ด๋Ÿฌํ•œ ์‚ฐ์—…์šฉ ์ฝ”๋“œ ์ƒ์„ฑ์˜ ๊ฒฉ์ฐจ๋ฅผ ํ•ด์†Œํ–ˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, ๋‹จ์ˆœํžˆ ์ฝ”๋“œ๋ฅผ ์ž‘์„ฑํ•˜๋Š” ๊ฒƒ์„ ๋„˜์–ด ์‹ค์ œ ์ „๋ฌธ๊ฐ€์ฒ˜๋Ÿผ ์‹คํ–‰ ๊ฒฐ๊ณผ๋ฅผ ์˜ˆ์ธกํ•˜๊ณ  ์˜ค๋ฅ˜๋ฅผ ์ˆ˜์ •ํ•˜๋Š” ์‚ฌ๊ณ  ๊ณผ์ •์„ ๋ชจ๋ธ๋งํ•จ์œผ๋กœ์จ ์‹ค๋ฌด ํ˜„์žฅ์˜ ์ˆ˜์š”๋ฅผ ์ถฉ์กฑ์‹œ์ผฐ๋‹ค๋Š” ์ ์—์„œ ํš๊ธฐ์ ์ž…๋‹ˆ๋‹ค.

2. ํ•ต์‹ฌ ์•„์ด๋””์–ด ์‰ฝ๊ฒŒ ์ดํ•ดํ•˜๊ธฐ

์ผ์ƒ์ƒํ™œ ๋น„์œ : โ€˜๊ฐ€์ƒ ๋น„ํ–‰ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ํ†ตํ•œ ์กฐ์ข…์‚ฌ ํ›ˆ๋ จโ€™

์ด ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ์„ ์ดํ•ดํ•˜๋ ค๋ฉด ๋น„ํ–‰์‚ฌ๋ฅผ ํ‚ค์šฐ๋Š” ๊ณผ์ •๊ณผ ๋น„์Šทํ•˜๋‹ค๊ณ  ๋ณด๋ฉด ๋ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ AI ๋ชจ๋ธ์€ ์ด๋ก ์ ์œผ๋กœ ์ฑ…๋งŒ ๋‹ฌ๋‹ฌ ์™ธ์šด ์กฐ์ข…์‚ฌ์™€ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๋น„ํ–‰๊ธฐ ๋งค๋‰ด์–ผ์€ ๋‹ค ์™ธ์šฐ์ง€๋งŒ, ์‹ค์ œ๋กœ ์กฐ์ข…์„์— ์•‰์•„ ๋น„ํ–‰๊ธฐ๊ฐ€ ๊ธฐ๊ณ„์ ์œผ๋กœ ์–ด๋–ป๊ฒŒ ๋ฐ˜์‘ํ• ์ง€, ํŠน์ • ๋‚ ์”จ๋‚˜ ๊ธฐ์ฒด ๊ฒฐํ•จ์ด ๋ฐœ์ƒํ–ˆ์„ ๋•Œ ์–ด๋–ป๊ฒŒ ๋Œ€์ฒ˜ํ•ด์•ผ ํ• ์ง€ ์ฒดํ—˜์ ์œผ๋กœ ์•Œ์ง€ ๋ชปํ•ฉ๋‹ˆ๋‹ค.

๋ฐ˜๋ฉด ์ด ๋…ผ๋ฌธ์—์„œ ์ œ์•ˆํ•˜๋Š” ๋ชจ๋ธ์€ ์ตœ์ฒจ๋‹จ ๊ฐ€์ƒ ๋น„ํ–‰ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ(World Model)์—์„œ ํ›ˆ๋ จ๋œ ์กฐ์ข…์‚ฌ์ž…๋‹ˆ๋‹ค. ์ด ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋Š” โ€œ์ด lever๋ฅผ ๋‹น๊ธฐ๋ฉด ์—”์ง„ ๊ณผ์—ด๋กœ ์ด์–ด์ง„๋‹คโ€๋Š” ๊ฒƒ์„ ์ •ํ™•ํžˆ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•ฉ๋‹ˆ๋‹ค. AI๋Š” ์ด ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ์•ˆ์—์„œ ์ˆ˜๋งŽ์€ ์‹ค์ˆ˜๋ฅผ ํ•˜๊ณ , ๊ทธ ๊ฒฐ๊ณผ(์˜ค๋ฅ˜ ํ”ผ๋“œ๋ฐฑ)๋ฅผ ํ†ตํ•ด โ€œ์•„, ๊ทธ๋•Œ๋Š” ์ €๋ ‡๊ฒŒ ์กฐ์ž‘ํ•ด์•ผ ํ–ˆ๊ตฌ๋‚˜โ€๋ผ๋Š” ์‚ฌ๊ณ  ๊ณผ์ •(Chain-of-Thought)์„ ์Šค์Šค๋กœ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค. ๊ฒฐ๊ตญ ์‹ค์ œ ๋น„ํ–‰(์‹ค์ œ ์ฝ”๋“œ ์ปดํŒŒ์ผ)์„ ํ•˜๊ธฐ ์ „์— ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ์—์„œ ์™„๋ฒฝํ•˜๊ฒŒ ๊ฒ€์ฆ๋œ ์ตœ๊ณ ์˜ ์กฐ์ข… ์‹ค๋ ฅ์„ ๊ฐ–์ถ”๊ฒŒ ๋˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

๋‹จ๊ณ„๋ณ„ ๋™์ž‘ ๋ฐฉ์‹

์ด ๋ชจ๋ธ์€ ํฌ๊ฒŒ ๋‘ ๊ฐ€์ง€ ํ•ต์‹ฌ ์š”์†Œ, ์ฆ‰ ECoT์™€ ICWM์„ ํ†ตํ•ด ์ž‘๋™ํ•ฉ๋‹ˆ๋‹ค.

์ฒซ์งธ, ์˜ค๋ฅ˜ ๊ธฐ๋ฐ˜ ์‚ฌ๊ณ  ์‚ฌ์Šฌ(ECoT, Error-driven Chain-of-Thought)์ž…๋‹ˆ๋‹ค. AI๊ฐ€ ์ฝ”๋“œ๋ฅผ ์ž‘์„ฑํ•  ๋•Œ ๋‹จ๋ฒˆ์— ์ •๋‹ต์„ ๋งžํžˆ๋ ค ํ•˜์ง€ ์•Š๊ณ , ๋งˆ์น˜ ์‹ค์ œ ์—”์ง€๋‹ˆ์–ด์ฒ˜๋Ÿผ ์˜ค๋ฅ˜๋ฅผ ๋ฒ”ํ•˜๊ณ  ์ˆ˜์ •ํ•˜๋Š” ๊ณผ์ •์„ ํ•™์Šต ๋ฐ์ดํ„ฐ๋กœ ์‚ผ์Šต๋‹ˆ๋‹ค. ์ปดํŒŒ์ผ๋Ÿฌ๊ฐ€ โ€œ๋ฌธ๋ฒ• ์˜ค๋ฅ˜โ€๋ผ๊ณ  ์™ธ์น˜๋ฉด, AI๋Š” โ€œ์•„, ์„ธ๋ฏธ์ฝœ๋ก ์„ ๋นผ๋จน์—ˆ๊ตฌ๋‚˜โ€๋ผ๊ณ  ์ƒ๊ฐํ•˜๊ณ  ์ˆ˜์ •ํ•˜๋ฉฐ, ์ด๋Ÿฌํ•œ ๋Œ€ํ™”์™€ ์ˆ˜์ •์˜ ํ”์ ์„ ํ†ตํ•ด ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๊ธฐ๋ฆ…๋‹ˆ๋‹ค.

๋‘˜์งธ, ์‚ฐ์—…์šฉ ์ฝ”๋“œ ์„ธ๊ณ„ ๋ชจ๋ธ(ICWM, Industrial Code World Model)์ž…๋‹ˆ๋‹ค. ์ด๋Š” ์‹ค์ œ ํ•˜๋“œ์›จ์–ด(Verilog ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ, GPU ํ”„๋กœํŒŒ์ผ๋Ÿฌ ๋“ฑ)๋ฅผ ๋Œ๋ฆฌ๊ธฐ ์ „์— ์ฝ”๋“œ๊ฐ€ ์‹คํ–‰๋˜์—ˆ์„ ๋•Œ ์–ด๋–ค ๊ฒฐ๊ณผ๊ฐ€ ๋‚˜์˜ฌ์ง€ ๋ฏธ๋ฆฌ ์˜ˆ์ธกํ•˜๋Š” ์˜ˆ์ธก๊ธฐ ์—ญํ• ์„ ํ•ฉ๋‹ˆ๋‹ค. AI๋Š” ์ด ๋ชจ๋ธ์„ ํ†ตํ•ด โ€œ์ด ์ฝ”๋“œ๋ฅผ ์นฉ์— ์‹ฌ์œผ๋ฉด ํƒ€์ด๋ฐ ์˜ค๋ฅ˜๊ฐ€ ๋‚˜๊ฒ ๊ตฌ๋‚˜โ€๋ผ๊ณ  ๋ฏธ๋ฆฌ ์˜ˆ์ธกํ•˜๊ณ , ์‹ค์ œ ์ปดํŒŒ์ผ์„ ๋Œ๋ ค๋ณด๊ธฐ ์ „์— ์Šค์Šค๋กœ๋ฅผ ๊ฒ€์ฆํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ฐ ๊ฐœ๋…

๋…ผ๋ฌธ์€ ์‹ค์ œ ์‹คํ–‰ ๊ฒฐ๊ณผ์™€ ๋ชจ๋ธ์ด ์˜ˆ์ธกํ•œ ๊ฒฐ๊ณผ ์‚ฌ์ด์˜ ์ผ์น˜๋„๋ฅผ ์ธก์ •ํ•˜์—ฌ ํ•™์Šต์˜ ์‹ ๋ขฐ์„ฑ์„ ๋ณด์ฆํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ์ˆ˜์‹์œผ๋กœ ํ‘œํ˜„ํ•˜์ž๋ฉด ์ฝ”๋“œ $C$๊ฐ€ ์ฃผ์–ด์กŒ์„ ๋•Œ, ์‹ค์ œ ์‹คํ–‰ ๊ฒฐ๊ณผ $O_{real}$๊ณผ ๋ชจ๋ธ์˜ ์˜ˆ์ธก ๊ฒฐ๊ณผ $O_{pred}$ ๊ฐ„์˜ ํ™•๋ฅ  ๋ถ„ํฌ $P(O_{pred} | C)$๋ฅผ ์ตœ๋Œ€ํ™”ํ•˜๋Š” ๊ณผ์ •์œผ๋กœ ๋ณผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์—ฌ๋Ÿฌ ๋ฒˆ์˜ ์ˆ˜์ • ๊ณผ์ •(Trajectory)์ด ํฌํ•จ๋œ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ ์ตœ์ข… ๊ฒฐ๊ณผ๊ฐ€ ์„ฑ๊ณต(Pass)ํ• ์ง€ ์‹คํŒจ(Fail)ํ• ์ง€ ์˜ˆ์ธกํ•˜๋Š” ์ •ํ™•๋„๋ฅผ ๋†’์ด๋Š” ๊ฒƒ์ด ํ•ต์‹ฌ ๋ชฉํ‘œ์ž…๋‹ˆ๋‹ค.

3. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ถ„์„

๋ฒค์น˜๋งˆํฌ ์ข…๋ฅ˜

์ด ๋ชจ๋ธ์€ ์ผ๋ฐ˜์ ์ธ ์ฝ”๋”ฉ ๋Šฅ๋ ฅ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฒค์น˜๋งˆํฌ์™€ ์‚ฐ์—… ๋ถ„์•ผ ํŠนํ™” ๋ฒค์น˜๋งˆํฌ ๋‘ ๊ฐ€์ง€ ์˜์—ญ์—์„œ ํ‰๊ฐ€๋ฐ›์•˜์Šต๋‹ˆ๋‹ค. ์ผ๋ฐ˜ ์ฝ”๋”ฉ ๋ฒค์น˜๋งˆํฌ๋กœ๋Š” LiveCodeBench V5๊ฐ€ ์‚ฌ์šฉ๋˜์—ˆ์œผ๋ฉฐ, ์‚ฐ์—…์šฉ ๋ฒค์น˜๋งˆํฌ๋กœ๋Š” ์นฉ ์„ค๊ณ„(Chip Design), GPU ์ตœ์ ํ™”, ์ž„๋ฒ ๋””๋“œ ์‹œ์Šคํ…œ, 3D ๋ชจ๋ธ๋ง ๋“ฑ ์ด 9๊ฐœ์˜ ๋ถ„์•ผ๊ฐ€ ํ…Œ์ŠคํŠธ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

๊ตฌ์ฒด์  ์ˆ˜์น˜ ๋ฐ ๋น„๊ต

๊ฐ€์žฅ ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์„ฑ๊ณผ๋Š” ICWM์˜ ์˜ˆ์ธก ์ •ํ™•๋„์™€ ์‹ค์ œ ๋ฒค์น˜๋งˆํฌ ์ ์ˆ˜์ž…๋‹ˆ๋‹ค. ๋จผ์ €, ICWM์˜ ์ถฉ์‹ค๋„(Fidelity) ๋ถ„์„์—์„œ ๋ชจ๋ธ์€ 5๊ฐœ ์‚ฐ์—… ๋ถ„์•ผ์—์„œ ํ‰๊ท  96.7%์˜ ๊ฒฐ๊ณผ ์˜ˆ์ธก ์ •ํ™•๋„(Outcome Prediction Accuracy)๋ฅผ ๊ธฐ๋กํ–ˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ์นฉ ์„ค๊ณ„ ๋ถ„์•ผ์—์„œ๋Š” 97.4%๋ผ๋Š” ๋งค์šฐ ๋†’์€ ์ •ํ™•๋„๋ฅผ ๋ณด์ด๋ฉฐ, ์‹ค์ œ ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ๋Œ€์ฒดํ•  ์ˆ˜ ์žˆ์„ ์ˆ˜์ค€์˜ ์‹ ๋ขฐ๋„๋ฅผ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ ์—ฌ๋Ÿฌ ๋‹จ๊ณ„์˜ ์ˆ˜์ • ๊ณผ์ •์„ ํฌํ•จํ•œ ์ „์ฒด ๊ถค์ (Trajectory) ์ผ์น˜์œจ๋„ ํ‰๊ท  94.4%๋กœ ๋‚˜ํƒ€๋‚˜, ๋ณต์žกํ•œ ๋””๋ฒ„๊น… ๊ณผ์ •์—์„œ๋„ ๋ชจ๋ธ์ด ์•ˆ์ •์ ์œผ๋กœ ๋™์ž‘ํ•จ์„ ๋ณด์—ฌ์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.

์ผ๋ฐ˜ ์ฝ”๋”ฉ ๋ฒค์น˜๋งˆํฌ์ธ LiveCodeBench V5์—์„œ๋Š” 81.3%๋ผ๋Š” ๊ฒฝ์Ÿ๋ ฅ ์žˆ๋Š” ์ ์ˆ˜๋ฅผ ๊ธฐ๋กํ•˜์—ฌ ์ผ๋ฐ˜์ ์ธ ์ฝ”๋”ฉ ๋Šฅ๋ ฅ๋„ ์žƒ์ง€ ์•Š์•˜์Œ์„ ์ฆ๋ช…ํ–ˆ์Šต๋‹ˆ๋‹ค. ๋ฌด์—‡๋ณด๋‹ค ์นฉ ์„ค๊ณ„, GPU ์ตœ์ ํ™”, ์ž„๋ฒ ๋””๋“œ ์‹œ์Šคํ…œ, 3D ๋ชจ๋ธ๋ง ๋“ฑ ์‚ฐ์—…์šฉ ๋ฒค์น˜๋งˆํฌ์—์„œ ๊ธฐ์กด ์˜คํ”ˆ์†Œ์Šค ๋ชจ๋ธ ์ค‘ ์ตœ๊ณ  ์ˆ˜์ค€(SOTA)์˜ ์„ฑ๋Šฅ์„ ๋‹ฌ์„ฑํ•˜์—ฌ DeepSeek์ด๋‚˜ Qwen ๊ฐ™์€ ๊ฐ•๋ ฅํ•œ ๊ฒฝ์Ÿ ๋ชจ๋ธ๋“ค์„ ์ œ์น˜๊ณ  ์•ž์„ฐ์Šต๋‹ˆ๋‹ค.

์ฃผ๋ชฉํ•  ๋งŒํ•œ ์„ฑ๊ณผ

3D ๋ชจ๋ธ๋ง ๋ถ„์•ผ๋Š” ์ฝ”๋“œ ํ…์ŠคํŠธ๋งŒ์œผ๋กœ๋Š” ์˜ˆ์ธกํ•˜๊ธฐ ์–ด๋ ค์šด ๋ถ€๋™์†Œ์ˆ˜์  ํ—ˆ์šฉ ์˜ค์ฐจ(Floating-point tolerance)์™€ ๋ถˆ๋ฆฌ์–ธ ์—ฐ์‚ฐ์ด ๋ณต์žกํ•˜๊ฒŒ ์–ฝํ˜€ ์žˆ์–ด ๋‹ค๋ฅธ ๋ถ„์•ผ๋ณด๋‹ค ์˜ˆ์ธก์ด ์–ด๋ ค์› ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿผ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  93.1%๋ผ๋Š” ๋†’์€ ๊ถค์  ์ผ์น˜์œจ์„ ๋ณด์—ฌ์ฃผ๋ฉฐ, ๋ณต์žกํ•œ ์ˆ˜์น˜ ์—ฐ์‚ฐ์ด ํฌํ•จ๋œ ๋„๋ฉ”์ธ์—์„œ๋„ ๊ฐ•๋ ฅํ•œ ์ถ”๋ก  ๋Šฅ๋ ฅ์„ ๋ฐœํœ˜ํ–ˆ๋‹ค๋Š” ์ ์ด ์ธ์ƒ์ ์ž…๋‹ˆ๋‹ค.

4. ํ•œ๊ณ„์ ๊ณผ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

์ €์ž๊ฐ€ ์–ธ๊ธ‰ํ•œ ํ•œ๊ณ„

๋…ผ๋ฌธ์˜ ๋ถ„์„ ํŒŒํŠธ์—์„œ ๋“œ๋Ÿฌ๋‚œ ํ•œ๊ณ„๋Š” ๋‹จ์ผ ๋‹จ๊ณ„ ์˜ˆ์ธก ์ •ํ™•๋„์™€ ์ „์ฒด ๊ถค์  ์ผ์น˜์œจ ์‚ฌ์ด์— ์•ฝ 1.6%~2.8%ํฌ์ธํŠธ์˜ ๊ฐ„๊ทน์ด ์กด์žฌํ•œ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ์ด๋Š” ๋‹จ ํ•œ ๋ฒˆ์˜ ์˜ˆ์ธก ์˜ค๋ฅ˜๊ฐ€ ์ˆ˜์ • ๊ณผ์ •์—์„œ ๋ˆ„์ ๋˜์–ด ์—‰๋šฑํ•œ ๊ฒฝ๋กœ๋กœ ์ด์–ด์งˆ ์ˆ˜ ์žˆ์Œ(Error Compounding)์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ 3D ๋ชจ๋ธ๋ง๊ณผ ๊ฐ™์ด ์ˆ˜์น˜์  ๋ฏผ๊ฐ๋„๊ฐ€ ๋†’์€ ๋ถ„์•ผ์—์„œ๋Š” ์ฝ”๋“œ ํ…์ŠคํŠธ๋งŒ์œผ๋กœ๋Š” ์‹คํ–‰ ๊ฒฐ๊ณผ๋ฅผ ์™„๋ฒฝํžˆ ์˜ˆ์ธกํ•˜๋Š” ๋ฐ ๊ทผ๋ณธ์ ์ธ ์–ด๋ ค์›€์ด ์žˆ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ฐœ์„  ๊ฐ€๋Šฅ์„ฑ ๋ฐ ํ–ฅํ›„ ์—ฐ๊ตฌ

์ €์ž๋“ค์€ ๊ฒฐ๋ก ์—์„œ ์‚ฌ๊ณ  ๋ฐ์ดํ„ฐ(Thinking Data)์˜ ๊ทœ๋ชจ๋ฅผ 1์–ต 8์ฒœ๋งŒ ํ† ํฐ์—์„œ 5์–ต 4์ฒœ๋งŒ ํ† ํฐ์œผ๋กœ ํ™•์žฅํ•˜๋Š” ์Šค์ผ€์ผ๋ง(Scale-up) ์—ฐ๊ตฌ๋ฅผ ์–ธ๊ธ‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, ๋” ๋งŽ์€ ์˜ค๋ฅ˜ ์ˆ˜์ • ๋ฐ์ดํ„ฐ์™€ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ ๊ฒฐ๊ณผ๋ฅผ ํ•™์Šต์‹œ์ผœ ์˜ˆ์ธก ์ •ํ™•๋„๋ฅผ 99% ์ˆ˜์ค€์œผ๋กœ ๋Œ์–ด์˜ฌ๋ฆฌ๊ณ , ๋”์šฑ ๋ณต์žกํ•œ ํ•˜๋“œ์›จ์–ด ์ œ์•ฝ ์กฐ๊ฑด์„ ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ๋„๋ก ๋ชจ๋ธ์„ ๊ณ ๋„ํ™”ํ•˜๋Š” ๊ฒƒ์ด ๋‹ค์Œ ๋ชฉํ‘œ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ, ํ˜„์žฌ ํŠน์ • ๋„๋ฉ”์ธ์— ํŠนํ™”๋œ ํˆด์ฒด์ธ(Toolchain)์— ์˜์กด์ ์ธ ๋ถ€๋ถ„์„ ๋” ์ผ๋ฐ˜ํ™”๋œ ๋ฐฉ์‹์œผ๋กœ ํ™•์žฅํ•˜๋Š” ์—ฐ๊ตฌ๋„ ํ•„์š”ํ•ด ๋ณด์ž…๋‹ˆ๋‹ค.

5. ์‹ค๋ฌด ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ

์ฆ‰์‹œ ์ ์šฉ ๊ฐ€๋Šฅํ•œ ๋ถ„์•ผ

์ด ๋ชจ๋ธ์€ ๋ฐ˜๋„์ฒด ์„ค๊ณ„ ์ž๋™ํ™”(EDA) ํˆด ๋‚ด์žฅํ˜• ์–ด์‹œ์Šคํ„ดํŠธ๋‚˜ GPU ์ปค๋„ ์ตœ์ ํ™” ๋„๊ตฌ๋กœ ์ฆ‰์‹œ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์—”์ง€๋‹ˆ์–ด๊ฐ€ Verilog ์ฝ”๋“œ๋ฅผ ์ž‘์„ฑํ•  ๋•Œ ์‹ค์ œ ํ•ฉ์„ฑ(Synthesis) ๋Œ๋ ค๋ณด๊ธฐ ์ „์— ํƒ€์ด๋ฐ ์œ„๋ฐฐ ์—ฌ๋ถ€๋ฅผ ๋ฏธ๋ฆฌ ์˜ˆ์ธกํ•ด ์ฃผ๋Š” ์ฝ”ํŒŒ์ผ๋Ÿฟ(Copilot) ์—ญํ• ์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ์ž„๋ฒ ๋””๋“œ ์‹œ์Šคํ…œ ๊ฐœ๋ฐœ ์‹œ ๋ฉ”๋ชจ๋ฆฌ ์ž์›์ด๋‚˜ ์ „๋ ฅ ์†Œ๋ชจ๋ฅผ ๊ณ ๋ คํ•œ ์ตœ์ ์˜ ํŽŒ์›จ์–ด๋ฅผ ์ œ์•ˆํ•˜๋Š” ์ฝ”๋“œ ์ƒ์„ฑ๊ธฐ๋กœ๋„ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ•„์š”ํ•œ ๋ฆฌ์†Œ์Šค

๋ชจ๋ธ ์ด๋ฆ„์— 32B๊ฐ€ ํฌํ•จ๋œ ๊ฒƒ์ฒ˜๋Ÿผ 320์–ต ๊ฐœ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ๊ฑฐ๋Œ€ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ์ถ”๋ก (Inference)์„ ์œ„ํ•ด์„œ๋Š” ์ตœ์†Œ A100 80GB์™€ ๊ฐ™์€ ๊ณ ์‚ฌ์–‘ GPU๊ฐ€ ์—ฌ๋Ÿฌ ๋Œ€ ํ•„์š”ํ•˜๋ฉฐ, ์™„์ „ํ•œ ๋ฏธ์„ธ ์กฐ์ •(Fine-tuning)์ด๋‚˜ ์žฌํ•™์Šต์„ ์œ„ํ•ด์„œ๋Š” ๋Œ€๊ทœ๋ชจ ์ปดํ“จํŒ… ํด๋Ÿฌ์Šคํ„ฐ๊ฐ€ ํ•„์ˆ˜์ ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ, ํŠน์ • ์‚ฐ์—… ๋ถ„์•ผ์— ์ ์šฉํ•˜๋ ค๋ฉด ํ•ด๋‹น ๋„๋ฉ”์ธ์˜ ์‹คํ–‰ ์ถ”์  ๋ฐ์ดํ„ฐ(Execution Trace)๋ฅผ ํ™•๋ณดํ•˜์—ฌ ICWM์„ ์ถ”๊ฐ€๋กœ ํ•™์Šต์‹œํ‚ค๋Š” ๋ฐ์ดํ„ฐ ํŒŒ์ดํ”„๋ผ์ธ ๊ตฌ์ถ•์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

6. ์ด ๋…ผ๋ฌธ์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•œ ์‚ฌ์ „ ์ง€์‹

  1. ๊ฑฐ๋Œ€ ์–ธ์–ด ๋ชจ๋ธ(LLM, Large Language Model): ๋ฐฉ๋Œ€ํ•œ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šตํ•˜์—ฌ ์ž์—ฐ์–ด ์ดํ•ด์™€ ์ƒ์„ฑ์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์ธ๊ณต์ง€๋Šฅ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.
  2. ์‚ฌ๊ณ ์˜ ์‚ฌ์Šฌ(CoT, Chain-of-Thought): ๋ชจ๋ธ์ด ๋ณต์žกํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•  ๋•Œ ๋‹ต์„ ๋ฐ”๋กœ ๋‚ด๋†“๊ธฐ๋ณด๋‹ค ์ค‘๊ฐ„ ๋‹จ๊ณ„์˜ ์ถ”๋ก  ๊ณผ์ •์„ ๋‹จ๊ณ„์ ์œผ๋กœ ๊ธฐ์ˆ ํ•˜๋„๋ก ์œ ๋„ํ•˜๋Š” ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค.
  3. ์„ธ๊ณ„ ๋ชจ๋ธ(World Model): ํ™˜๊ฒฝ์˜ ์ƒํƒœ ์ „์ด๋ฅผ ์˜ˆ์ธกํ•˜๋Š” ๋ชจ๋ธ๋กœ, ํ˜„์žฌ ์ƒํƒœ์™€ ํ–‰๋™์„ ์ž…๋ ฅ๋ฐ›์•„ ๋ฏธ๋ž˜์˜ ๊ฒฐ๊ณผ๋‚˜ ์ƒํƒœ๋ฅผ ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๋Š” ๋‚ด๋ถ€ ํ‘œํ˜„ ์ฒด๊ณ„์ž…๋‹ˆ๋‹ค.
  4. Verilog: ํ•˜๋“œ์›จ์–ด ๊ธฐ์ˆ  ์–ธ์–ด(HDL)์˜ ์ผ์ข…์œผ๋กœ, ๋””์ง€ํ„ธ ํšŒ๋กœ๋ฅผ ์„ค๊ณ„ํ•˜๊ณ  ์‹œ๋ฎฌ๋ ˆ์ด์…˜ํ•˜๊ธฐ ์œ„ํ•ด ์‚ฌ์šฉ๋˜๋Š” ์‚ฐ์—… ํ‘œ์ค€ ์–ธ์–ด์ž…๋‹ˆ๋‹ค.
  5. ํˆด์ฒด์ธ(Toolchain): ์†Œ์Šค ์ฝ”๋“œ๋ฅผ ์‹คํ–‰ ๊ฐ€๋Šฅํ•œ ํ”„๋กœ๊ทธ๋žจ์ด๋‚˜ ํ•˜๋“œ์›จ์–ด ์„ค๊ณ„ ๊ฒฐ๊ณผ๋ฌผ๋กœ ๋ณ€ํ™˜ํ•˜๊ธฐ ์œ„ํ•œ ์ผ๋ จ์˜ ์†Œํ”„ํŠธ์›จ์–ด ๋„๊ตฌ ์ง‘ํ•ฉ(์ปดํŒŒ์ผ๋Ÿฌ, ๋ง์ปค, ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ ๋“ฑ)์ž…๋‹ˆ๋‹ค.
  6. ์ถ”๋ก (Reasoning): ๋‹จ์ˆœํžˆ ํŒจํ„ด์„ ๋งค์นญํ•˜๋Š” ๊ฒƒ์„ ๋„˜์–ด, ์ฃผ์–ด์ง„ ์ •๋ณด๋ฅผ ๋ฐ”ํƒ•์œผ๋กœ ๋…ผ๋ฆฌ์ ์ธ ๊ฒฐ๋ก ์„ ๋„์ถœํ•˜๊ฑฐ๋‚˜ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๊ณ ์ฐจ์›์ ์ธ ์‚ฌ๊ณ  ๊ณผ์ •์ž…๋‹ˆ๋‹ค.
  7. ์˜ค๋ฅ˜ ์ˆ˜์ •(Error Correction): ์ฝ”๋“œ๋‚˜ ์‹œ์Šคํ…œ์—์„œ ๋ฐœ์ƒํ•œ ๋ฒ„๊ทธ๋ฅผ ์‹๋ณ„ํ•˜๊ณ , ๊ทธ ์›์ธ์„ ๋ถ„์„ํ•˜์—ฌ ์˜ฌ๋ฐ”๋ฅด๊ฒŒ ๊ณ ์น˜๋Š” ์ผ๋ จ์˜ ๊ณผ์ •์ž…๋‹ˆ๋‹ค.

๐Ÿ“š ์ด๋ฒˆ ์ฃผ ๊ด€๋ จ Deep Dive

์ˆœ์œ„๋…ผ๋ฌธDeep Dive
๐Ÿฅ‡Adamโ€™s Law: Textual Frequency Law oโ€ฆDD-062
๐ŸฅˆGrandCode: Achieving Grandmaster Leโ€ฆDD-061
๐Ÿฅ‰Rethinking Generalization in Reasonโ€ฆDD-066
4.InCoder-32B-Thinking: Industrial Coโ€ฆ๐Ÿ“ ํ˜„์žฌ ๋ฌธ์„œ
5.Video-MME-v2: Towards the Next Stagโ€ฆDD-063

๐Ÿ“… ์ƒ์„ฑ์ผ: 2026-04-12 | ๐Ÿค– GLM-4.7 Deep Dive