โ ๐ ์ด๋ฒ ์ฃผ Weekly Digest๋ก ๋์๊ฐ๊ธฐ
DD-052 Omni-WorldBench: Towards a Comprehensive Interaction-Centric Evaluation for World Models
arXiv: 2603.22212 ๊ธฐ๊ด: alibaba-inc Upvotes: 122 | Comments: 9 ์์: ์ด๋ฒ ์ฃผ Top 2
๋ ผ๋ฌธ ๋ฆฌ๋ทฐ: Omni-WorldBench
1. ์ ์ด ๋ ผ๋ฌธ์ด ์ค์ํ๊ฐ?
๊ธฐ์กด์ ์๋ ๋ชจ๋ธ ํ๊ฐ๋ ๋จ์ํ ์์์ด ์ผ๋ง๋ ์ ๋ช ํ์ง, ํน์ ํ ์คํธ ์ค๋ช ๊ณผ ์ ์ผ์นํ๋์ง์๋ง ์ง์คํ์ต๋๋ค. ๋ง์น ์๋ฆฌ์ฌ๋ฅผ ํ๊ฐํ ๋ ์์์ ๋ง์ ๋ณด์ง ์๊ณ ์ ์๋ง ์์์ง ํ์ธํ๋ ๊ฒ๊ณผ ๊ฐ์ต๋๋ค. ์ด ๋ ผ๋ฌธ์ ์๋ ๋ชจ๋ธ์ด ๋ฌผ๋ฆฌ ๋ฒ์น๊ณผ ์ธ๊ณผ ๊ด๊ณ๋ฅผ ์ผ๋ง๋ ์ ์ดํดํ๊ณ ์๋์ง, ์ฆ ์ฌ์ฉ์์ ํ๋์ ๋ํด ์ธ์์ด ์ผ๋ง๋ ํฉ๋ฆฌ์ ์ผ๋ก ๋ฐ์ํ๋์ง๋ฅผ ์ธก์ ํ๋ ์ต์ด์ ํฌ๊ด์ ์ธ ๋ฒค์น๋งํฌ๋ฅผ ์ ์ํฉ๋๋ค.
2. ํต์ฌ ์์ด๋์ด ์ฝ๊ฒ ์ดํดํ๊ธฐ
์๋์ฐจ ๋์์ธ vs ์ด์ ์ํ
์ด ๋ ผ๋ฌธ์ ํต์ฌ์ ์ดํดํ๋ ค๋ฉด ์๋์ฐจ ๊ฐ๋ฐ ๊ณผ์ ์ ๋ ์ฌ๋ฆฌ๋ฉด ๋ฉ๋๋ค. ์ง๊ธ๊น์ง์ ํ๊ฐ ๋ฐฉ์์ ์๋์ฐจ๊ฐ ์ผ๋ง๋ ๋ฉ์ง๊ฒ ์๊ฒผ๋์ง, ๋ฐํด๊ฐ ๋ฅ๊ทผ์ง(์์ ํ์ง, ์ ์ ์ผ์น)๋ง ๊ฒ์ฌํ์ต๋๋ค. ํ์ง๋ง ์ฐ๋ฆฌ๊ฐ ์ง์ง๋ก ์ํ๋ ๊ฒ์ ๋ด๊ฐ ํธ๋ค์ ๊บพ์ ๋ ์๋์ฐจ๊ฐ ์์ ํ๊ฒ ๋์๊ฐ๋๊ฐ(์ํธ์์ฉ ๋ฐ์)์ ๋๋ค. Omni-WorldBench๋ ์๋ ๋ชจ๋ธ์ด๋ผ๋ ์๋์ฐจ์ ๋ํด ์ด์ ์ํ์ ๋ณด์ฌ์ฃผ๋ ์์คํ ์ ๋๋ค. ๋ชจ๋ธ์๊ฒ โ๊ณต์ ๋์ ธ๋ผโ๋ผ๊ณ ๋ช ๋ นํ์ ๋, ๋จ์ํ ๊ณต์ด ๋๊ฐ๋ ์์์ ๊ทธ๋ ค๋ด๋ ๊ฒ์ ๋์ด์, ์ค๋ ฅ์ ์ํฅ์ ๋ฐ๊ณ ๋ฐ๋ฅ์ ๋ถ๋ชํ ํ์ด ์ค๋ฅด๋ ๋ฌผ๋ฆฌ์ ์ธ๊ณผ๊ด๊ณ๋ฅผ ์ผ๋ง๋ ์ ํํ๊ฒ ๋ฌ์ฌํ๋์ง๋ฅผ ํ ์คํธํฉ๋๋ค.
์ํธ์์ฉ์ 3๋จ๊ณ ๋์ด๋ (Omni-WorldSuite)
์ด ๋ฒค์น๋งํฌ๋ ์ํธ์์ฉ์ ๋์ด๋๋ฅผ 3๋จ๊ณ๋ก ๋๋์ด ๋ชจ๋ธ์ ๊ณ ์ฌํฉ๋๋ค. 1๋จ๊ณ๋ ํผ์์ ํ๋ ํ๋(์: ์ฌ๋์ด ํ์ ํ๋ ๋ค)์ ๋๋ค. ์ฃผ๋ณ์ ์ํฅ์ ์ฃผ์ง ์์ผ๋ ๋ชจ๋ธ์ด ๋ฐ๋ผํ๊ธฐ ์ฝ์ต๋๋ค. 2๋จ๊ณ๋ ๊ตญ์ง์ ์ธ ์ํธ์์ฉ(์: ๊ณต์ ๋ฒฝ์ ๋์ง๋ค)์ผ๋ก, ๋ ๋ฌผ์ฒด ๊ฐ์ ์ถฉ๋๊ณผ ๋ฐ์์ ์ดํดํด์ผ ํฉ๋๋ค. ๊ฐ์ฅ ์ด๋ ค์ด 3๋จ๊ณ๋ ์ ์ญ์ ์ธ ๋ณํ(์: ๋๋ฏธ๋ ธ๋ฅผ ์ฐ๋ฌ๋จ๋ฆฐ๋ค)์ ๋๋ค. ํ๋์ ํ๋์ด ์ฐ์ ๋ฐ์์ ์ผ์ผ์ผๆดไธช ํ๊ฒฝ์ ๋ฐ๊พธ๋ ๋ณต์กํ ์ํฉ์ ๋ชจ๋ธ์ด ์์ธกํ ์ ์๋์ง ํ์ธํฉ๋๋ค.
AI ์ฌํ์ผ๋ก ํ๊ฐํ๊ธฐ (Omni-Metric)
์ฌ๋์ด ์ผ์ผ์ด ์์์ ๋ณด๊ณ ํ๊ฐํ๋ฉด ๋๋ฌด ๋๋ฆฌ๊ณ ๋น์ฉ์ด ๋ง์ด ๋ญ๋๋ค. ๊ทธ๋์ ์ ์๋ค์ โAI ์ฌํโ์ ๋ง๋ค์์ต๋๋ค. ์ด ์์คํ ์ ์์ฑ๋ ์์์์ ๋ฌผ์ฒด์ ๊ถค์ ์ ์ถ์ ํ๊ณ (Object Trajectories), ๋ฌผ์ฒด์ ์์ง์ ์ ๋๋ฅผ ๋ถ์ํ๋ฉฐ(Optical Flow), ๊ฑฐ๋ ์ธ์ด ๋ชจ๋ธ์ ํ์ฉํด ์ํฉ์ ๋ ผ๋ฆฌ์ ํ๋น์ฑ์ ๊ฒ์ฆํฉ๋๋ค. ๋ง์น ์ฌํ์ด ๊ฒฝ๊ธฐ ์ฅ๋ฉด์ ์ฌ๋ก์ฐ ๋ชจ์ ์ผ๋ก ๋๋ ค๋ณด๋ฉฐ ํ์ธ์ ์ก์๋ด๋ ๊ฒ๊ณผ ๋น์ทํฉ๋๋ค. ์ด๋ฅผ ํตํด ๋จ์ํ ์์์ด ์์์ง๋ฅผ ๋ ๋, ๋ฌผ๋ฆฌ ๋ฒ์น์ ์งํค๋ฉด์ ํ๋์ ๊ฒฐ๊ณผ๊ฐ ์ฌ๋ฐ๋ฅด๊ฒ ์ด์ด์ก๋์ง๋ฅผ ์ ์๋ก ๋งค๊น๋๋ค.
ํต์ฌ ์๊ณ ๋ฆฌ์ฆ ์์ฝ
๋ ผ๋ฌธ์์ ์ ์ํ๋ ํ๊ฐ ์งํ์ธ โAgenticScoreโ๋ ํฌ๊ฒ ์ธ ๊ฐ์ง ์ถ์ผ๋ก ๊ตฌ์ฑ๋ฉ๋๋ค. ์ฒซ์งธ, โ์์ฑ๋ ์์์ ํ์ง(Generated Video Quality)โ๋ก ๊ธฐ์กด ๋ฐฉ์๋๋ก ํ์ง๊ณผ ๋์ ์ฌ์ค์ฑ์ ์ธก์ ํฉ๋๋ค. ๋์งธ, โ์นด๋ฉ๋ผ-๊ฐ์ฒด ์ ์ด ๊ฐ๋ฅ์ฑ(Camera-Object Controllability)โ์ ์นด๋ฉ๋ผ๊ฐ ํ๋ค๋ฆฌ๋๋ผ๋ ๋ฌผ์ฒด์ ์์น๊ฐ ์ผ๊ด๋๊ฒ ์ ์ง๋๋์ง ํ์ธํฉ๋๋ค. ์ ์งธ, ๊ฐ์ฅ ์ค์ํ โ์ํธ์์ฉ ํจ๊ณผ์ ์ถฉ์ค๋(Interaction Effect Fidelity)โ๋ ์์ ์ค๋ช ํ ๋ฌผ๋ฆฌ ๋ฒ์น ์ค์์ ์ธ๊ณผ์ ์ผ๊ด์ฑ์ ํ๊ฐํฉ๋๋ค.
3. ์คํ ๊ฒฐ๊ณผ ๋ถ์
์ด๋ค ๋ฒค์น๋งํฌ์์ ํ ์คํธํ๋?
์ ์๋ค์ Omni-WorldBench๋ฅผ ์ฌ์ฉํ์ฌ ํ์ฌ ๊ฐ์ฅ ์ฑ๋ฅ์ด ์ข๋ค๊ณ ์๋ ค์ง ์ฌ๋ฌ ๋น๋์ค ์์ฑ ๋ชจ๋ธ ๋ฐ ์๋ ๋ชจ๋ธ๋ค์ ํ ์คํธํ์ต๋๋ค. ํนํ ์์จ ์ฃผํ, ๋ก๋ด ๊ณตํ, ๊ฒ์ ์์ด์ ํธ ๋ฑ ์ค์ ํ๊ฒฝ์์ ์ฌ์ฉ๋ ์ ์๋ ์ต์ ๋ชจ๋ธ๋ค์ ๋์์ผ๋ก 1๋จ๊ณ(๋จ์ผ ๊ฐ์ฒด)๋ถํฐ 3๋จ๊ณ(์ ์ญ ํ๊ฒฝ ๋ณํ)๊น์ง์ ๋ค์ํ ํ๋กฌํํธ์ ๋ํ ๋ฐ์์ ์ธก์ ํ์ต๋๋ค.
๊ธฐ์กด ํ๊ฐ ๋ฐฉ์๊ณผ์ ์ฐจ์ด
ํฅ๋ฏธ๋ก์ด ์ ์ ๊ธฐ์กด ๋ฒค์น๋งํฌ์์๋ ์ ์๊ฐ ๋์๋ ๋ชจ๋ธ๋ค๋ Omni-WorldBench์์๋ ํํธ์๋ ์ ์๋ฅผ ๋ฐ์๋ค๋ ๊ฒ์ ๋๋ค. ์ฆ, ์์์ ์์ฃผ ๊ณ ํ์ง๋ก ์์ฑํ์ง๋ง ๋ฌผ๋ฆฌ์ ์ผ๋ก ๋ง๋ ์ ๋๋ ์์ง์์ ๋ณด์๋ค๋ ๋ป์ ๋๋ค. ์๋ฅผ ๋ค์ด, ์ปต์ ์์๋๋ฐ ๋ฌผ์ด ํ๋ฅด์ง ์๊ฑฐ๋, ๊ณต์ ๋์ก๋๋ฐ ์ค๋ ฅ์ ๋ฌด์ํ๊ณ ์ฐ์ฃผ๋ฅผ ๋ ์๊ฐ๋ ๊ฒฝ์ฐ๋ค์ด ๋ฐ๊ฒฌ๋์์ต๋๋ค. ์ด๋ ํ์ฌ ์๋ ๋ชจ๋ธ๋ค์ด โ์ฐฉ์โ๋ฅผ ์ผ์ผํฌ ์ ๋๋ก ํ๋ คํ ์์์ ๋ง๋ค์ง๋ง, ์ธ์์ ๊ท์น(๋ฌผ๋ฆฌ)์ ์ ๋๋ก ๋ฐฐ์ฐ์ง ๋ชปํ๋ค๋ ๊ฒ์ ์ฆ๋ช ํฉ๋๋ค.
์ฃผ๋ชฉํ ๋งํ ์ฑ๊ณผ
์ด ์ฐ๊ตฌ์ ๊ฐ์ฅ ํฐ ์ฑ๊ณผ๋ ๋ชจ๋ธ์ ์ฑ๋ฅ์ ๋์ธ ๊ฒ์ด ์๋๋ผ, ๋ชจ๋ธ์ ๋ถ์คํจ์ ์ ๋ฐํ๋ โ๊ฐ๋ ฅํ ์ํ์งโ๋ฅผ ๋ง๋ค์๋ค๋ ์ ์ ๋๋ค. ์ฐ๊ตฌ์ง์ โAgenticScoreโ๋ฅผ ํตํด ๊ธฐ์กด ๋ชจ๋ธ๋ค์ด ์ํธ์์ฉ ์์ค์ด ๋์์ง์๋ก ์ฑ๋ฅ์ด ๊ธ๊ฒฉํ ๋จ์ด์ง๋ค๋ ๊ฒ์ ์ ๋์ ์ผ๋ก ๋ณด์ฌ์ฃผ์์ต๋๋ค. ์ด๋ ํฅํ ์๋ ๋ชจ๋ธ ๊ฐ๋ฐ์๋ค์ด ๋จ์ํ ํ์ง์ ๋์ด๋ ๊ฒ์์ ๋ฒ์ด๋, ๋ฌผ๋ฆฌ ๊ธฐ๋ฐ ํ์ต(Physics-based Learning)์ผ๋ก ๋ฐฉํฅ์ ํธ๋ ๋ฐ ์ค์ํ ์ด์ ํ๊ฐ ๋ ๊ฒ์ ๋๋ค.
4. ํ๊ณ์ ๊ณผ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
์ ์๊ฐ ์ธ๊ธํ ํ๊ณ
ํ์ฌ์ Omni-WorldBench๋ ํ ์คํธ ํ๋กฌํํธ์ ์ด๊ธฐ ์ด๋ฏธ์ง๋ฅผ ์ฃผ๋ก ์ฌ์ฉํ์ง๋ง, ๋ณต์กํ ๋ฌผ๋ฆฌ ์ํธ์์ฉ(์: ์ ์ฒด ์ญํ, ๋ถ๋๋ฌ์ด ๋ณํ ๋ฑ)์ ์๋ฒฝํ๊ฒ ๋ค๋ฃจ๊ธฐ์๋ ์์ง ๋ฐ์ดํฐ์ ์ด ๋ถ์กฑํ ์ ์์ต๋๋ค. ๋ํ, ํ๊ฐ ๊ณผ์ ์์ ์ฌ์ฉํ๋ VLM(๋น์ -์ธ์ด ๋ชจ๋ธ) ์์ฒด๋ ํ๊ฐ(Hallucination) ํ์์ด ์์ ์ ์์ด, ๊ฐ๋์ ํ๋ฆฐ ํ๊ฐ๋ฅผ ๋ด๋ฆด ์ํ์ด ์กด์ฌํฉ๋๋ค.
๊ฐ์ ๊ฐ๋ฅํ ์
ํฅํ ์ฐ๊ตฌ์์๋ ๋ ๋ค์ํ ๋ฌผ๋ฆฌ ์์ง ๊ธฐ๋ฐ์ ์๋ฎฌ๋ ์ด์ ๋ฐ์ดํฐ๋ฅผ ํตํฉํ์ฌ ๋ฒค์น๋งํฌ๋ฅผ ํ์ฅํ ์ ์์ ๊ฒ์ ๋๋ค. ๋ํ, ํ๊ฐ ๋ฉํธ๋ฆญ ์์ฒด๋ฅผ ๋ ์ ๊ตํ๊ฒ ๋ณด์ ํ์ฌ VLM์ด ํ๊ฐํ ๋ ๋ฌผ๋ฆฌ ๋ฒ์น์ ๋ ์๊ฒฉํ๊ฒ ์ ์ฉํ๋๋ก ๊ฐ์ ํ ํ์๊ฐ ์์ต๋๋ค. ๊ถ๊ทน์ ์ผ๋ก๋ ํ ์คํธ๋ฟ๋ง ์๋๋ผ ์ค์ ์ผ์ ๋ฐ์ดํฐ๋ ์ ์ด ์ ํธ๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ๋ 4D ํ๊ฒฝ์์์ ํ๊ฐ๋ก ํ์ฅ๋ ๊ฒ์ ๋๋ค.
5. ์ค๋ฌด ์ ์ฉ ๊ฐ๋ฅ์ฑ
์ด๋์ ๋ฐ๋ก ์ ์ฉ ๊ฐ๋ฅ?
์ด ๋ฒค์น๋งํฌ๋ ์์จ ์ฃผํ ์๋์ฐจ ๊ฐ๋ฐ์ฌ์ ์ธ๊ณต์ง๋ฅ ๋ก๋ด์ ๋ง๋๋ ๊ธฐ์ ์ ์ฆ์ ํ์ฉ๋ ์ ์์ต๋๋ค. ์ค์ ๋๋ก๋ ๊ณต์ฅ์ ๋ก๋ด์ ํฌ์ ํ๊ธฐ ์ ์, ์๋ฎฌ๋ ์ด์ ํ๊ฒฝ์์ ํด๋น ์๋ ๋ชจ๋ธ์ด ์ํฉ์ ์ผ๋ง๋ ์ ์์ธกํ๋์ง ํ ์คํธํ๋ โ์๊ฒฉ ์ํโ์ผ๋ก ์ฌ์ฉํ ์ ์์ต๋๋ค. ๋ํ ๊ฒ์ ๊ฐ๋ฐ ์ชฝ์์๋ NPC(๋นํ๋ ์ด์ด ์บ๋ฆญํฐ)๊ฐ ๋ฌผ๋ฆฌ ๋ฒ์น์ ์ด๊ธฐ์ง ์๊ณ ์์ฐ์ค๋ฝ๊ฒ ํ๋ ์ด์ด์ ์ํธ์์ฉํ๋์ง ํ์ธํ๋ ๋๊ตฌ๋ก ์ฐ์ผ ์ ์์ต๋๋ค.
ํ์ํ ๋ฆฌ์์ค
์ด ๋ฒค์น๋งํฌ๋ฅผ ๊ตฌ๋ํ๋ ค๋ฉด ์๋นํ ์ฐ์ฐ ๋ฅ๋ ฅ์ด ํ์ํฉ๋๋ค. ์ฐ์ ๊ณ ํ์ง์ ์์์ ์์ฑํด์ผ ํ๋ฏ๋ก ๊ณ ์ฌ์ GPU(์: A100/H100 ํด๋ฌ์คํฐ)๊ฐ ํ์์ ์ ๋๋ค. ๋ํ ํ๊ฐ ๋จ๊ณ์์ SAM(Segment Anything Model), RAFT, GroundingDINO ๋ฑ ๋ค์ํ ๋น์ ๋ชจ๋ธ๊ณผ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๋์์ ์คํํด์ผ ํ๋ฏ๋ก ๋ฉ๋ชจ๋ฆฌ ์ฌ์ฉ๋์ด ๋ง์ต๋๋ค. ํ ์คํธํ ๋ฐ์ดํฐ์ ์์ฒด์ ํฌ๊ธฐ๋ ๋ฐฉ๋ํ๊ธฐ ๋๋ฌธ์ ์ถฉ๋ถํ ์คํ ๋ฆฌ์ง์ ํจ์จ์ ์ธ ๋ฐ์ดํฐ ํ์ดํ๋ผ์ธ ๊ตฌ์ถ์ด ์๊ตฌ๋ฉ๋๋ค.
6. ์ด ๋ ผ๋ฌธ์ ์ดํดํ๊ธฐ ์ํ ์ฌ์ ์ง์
-
์๋ ๋ชจ๋ธ(World Model) ํ๊ฒฝ์ ์ํ๋ฅผ ์์ธกํ๊ณ ๋ฏธ๋๋ฅผ ์๋ฎฌ๋ ์ด์ ํ ์ ์๋ AI ๋ชจ๋ธ๋ก, ์ฃผ๋ก ๊ฐํ ํ์ต์ด๋ ๊ณํ(Planning)์ ์ฌ์ฉ๋ฉ๋๋ค.
-
๋น๋์ค ์์ฑ ๋ชจ๋ธ(Video Generation Model) ํ ์คํธ๋ ์ด๋ฏธ์ง ์ ๋ ฅ์ ๋ฐํ์ผ๋ก ๋์์์ ํฉ์ฑํด๋ด๋ ๋ฅ๋ฌ๋ ๋ชจ๋ธ์ ๋๋ค(์: Sora, Gen-2).
-
๊ดํ ํ๋ฆ(Optical Flow) ๋น๋์ค ๋ด์์ ๊ฐ ํฝ์ ์ด ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ์ด๋ ๋ฐฉํฅ์ผ๋ก ์ผ๋ง๋ ์ด๋ํ๋์ง๋ฅผ ๋ํ๋ด๋ ์์ง์ ๋ฒกํฐ ํ๋์ ๋๋ค.
-
์ธ๋ถํ(Segmentation) ์ด๋ฏธ์ง๋ ๋น๋์ค์์ ์ฌ๋, ์๋์ฐจ, ๋ฐฐ๊ฒฝ ๋ฑ ๊ฐ ๊ฐ์ฒด๋ฅผ ํฝ์ ๋จ์๋ก ๋ถ๋ฆฌํด๋ด๋ ๊ธฐ์ ์ ๋๋ค.
-
FID ๋ฐ FVD(Frรฉchet Inception Distance / Video Distance) ์์ฑ๋ ์ด๋ฏธ์ง๋ ๋น๋์ค๊ฐ ์ค์ ๋ฐ์ดํฐ์ ์ผ๋ง๋ ์ ์ฌํ์ง๋ฅผ ์ธก์ ํ๋ ํ์ง ์งํ์ ๋๋ค.
-
์๊ฐ-์ธ์ด ๋ชจ๋ธ(VLM, Vision-Language Model) ์ด๋ฏธ์ง์ ํ ์คํธ๋ฅผ ๋์์ ์ดํดํ๊ณ ์ฒ๋ฆฌํ ์ ์๋ ๋ชจ๋ธ๋ก, ์ด๋ฏธ์ง๋ฅผ ๋ณด๊ณ ๋ด์ฉ์ ์ค๋ช ํ๊ฑฐ๋ ์ง๋ฌธ์ ๋ตํ ์ ์์ต๋๋ค.
-
์ธ๊ณผ์ ์ผ๊ด์ฑ(Causal Consistency) ๊ฒฐ๊ณผ๊ฐ ์์ธ์ ์ํด ๋ ผ๋ฆฌ์ ์ผ๋ก ์ค๋ช ๋ ์ ์๋์ง๋ฅผ ์๋ฏธํ๋ฉฐ, โํ๋ A๊ฐ ๋ฐ์ํ๋ฉด ๋ฐ๋์ ๊ฒฐ๊ณผ B๊ฐ ๋ฐ๋ฅธ๋คโ๋ ๊ด๊ณ๊ฐ ์ ์ง๋๋ ์ฑ์ง์ ๋๋ค.
๐ ์ด๋ฒ ์ฃผ ๊ด๋ จ Deep Dive
| ์์ | ๋ ผ๋ฌธ | Deep Dive |
|---|---|---|
| ๐ฅ | MinerU-Diffusion: Rethinking Documeโฆ | DD-051 |
| ๐ฅ | Omni-WorldBench: Towards a Compreheโฆ | ๐ ํ์ฌ ๋ฌธ์ |
| ๐ฅ | Speed by Simplicity: A Single-Streaโฆ | DD-053 |
| 4. | PixelSmile: Toward Fine-Grained Facโฆ | DD-054 |
| 5. | Astrolabe: Steering Forward-Processโฆ | DD-055 |
๐ ์์ฑ์ผ: 2026-03-29 | ๐ค GLM-4.7 Deep Dive