๐ Weekly AI Paper Digest
๊ธฐ๊ฐ: 2026-04-06 ~ 2026-04-11 ์ ์ : ์ด๋ฒ ์ฃผ ๊ฐ์ฅ ์ฃผ๋ชฉ๋ฐ์ ๋ ผ๋ฌธ Top 5
๐ ์ด๋ฒ ์ฃผ Top 5
| ์์ | ๋ ผ๋ฌธ | โฌ๏ธ | Deep Dive |
|---|---|---|---|
| ๐ฅ | GrandCode: Achieving Grandmaster Level iโฆ | 347 | DD-061 |
| ๐ฅ | Adamโs Law: Textual Frequency Law on Larโฆ | 309 | DD-062 |
| ๐ฅ | Video-MME-v2: Towards the Next Stage in โฆ | 224 | DD-063 |
| 4. | InCoder-32B-Thinking: Industrial Code Woโฆ | 224 | DD-064 |
| 5. | SkillClaw: Let Skills Evolve Collectivelโฆ | 215 | DD-065 |
๐ ์ด๋ฒ ์ฃผ ํธ๋ ๋
ํต์ฌ ํค์๋
- ์์ด์ ํธํ ์งํ์ ๊ฐํํ์ต: ๋จ์ํ ์ธ์ด ๋ชจ๋ธ์ ๋์ด, ์ค์ค๋ก ํ์ตํ๊ณ ๊ธฐ์ (Skill)์ ์งํ์ํค๋ ์์ด์ ํธ ์์คํ ์ ๋ถ์
- ๊ณ ๋๋ ์ฝ๋ ๋ฐ ์ฐ์ ์ ์ถ๋ก : ๊ฒฝ์ ํ๋ก๊ทธ๋๋ฐ ๊ทธ๋๋๋ง์คํฐ ์์ค ๋์ ๋ฐ ์นฉ ์ค๊ณ ๋ฑ ์ค์ ์ฐ์ ํ์ฅ์ ๋ณต์กํ ํ๋์จ์ด ์ ์ฝ ์กฐ๊ฑด์ ์ดํดํ๋ ์ถ๋ก ๋ฅ๋ ฅ
- ๋ฒค์น๋งํน์ ์ฌ์ ์์ ํฌํ ํ์ ํด๊ฒฐ: ๊ธฐ์กด ๋ฒค์น๋งํฌ์ ์ ์ ์ธํ๋ ์ด์ ์ ์ง์ ํ๊ณ , ๋ชจ๋ธ์ ์ค์ ๋ด๊ตฌ์ฑ๊ณผ ์ ๋ขฐ์ฑ์ ํ๊ฐํ๋ ๋ ์๊ฒฉํ ํ๊ฐ ๊ธฐ์ค ์ ์
- ํ ์คํธ ์ฃผํ์ ๋ฒ์น(TFL): ์ธ๊ฐ์ ์ธ์ง ๊ณผ์ ๊ณผ ์ ์ฌํ๊ฒ ํ ์คํธ ๋น๋๊ฐ LLM์ ์ฑ๋ฅ์ ๋ฏธ์น๋ ์ํฅ์ ์ฒด๊ณํํ ์ด๋ก ์ ๋ฐ๊ฒฌ
๊ณตํต ์ฃผ์
์ด๋ฒ ์ฃผ ๋ ผ๋ฌธ๋ค์ ๋จ์ํ ํ ์คํธ ์์ฑ์ ๋์ด, **โ๋ณต์กํ ๋ฌธ์ ํด๊ฒฐ์ ์ํ ๋์ ์์คํ โ**๊ณผ **โํ๊ฐ์ ์ ๊ตํโ**์ ์ง์คํ๊ณ ์์ต๋๋ค. ์ฝ๋ฉ๊ณผ ๋น๋์ค ์ดํด์ ๊ฐ์ ๊ณ ๋๋ ๊ณผ์ ์์ ์ ์ ๋ชจ๋ธ์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ์ํด ๊ฐํํ์ต(RL), ์์ด์ ํธ ์งํ, ์ ๋ฌธํ๋ ์ถ๋ก ์ฒด์ธ์ ๋์ ํ๊ณ ์์ผ๋ฉฐ, ๋์์ ๋ฒค์น๋งํฌ์ ์ ๋ขฐ์ฑ์ ํ๋ณดํ๊ณ ๋ชจ๋ธ์ ๊ธฐ๋ณธ์ ์ธ ์๋ ์๋ฆฌ(๋น๋ ๋ฒ์น)๋ฅผ ๊ท๋ช ํ๋ ค๋ ๋ ธ๋ ฅ์ด ๊ณตํต์ ์ผ๋ก ๋ํ๋ฉ๋๋ค.
์ฃผ๋ชฉํ ์
ํนํ GrandCode์ SkillClaw์์ ๋ณผ ์ ์๋ฏ์ด, AI๊ฐ ์ฌ์ฉ์์ ํผ๋๋ฐฑ์ด๋ ํ๊ฒฝ๊ณผ์ ์ํธ์์ฉ์ ํตํด ๋ฐฐ์ด ์ง์์ ์ถ์ ํ๊ณ ์ค์ค๋ก ์ฑ๋ฅ์ ํฅ์์ํค๋ โ์์จ ์งํ(Autonomous Evolution)โ ๊ฐ๋ ์ด ๊ตฌ์ฒดํ๋๊ณ ์์ต๋๋ค. ๋ํ Video-MME-v2์ Adamโs Law๋ ํ์ฌ์ AI ํ๊ฐ ๋ฐฉ์์ด ๊ฐ์ง ํ์์ ๊นจ๊ณ , ๋ชจ๋ธ์ด ์ค์ ์ธ๊ณ(Real-world)์์ ์ผ๋ง๋ ๊ฐ๊ฑดํ๊ณ ์ ๋ขฐํ ์ ์๋์ง๋ฅผ ์ธก์ ํ๋ ๋ฐฉํฅ์ผ๋ก ์ฐ๊ตฌ๊ฐ ์ด๋ํ๊ณ ์์์ ์์ฌํฉ๋๋ค.
์ค๋ฌด ์์ฌ์
๊ฐ๋ฐ์์ ์ฐ๊ตฌ์๋ ๋ชจ๋ธ์ ํฌ๊ธฐ๋ง ํค์ฐ๋ ๊ฒ์์ ๋ฒ์ด๋, ๋ชจ๋ธ์ด **์ค์ค๋ก ๊ฒฝํ์ ํตํด ํ์ตํ ์ ์๋ ์์ด์ ํธ ์ํคํ ์ฒ(์: RL, ECoT)**๋ฅผ ์ค๊ณํ๋ ๋ฐฉํฅ์ผ๋ก ๊ด์ฌ์ ๊ฐ์ ธ์ผ ํฉ๋๋ค. ์ฝ๋ฉ์ด๋ ๋ฉํฐ๋ชจ๋ฌ ํ์คํฌ๋ฅผ ์ํํ ๋๋ ๊ธฐ์กด ๋ฒค์น๋งํฌ ์ ์๋ณด๋ค ์ค์ ๋ณต์กํ ์ํฉ์์์ **์ถ๋ก ๊ณผ์ ๊ณผ ๋ด๊ตฌ์ฑ(Robustness)**์ ๊ฒ์ฆํ๋ ๊ฒ์ด ์ค์ํด์ก์ต๋๋ค. ์์ธ๋ฌ ํ ์คํธ ๋ฐ์ดํฐ์ ๋น๋ ํน์ฑ์ ์ดํดํ๋ ๊ฒ์ ๋ชจ๋ธ์ ํจ์จ์ ์ธ ํ์ต ๋ฐ ์ต์ ํ์ ์๋ก์ด ํต์ฐฐ์ ์ ๊ณตํ ์ ์์ต๋๋ค.
๐ ๋ ผ๋ฌธ๋ณ ์์ฝ
๐ฅ 1. GrandCode: Achieving Grandmaster Level in Competitive Programming via Agentic Reinforcement Learning
arXiv: 2604.02721 | โฌ๏ธ 347 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
agentic-rlcompetitive-programmingllmmulti-agent-systemreinforcement-learninggrandcodecode-generationgrpo
์ด ๋ ผ๋ฌธ์ด ์ค์ํ ์ด์ ๋ ๋จ์ผ ๋ชจ๋ธ์ ํ๊ณ๋ฅผ ๋์ด, ๋ค์ค ์์ด์ ํธ ๊ฐํ ํ์ต(Agentic Reinforcement Learning)์ ํตํด ์ค์๊ฐ ๊ฒฝ์ง ๋ํ ํ๊ฒฝ์์ ์ธ๊ฐ ์ต๊ณ ์์ค์ ๊ทธ๋๋๋ง์คํฐ(Grandmaster)๋ฅผ ์ฒ์์ผ๋ก ์ ์ํ AI ์์คํ ์ธ GrandCode๋ฅผ ์๊ฐํ๊ธฐ ๋๋ฌธ์ ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
๐ฅ 2. Adamโs Law: Textual Frequency Law on Large Language Models
arXiv: 2604.02176 | โฌ๏ธ 309 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
llmtextual-frequencyadam-lawpromptingfine-tuningnlpparaphrasing
์ด ๋ ผ๋ฌธ์ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ ์ฑ๋ฅ์ ๋์ด๊ธฐ ์ํด ๋ฐ์ดํฐ์ ์์ด๋ ์ง๋ฟ๋ง ์๋๋ผ ํ ์คํธ์ ๋น๋์(Textual Frequency)๊ฐ ์ค์ํ๋ฉฐ, ์ ๋ ฅ์ ๋ ํํ๊ฒ ์ฐ์ด๋ ํํ์ผ๋ก ๋ฐ๊พธ๋ ๊ฒ์ด ํจ๊ณผ์ ์ด๋ผ๋ ์๋ด์ ๋ฒ์น(Adamโs Law)์ ์ ์ํ์ต๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
๐ฅ 3. Video-MME-v2: Towards the Next Stage in Benchmarks for Comprehensive Video Understanding
arXiv: 2604.05015 | โฌ๏ธ 224 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
video-mme-v2benchmarkvideo-understandingmllmevaluationdata-contaminationtemporal-reasoning
๊ธฐ์กด ๋ฒค์น๋งํฌ์ ๋ฐ์ดํฐ ์ค์ผ๊ณผ ๋จ์์ฑ์ผ๋ก ์ธํ ์ ์ ๋ถํ๋ฆผ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด, ์ต์ ๋ฐ์ดํฐ์ ๋์ด๋ ๊ณ์ธต ๊ตฌ์กฐ๋ฅผ ๋์ ํ์ฌ ๋น๋์ค ๋ฉํฐ๋ชจ๋ฌ ๋ํ ์ธ์ด ๋ชจ๋ธ์ ์ง์ ํ ์ถ๋ก ๋ฅ๋ ฅ์ ํ๊ฐํ ์ ์๋ ์๋ก์ด ํ์ค์ธ Video-MME-v2๋ฅผ ์ ์ํ๊ธฐ ๋๋ฌธ์ ์ค์ํฉ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
4. 4. InCoder-32B-Thinking: Industrial Code World Model for Thinking
arXiv: 2604.03144 | โฌ๏ธ 224 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
industrial-codeworld-modelchain-of-thoughtreasoninggpu-optimizationverilogerror-correctionllm
์ด ๋ ผ๋ฌธ์ ์ผ๋ฐ์ ์ธ ์ฝ๋ฉ ๋ฅ๋ ฅ์ ๋์ด ํ๋์จ์ด ์ ์ฝ๊ณผ ์คํ ํ๊ฒฝ์ ์ดํดํด์ผ ํ๋ ์ฐ์ ์ฉ ์ฝ๋ ์์ฑ ์์ญ์์, ์ถ๋ก ๋ฅ๋ ฅ๊ณผ ์ฝ๋๊ฐ ์คํ๋๋ ํ๊ฒฝ์ ๋์ญํ์ ํ์ตํ ์๋ ๋ชจ๋ธ์ ๊ฒฐํฉํ์ฌ ๊ธฐ์กด ๋ชจ๋ธ๋ค์ ํ๊ณ๋ฅผ ๊ทน๋ณตํ๊ธฐ ๋๋ฌธ์ ๋งค์ฐ ์ค์ํฉ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
5. 5. SkillClaw: Let Skills Evolve Collectively with Agentic Evolver
arXiv: 2604.08377 | โฌ๏ธ 215 โ Deep Dive ๋ณด๊ธฐ ํ๊ทธ:
llm-agentskill-evolutionself-improving-systemopenclawtool-learningcollective-intelligenceautomated-debuggingprompt-engineering
ํ์ฌ์ ์ ์ ์ธ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ ์์ด์ ํธ(Large Language Model Agent) ์์คํ ์ด ๊ฐ์ง ํ๊ณ๋ฅผ ๊ทน๋ณตํ์ฌ, ์ฌ์ฉ์๋ค์ ์ํธ์์ฉ์ ํตํด ์คํฌ(Skill)์ด ์๋์ผ๋ก ๊ฐ์ ๋๊ณ ๊ณต์ ๋๋ ์๊ฐ ์งํํ ์์ด์ ํธ ํ๋ ์์ํฌ๋ฅผ ์ ์ํ๊ธฐ ๋๋ฌธ์ ์ค์ํฉ๋๋ค.
๐ ์์ธ ๋ถ์: โ Deep Dive ๋ณด๊ธฐ์์ ์ฌ์ธต ๋ถ์์ ํ์ธํ์ธ์.
๐ ์์ฑ์ผ: 2026-04-12 | ๐ค GLM-4.7 Weekly Digest