โ† ๐Ÿ“š ์ด๋ฒˆ ์ฃผ Weekly Digest๋กœ ๋Œ์•„๊ฐ€๊ธฐ

DD-101 AgentDoG 1.5: A Lightweight and Scalable Alignment Framework for AI Agent Safety and Security

arXiv: 2605.29801 ๊ธฐ๊ด€: shanghai ailab Upvotes: 120 | Comments: 3 ์ˆœ์œ„: ์ด๋ฒˆ ์ฃผ Top 5


๋…ผ๋ฌธ ๋ถ„์„: AgentDoG 1.5: A Lightweight and Scalable Alignment Framework for AI Agent Safety and Security

1. ์™œ ์ด ๋…ผ๋ฌธ์ด ์ค‘์š”ํ•œ๊ฐ€?

์ตœ๊ทผ ์˜คํ”ˆ์›”๋“œ ์—์ด์ „ํŠธ(OpenClaw ๋“ฑ)๋Š” ํ™˜๊ฒฝ์„ ๋„˜๋‚˜๋“ค๋ฉฐ ์ž‘์—…์„ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์–ด ๋งค์šฐ ๊ฐ•๋ ฅํ•˜์ง€๋งŒ, ๊ทธ๋งŒํผ ๊ณต๊ฒฉ ๋ฐ›์„ ๋ฉด์ ์ด ๋„“์–ด์ ธ ๋ณด์•ˆ ์œ„ํ—˜์ด ๊ธ‰์ฆํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ ์•ˆ์ „ ์ •๋ ฌ ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์ด๋Ÿฐ ์ƒˆ๋กœ์šด ์œ„ํ˜‘๊ณผ ๊ณ ๋„ํ™”๋œ ์ ๋Œ€์  ๊ณต๊ฒฉ์„ ๋ง‰๊ธฐ์—๋Š” ๋„ˆ๋ฌด ๋ฌด๊ฒ๊ณ  ๋น„ํšจ์œจ์ ์ž…๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ์†Œํ˜• ๋ชจ๋ธ(0.8B~8B)๋กœ๋„ ๊ฑฐ๋Œ€ ๋ชจ๋ธ(GPT-5.4 ๋“ฑ) ์ˆ˜์ค€์˜ ์•ˆ์ „์„ฑ์„ ํ™•๋ณดํ•˜๋ฉด์„œ, ์‹ค์ œ ๋ฐฐํฌ ๋น„์šฉ์„ ํš๊ธฐ์ ์œผ๋กœ ๋‚ฎ์ถœ ์ˆ˜ ์žˆ๋Š” ๊ฐ€๋ณ๊ณ  ํ™•์žฅ ๊ฐ€๋Šฅํ•œ ํ”„๋ ˆ์ž„์›Œํฌ๋ฅผ ์ œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค.

2. ํ•ต์‹ฌ ์•„์ด๋””์–ด ์‰ฝ๊ฒŒ ์ดํ•ดํ•˜๊ธฐ

์ผ์ƒ์ƒํ™œ ๋น„์œ 

AI ์—์ด์ „ํŠธ๊ฐ€ ๋งˆ์น˜ ๊ฑด์„ค ํ˜„์žฅ์—์„œ ์ž์œ ๋กญ๊ฒŒ ์ผํ•˜๋Š” ๋กœ๋ด‡ ์ธ๋ถ€๋ผ๊ณ  ์ƒ์ƒํ•ด ๋ณด์„ธ์š”. ์ด ๋กœ๋ด‡์ด ๋ฒฝ์„ ํ—ˆ๋ฌผ๋ผ๊ณ  ์‹œ์ผฐ๋Š”๋ฐ, ๊ฐ€์Šค๊ด€์„ ๊ฑด๋“œ๋ ค ํญ๋ฐœ์„ ์ผ์œผํ‚ฌ ์ˆ˜๋„ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ธฐ์กด ๋ฐฉ์‹์€ ๋กœ๋ด‡์ด โ€œ์ž‘์—…์„ ๋งˆ์นœ ํ›„โ€์—๋งŒ ๊ฒฐ๊ณผ๋ฅผ ํ™•์ธํ–ˆ์ง€๋งŒ, AgentDoG 1.5๋Š” ํ˜„์žฅ์— ์„œ ์žˆ๋Š” โ€˜์•ˆ์ „ ๊ฐ๋…๊ด€โ€™๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๊ฐ๋…๊ด€์€ ๋กœ๋ด‡์ด ์›€์ง์ด๋Š” ๋ชจ๋“  ๊ณผ์ •(๊ถค์ )์„ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์ง€์ผœ๋ณด๋ฉฐ, โ€œ์ž ๊น, ๊ทธ ํ•ด๋จธ๋ฅผ ๋“ค์–ด๊ฐ€๋Š” ๊ฑด ์œ„ํ—˜ํ•ด!โ€๋ผ๊ณ  ์ฆ‰๊ฐ ์ œ์ง€ํ•˜๊ณ  ๋ฌด์—‡์ด ์œ„ํ—˜ํ•œ์ง€(์œ„ํ—˜ ์š”์ธ, ์‹คํŒจ ๋ชจ๋“œ) ๋ถ„์„ํ•ด์„œ ์•Œ๋ ค์ค๋‹ˆ๋‹ค.

๋‹จ๊ณ„๋ณ„ ๋™์ž‘ ๋ฐฉ์‹

  1. ์•ˆ์ „ ๊ทœ์น™ ์ˆ˜๋ฆฝ (Taxonomy Update): ๊ฐ๋…๊ด€์ด ํŒ๋‹จํ•  ๊ธฐ์ค€์„ ๋งŒ๋“ญ๋‹ˆ๋‹ค. ๋‹จ์ˆœํžˆ โ€œ์œ„ํ—˜ํ•˜๋‹ค/์•ˆ์ „ํ•˜๋‹คโ€๊ฐ€ ์•„๋‹ˆ๋ผ, โ€œ๋„๊ตฌ ์„ค๊ณ„ ์˜ค๋ฅ˜โ€, โ€œ์‚ฌ์šฉ์ž ์•…์˜์  ์งˆ์˜โ€, โ€œ๋„๊ตฌ ์‹คํ–‰ ์‹ค์ˆ˜โ€ ๋“ฑ ๊ตฌ์ฒด์ ์ธ ์œ„ํ—˜ ์œ ํ˜•์„ ๋ถ„๋ฅ˜ํ•œ ๊ธฐ์ค€ํ‘œ(Taxonomy)๋ฅผ ๋งŒ๋“ญ๋‹ˆ๋‹ค.
  2. ๊ฐ๋…๊ด€ ๊ต์œก (Data Engine & Purification): ๊ฐ•๋ ฅํ•œ ๋ฐ์ดํ„ฐ ์—”์ง„์„ ์‚ฌ์šฉํ•ด ๊ฐ€์ƒ์˜ ์ƒํ™ฉ(๊ถค์ )์„ ๋งŒ๋“ค์–ด๋ƒ…๋‹ˆ๋‹ค. ์ด๋•Œ โ€˜์˜ํ–ฅ ํ•จ์ˆ˜(Influence Function) ์ •์ œโ€™ ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ•ด, ๊ฐ๋…๊ด€ ํŒ๋‹จ์„ ํ๋ฆฌ๊ฒŒ ํ•˜๋Š” ๋‚˜์œ ๋ฐ์ดํ„ฐ(์žก์Œ)๋ฅผ ์™ ๋นผ๋ƒ…๋‹ˆ๋‹ค. ๋•๋ถ„์— ์•„์ฃผ ์ ์€ ์–‘์˜ ๊ณ ํ’ˆ์งˆ ๋ฐ์ดํ„ฐ(์•ฝ 1,000๊ฐœ ์ƒ˜ํ”Œ)๋กœ๋„ ๋˜‘๋˜‘ํ•œ ๊ฐ๋…๊ด€์„ ์–‘์„ฑํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  3. ๊ฒฝ๋Ÿ‰ํ™”๋œ ๊ฒ€์‚ฌ ๋ฐ ํ•™์Šต: ํ›ˆ๋ จ๋œ AgentDoG 1.5๋Š” ์—์ด์ „ํŠธ์˜ ํ–‰๋™ ํ•˜๋‚˜ํ•˜๋‚˜๋ฅผ ๊ฒ€์‚ฌํ•ฉ๋‹ˆ๋‹ค. ์—์ด์ „ํŠธ๊ฐ€ ํ•™์Šตํ•  ๋•Œ๋„ ์ด ๊ฐ๋…๊ด€์ด โ€œ์ด๊ฑด ์ข‹์€ ํ–‰๋™์ด์•ผโ€ ํ˜น์€ โ€œ์ด๊ฑด ์œ„ํ—˜ํ•ดโ€๋ผ๊ณ  ํ‰๊ฐ€ํ•ด์ฃผ๋Š” ์ฑ„์ ๊ด€(Reward Model) ์—ญํ• ์„ ํ•˜์—ฌ, ์—์ด์ „ํŠธ๊ฐ€ ์•ˆ์ „ํ•˜๊ฒŒ ์ผํ•˜๋„๋ก ์ง€๋„ํ•ฉ๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ฐ ๊ธฐ์ˆ 

ํ•ต์‹ฌ์€ ๋‘ ๊ฐ€์ง€ ์ง„๋‹จ ๊ณผ์ •์ž…๋‹ˆ๋‹ค. ์ฒซ์งธ, ๊ถค์  ์ˆ˜์ค€ ์•ˆ์ „ ํ‰๊ฐ€(Trajectory-level safety evaluation) ํ•จ์ˆ˜ $f(\mathcal{T})$๋Š” ์—์ด์ „ํŠธ์˜ ์ „์ฒด ํ–‰๋™ ์ˆœ์„œ $\mathcal{T}={t_{1},\dots,t_{n}}$์„ ์ž…๋ ฅ๋ฐ›์•„ ์•ˆ์ „ ์—ฌ๋ถ€๋ฅผ ํŒ๋‹จํ•ฉ๋‹ˆ๋‹ค. ๋‘˜์งธ, ์„ธ๋ฐ€ํ•œ ์œ„ํ—˜ ์ง„๋‹จ(Fine-grained risk diagnosis) ํ•จ์ˆ˜ $g(\mathcal{T})$๋Š” ์œ„ํ—˜์ด ๋ฐœ์ƒํ•œ ๊ทผ๋ณธ ์›์ธ(์œ„ํ—˜ ์›์ฒœ, ์‹คํŒจ ๋ชจ๋“œ)์„ ๋ถ„๋ฅ˜ํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์—์„œ ์ง€๋„ ํ•™์Šต(SFT)๊ณผ ๊ฐ•ํ™” ํ•™์Šต(RL)์„ ๊ฒฐํ•ฉํ•˜์—ฌ ๋ชจ๋ธ์„ ์ตœ์ ํ™”ํ•ฉ๋‹ˆ๋‹ค.

3. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ถ„์„

๋ฒค์น˜๋งˆํฌ ๋ฐ ์„ฑ๋Šฅ

์—ฐ๊ตฌ์ง„์€ ๋‹ค์–‘ํ•œ ํ™˜๊ฒฝ์„ ์•„์šฐ๋ฅด๋Š” ATBench์™€ ๊ต์ฐจ ํ™˜๊ฒฝ ๋ฒค์น˜๋งˆํฌ(Cross-environment benchmarks)์—์„œ ๋ชจ๋ธ์„ ํ…Œ์ŠคํŠธํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ฐ€์žฅ ์ธ์ƒ์ ์ธ ์ ์€ ํšจ์œจ์„ฑ์ž…๋‹ˆ๋‹ค. ๊ณ ์ž‘ ์•ฝ 1,000๊ฐœ์˜ ํ•™์Šต ์ƒ˜ํ”Œ๋งŒ์œผ๋กœ๋„ AgentDoG 1.5 ๋ชจ๋ธ๋“ค์€ ์ตœ๊ณ  ์ˆ˜์ค€์˜ ํ์‡„ํ˜• ๋ชจ๋ธ์ธ GPT-5.4์™€ ๋น„์Šทํ•œ ์ˆ˜์ค€์˜ ์•ˆ์ „ ์ง„๋‹จ ์„ฑ๋Šฅ**์„ ๋‹ฌ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.

๊ตฌ์ฒด์  ์ˆ˜์น˜ ๋ฐ ์„ฑ๊ณผ

  • ๋ชจ๋ธ ํฌ๊ธฐ ๋Œ€๋น„ ์„ฑ๊ณผ: 0.8B, 2B, 4B, 8B ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ๊ฒฝ๋Ÿ‰ ๋ชจ๋ธ๋“ค์ด ๊ฑฐ๋Œ€ ๋ชจ๋ธ๋“ค์„ ๋›ฐ์–ด๋„˜๋Š” ํšจ์œจ์„ฑ์„ ๋ณด์˜€์Šต๋‹ˆ๋‹ค.
  • ์šด์˜ ๋น„์šฉ ์ ˆ๊ฐ: ๋„์ปค(Docker) ์ˆ˜์ค€์˜ ํ™˜๊ฒฝ์—์„œ ๋ฐฐํฌ ์˜ค๋ฒ„ํ—ค๋“œ๋ฅผ ๋‘ ์ž๋ฆฟ์ˆ˜(100๋ฐฐ ์ด์ƒ) ์ค„์˜€์Šต๋‹ˆ๋‹ค. ์ด๋Š” ์‹ค์ œ ์„œ๋ฒ„ ์šด์˜ ์‹œ ๋น„์šฉ๊ณผ ์†๋„ ๋ฉด์—์„œ ์—„์ฒญ๋‚œ ์ด์ ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.
  • ๋ฐ์ดํ„ฐ ์ •์ œ ํšจ๊ณผ: SFT(์ง€๋„ ํ•™์Šต) ๋‹จ๊ณ„์—์„œ AgentDoG 1.5๋ฅผ ํ™œ์šฉํ•ด ํ•„ํ„ฐ๋งํ•œ ๊ฒฐ๊ณผ, ์ด 28,705๊ฐœ์˜ ๊ณ ํ’ˆ์งˆ ์•ˆ์ „ ๊ถค์  ๋ฐ์ดํ„ฐ๋ฅผ ํ™•๋ณดํ–ˆ์œผ๋ฉฐ, ์ด๋ฅผ ํ†ตํ•ด ๋ชจ๋ธ์˜ ์•ˆ์ „์„ฑ๊ณผ ๊ฒฌ๊ณ ํ•จ(Robustness)์„ ๋†’์ด๋ฉด์„œ๋„ ๊ธฐ์กด ๊ธฐ๋Šฅ์„ ์œ ์ง€ํ–ˆ์Šต๋‹ˆ๋‹ค.

4. ํ•œ๊ณ„์ ๊ณผ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

์ €์ž๊ฐ€ ์–ธ๊ธ‰ํ•œ ํ•œ๊ณ„

๋…ผ๋ฌธ ์„œ๋ก ์— ์–ธ๊ธ‰๋œ ๋ฐ”์™€ ๊ฐ™์ด, ํ˜„์žฌ ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ํ•™์Šต ๊ธฐ๋ฐ˜์˜ ์ ‘๊ทผ ๋ฐฉ์‹๊ณผ ํ•จ๊ป˜ ์˜จ๋ผ์ธ ์‹ค์‹œ๊ฐ„ ๊ฐ๋… ์‹œ์Šคํ…œ์ด ํ•„์ˆ˜์ ์ด๋ผ๊ณ  ๊ฐ•์กฐํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, ํ˜„์žฌ์˜ AgentDoG 1.5๊ฐ€ ๋ชจ๋“  ์‹ค์‹œ๊ฐ„ ์œ„ํ˜‘์„ ์™„๋ฒฝํ•˜๊ฒŒ ์ฐจ๋‹จํ•˜๋Š” โ€˜์™„๊ฒฐ๋œโ€™ ์‹œ์Šคํ…œ์ด๋ผ๊ธฐ๋ณด๋‹ค๋Š”, ํ•™์Šต ๊ณผ์ •์„ ๊ฐœ์„ ํ•˜๊ณ  ๊ฒ€์ฆํ•˜๋Š” ํ•ต์‹ฌ ๊ตฌ์„ฑ์š”์†Œ๋กœ์„œ ๊ธฐ๋Šฅํ•œ๋‹ค๋Š” ์ ์— ๋ฐฉ์ ์ด ์ฐํ˜€ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ฐœ์„  ๊ฐ€๋Šฅํ•œ ์ 

ํ–ฅํ›„ ์—ฐ๊ตฌ์—์„œ๋Š” AgentDoG 1.5์˜ ํŒ๋‹จ์„ ๋ฐ”ํƒ•์œผ๋กœ ์‹ค์‹œ๊ฐ„์œผ๋กœ ์—์ด์ „ํŠธ์˜ ํ–‰๋™์„ ์ฐจ๋‹จํ•˜๋Š” ํ›ˆ๋ จ-free(Training-free) ์‹œ์Šคํ…œ๊ณผ์˜ ๊ฒฐํ•ฉ์ด ํ•„์š”ํ•ด ๋ณด์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ, ํ˜„์žฌ ์ •์˜๋œ ์•ˆ์ „ ๋ถ„๋ฅ˜ ์ฒด๊ณ„(Taxonomy)์— ์—†๋Š” ์ƒˆ๋กœ์šด ์œ ํ˜•์˜ ์œ„ํ˜‘(Zero-day attack์™€ ์œ ์‚ฌํ•œ ๊ฐœ๋…)์„ ์–ผ๋งˆ๋‚˜ ์ž˜ ๊ฐ์ง€ํ• ์ง€์— ๋Œ€ํ•œ ์ถ”๊ฐ€ ๊ฒ€์ฆ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

5. ์‹ค๋ฌด ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ

๋ฐ”๋กœ ์ ์šฉ ๊ฐ€๋Šฅํ•œ ๋ถ„์•ผ

์ด ๊ธฐ์ˆ ์€ ์ž๋™ํ™”๋œ ์†Œํ”„ํŠธ์›จ์–ด ์—”์ง€๋‹ˆ์–ด๋ง, ์—ฐ๊ตฌ ๋ณด์กฐ ๋„๊ตฌ, ์ •๋ณด ๊ฒ€์ƒ‰ ๋ฐ ์›Œํฌํ”Œ๋กœ์šฐ ์ž๋™ํ™” ๋“ฑ ์‹ค์ œ ๋น„์ฆˆ๋‹ˆ์Šค ํ™˜๊ฒฝ์—์„œ AI ์—์ด์ „ํŠธ๋ฅผ ์šด์˜ํ•˜๋Š” ๋ชจ๋“  ๊ณณ์— ์ฆ‰์‹œ ์ ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ํŠนํžˆ ๋ณด์•ˆ์ด ์ค‘์š”ํ•œ ๊ธˆ์œต๊ถŒ์ด๋‚˜ ๋‚ด๋ถ€ ๋ฐ์ดํ„ฐ๊ฐ€ ๋ฏผ๊ฐํ•œ ๊ธฐ์—…์—์„œ ์ž์‚ฌ ์—์ด์ „ํŠธ๋ฅผ ์•ˆ์ „ํ•˜๊ฒŒ ํ•™์Šต์‹œํ‚ค๊ณ  ๊ฐ์‹œํ•˜๋Š” ๋ฐ ์œ ์šฉํ•ฉ๋‹ˆ๋‹ค.

ํ•„์š”ํ•œ ๋ฆฌ์†Œ์Šค

๊ฐ€์žฅ ํฐ ์žฅ์ ์€ ๋ฆฌ์†Œ์Šค ํšจ์œจ์„ฑ์ž…๋‹ˆ๋‹ค. ๊ฑฐ๋Œ€ GPU ํด๋Ÿฌ์Šคํ„ฐ๊ฐ€ ํ•„์š” ์—†์Šต๋‹ˆ๋‹ค. ๊ฒฝ๋Ÿ‰ ๋ชจ๋ธ(8B ์ดํ•˜)์„ ์‚ฌ์šฉํ•˜๋ฏ€๋กœ ์†Œ๊ทœ๋ชจ์˜ ์„œ๋ฒ„๋‚˜ ์‹ฌ์ง€์–ด ๊ณ ์„ฑ๋Šฅ GPU ํ•œ๋‘ ์žฅ์œผ๋กœ๋„ ์ถฉ๋ถ„ํžˆ ์šด์˜ ๋ฐ ๋ฐฐํฌ๊ฐ€ ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค. ๋ฐฐํฌ ์˜ค๋ฒ„ํ—ค๋“œ๊ฐ€ ํš๊ธฐ์ ์œผ๋กœ ์ค„์–ด๋“ค์—ˆ๋‹ค๋Š” ๊ฒฐ๊ณผ๋Š” ํด๋ผ์šฐ๋“œ ๋น„์šฉ ์ ˆ๊ฐ์œผ๋กœ ์ง๊ฒฐ๋ฉ๋‹ˆ๋‹ค.

6. ์ด ๋…ผ๋ฌธ์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•œ ์‚ฌ์ „ ์ง€์‹

  • AI ์—์ด์ „ํŠธ(AI Agent): ์‚ฌ์šฉ์ž์˜ ๋ชฉํ‘œ๋ฅผ ๋‹ฌ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ์Šค์Šค๋กœ ์ƒ๊ฐํ•˜๊ณ  ๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ํ™˜๊ฒฝ๊ณผ ์ƒํ˜ธ์ž‘์šฉํ•˜๋Š” ์‹œ์Šคํ…œ.
  • ์ •๋ ฌ(Alignment): AI ๋ชจ๋ธ์ด ์ธ๊ฐ„์˜ ๊ฐ€์น˜, ์˜๋„, ์•ˆ์ „ ๊ธฐ์ค€์„ ์œ„๋ฐ˜ํ•˜์ง€ ์•Š๋„๋ก ์กฐ์ •ํ•˜๋Š” ๊ณผ์ •.
  • ๊ถค์ (Trajectory): ์—์ด์ „ํŠธ๊ฐ€ ์‹œ์ž‘๋ถ€ํ„ฐ ๋๊นŒ์ง€ ์ˆ˜ํ–‰ํ•œ ์ผ๋ จ์˜ ํ–‰๋™, ์‚ฌ๊ณ , ๋„๊ตฌ ์‚ฌ์šฉ ๊ธฐ๋ก์˜ ์ˆœ์„œ.
  • ์ง€๋„ ํ•™์Šต(SFT, Supervised Fine-Tuning): ์ •๋‹ต์ด labeled๋œ ๋ฐ์ดํ„ฐ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ์„ ํŠน์ • ์ž‘์—…์— ๋งž๊ฒŒ ๋ฏธ์„ธ ์กฐ์ •ํ•˜๋Š” ํ•™์Šต ๋ฐฉ์‹.
  • ๊ฐ•ํ™” ํ•™์Šต(RL, Reinforcement Learning): ์—์ด์ „ํŠธ๊ฐ€ ์‹œํ–‰์ฐฉ์˜ค๋ฅผ ํ†ตํ•ด ํ–‰๋™์˜ ๊ฒฐ๊ณผ๋กœ ๋ณด์ƒ(Reward)์ด๋‚˜ ๋ฒŒ์ ์„ ๋ฐ›์œผ๋ฉฐ ์ตœ์ ์˜ ์ •์ฑ…์„ ํ•™์Šตํ•˜๋Š” ๋ฐฉ์‹.
  • ์˜ํ–ฅ ํ•จ์ˆ˜(Influence Function): ๋จธ์‹ ๋Ÿฌ๋‹์—์„œ ํŠน์ • ํ•™์Šต ๋ฐ์ดํ„ฐ๊ฐ€ ๋ชจ๋ธ์˜ ์ตœ์ข… ์˜ˆ์ธก์ด๋‚˜ ํŒŒ๋ผ๋ฏธํ„ฐ์— ์–ผ๋งˆ๋‚˜ ์˜ํ–ฅ์„ ๋ฏธ์ณค๋Š”์ง€๋ฅผ ์ˆ˜ํ•™์ ์œผ๋กœ ๊ณ„์‚ฐํ•˜๋Š” ๊ธฐ๋ฒ•.
  • ๋ถ„๋ฅ˜ ์ฒด๊ณ„(Taxonomy): ์œ„ํ—˜์„ ์œ ํ˜•๋ณ„๋กœ ์ฒด๊ณ„์ ์œผ๋กœ ๋ถ„๋ฅ˜ํ•ด ๋‘” ๊ธฐ์ค€ํ‘œ๋‚˜ ๋ชฉ๋ก.

๐Ÿ“š ์ด๋ฒˆ ์ฃผ ๊ด€๋ จ Deep Dive

์ˆœ์œ„๋…ผ๋ฌธDeep Dive
๐Ÿฅ‡Gamma-World: Generative Multi-Agentโ€ฆDD-097
๐ŸฅˆSkillOpt: Executive Strategy for Seโ€ฆDD-098
๐Ÿฅ‰DVAO: Dynamic Variance-adaptive Advโ€ฆDD-099
4.LocateAnything: Fast and High-Qualiโ€ฆDD-100
5.AgentDoG 1.5: A Lightweight and Scaโ€ฆ๐Ÿ“ ํ˜„์žฌ ๋ฌธ์„œ

๐Ÿ“… ์ƒ์„ฑ์ผ: 2026-05-31 | ๐Ÿค– GLM-4.7 Deep Dive