โ† ๐Ÿ“š ์ด๋ฒˆ ์ฃผ Weekly Digest๋กœ ๋Œ์•„๊ฐ€๊ธฐ

DD-074 AgentSPEX: An Agent SPecification and EXecution Language

arXiv: 2604.13346 ๊ธฐ๊ด€: UIUC ScaleML Lab Upvotes: 153 | Comments: 3 ์ˆœ์œ„: ์ด๋ฒˆ ์ฃผ Top 3


AgentSPEX ๋…ผ๋ฌธ ์‹ฌ์ธต ๋ถ„์„ ๋ฆฌํฌํŠธ

์ด ๋ฆฌํฌํŠธ๋Š” AgentSPEX ๋…ผ๋ฌธ์„ ์ฃผ๋‹ˆ์–ด ๊ฐœ๋ฐœ์ž๋„ ์‰ฝ๊ฒŒ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋„๋ก ๋น„์œ ์™€ ์˜ˆ์‹œ๋ฅผ ํ™œ์šฉํ•ด ์ƒ์„ธํžˆ ๋ถ„์„ํ•œ ๋‚ด์šฉ์ž…๋‹ˆ๋‹ค.


1. ์™œ ์ด ๋…ผ๋ฌธ์ด ์ค‘์š”ํ•œ๊ฐ€?

๊ธฐ์กด์˜ AI ์—์ด์ „ํŠธ ๊ฐœ๋ฐœ ๋ฐฉ์‹์ธ ๋‹จ์ˆœ ๋ฐ˜์‘ํ˜• ํ”„๋กฌํ”„ํŒ…(Reactive Prompting)์€ ๋ณต์žกํ•œ ์ž‘์—… ํ๋ฆ„์„ ์ œ์–ดํ•˜๊ธฐ ์–ด๋ ต๊ณ , LangGraph๋‚˜ DSPy ๊ฐ™์€ ํŒŒ์ด์ฌ ๊ธฐ๋ฐ˜ ํ”„๋ ˆ์ž„์›Œํฌ๋Š” ์ž‘์—… ๋กœ์ง๊ณผ ์ฝ”๋“œ๊ฐ€ ๋„ˆ๋ฌด ๊ฐ•ํ•˜๊ฒŒ ๊ฒฐํ•ฉ๋˜์–ด ์žˆ์–ด ์œ ์ง€๋ณด์ˆ˜๊ฐ€ ์–ด๋ ต๋‹ค๋Š” ๋ฌธ์ œ๊ฐ€ ์žˆ์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ์ด๋Ÿฌํ•œ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๊ธฐ ์œ„ํ•ด ํŒŒ์ด์ฌ ์ฝ”๋“œ๋กœ๋ถ€ํ„ฐ ์ž‘์—… ํ๋ฆ„์„ ๋ถ„๋ฆฌํ•˜์—ฌ ์„ ์–ธ์ ์œผ๋กœ ์ •์˜ํ•  ์ˆ˜ ์žˆ๋Š” ์ „์šฉ ์–ธ์–ด AgentSPEX์™€ ์ด๋ฅผ ์‹คํ–‰ํ•˜๋Š” ๊ฒฌ๊ณ ํ•œ ํ•˜๋‹ˆ์Šค(Harness) ์‹œ์Šคํ…œ์„ ์ œ์•ˆํ•ฉ๋‹ˆ๋‹ค. ์ด๋ฅผ ํ†ตํ•ด ๊ฐœ๋ฐœ์ž๋Š” ๋ณต์žกํ•œ ์ œ์–ด ํ๋ฆ„์„ ๋ช…์‹œ์ ์œผ๋กœ ๊ด€๋ฆฌํ•˜๋ฉด์„œ๋„, ๋ชจ๋“ˆํ™”๋˜๊ณ  ์ˆ˜์ •ํ•˜๊ธฐ ์‰ฌ์šด AI ์—์ด์ „ํŠธ ์‹œ์Šคํ…œ์„ ๊ตฌ์ถ•ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

2. ํ•ต์‹ฌ ์•„์ด๋””์–ด ์‰ฝ๊ฒŒ ์ดํ•ดํ•˜๊ธฐ

์ผ์ƒ์ƒํ™œ ๋น„์œ : ์š”๋ฆฌ์‚ฌ์™€ ๋ ˆ์‹œํ”ผ ์นด๋“œ

์ด ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ์„ ์ดํ•ดํ•˜๋ ค๋ฉด ๊ณ ๊ธ‰ ๋ ˆ์Šคํ† ๋ž‘ ์ฃผ๋ฐฉ์„ ์ƒ๊ฐํ•ด๋ณด์„ธ์š”.

  • ๊ธฐ์กด ๋ฐฉ์‹(Reactive Prompting): ์ฃผ๋ฐฉ์žฅ(LLM)์—๊ฒŒ โ€œ์ €๋… ๋ฉ”๋‰ด๋ฅผ ๋งŒ๋“ค์–ด์ค˜โ€๋ผ๊ณ  ํ•œ๋งˆ๋””๋งŒ ๋˜์ง€๊ณ  ์•Œ์•„์„œ ํ•˜๋ผ๊ณ  ๋‚ด๋ฒ„๋ ค๋‘๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์ฃผ๋ฐฉ์žฅ์ด ์‹ค์ˆ˜๋ฅผ ํ•˜๊ฑฐ๋‚˜ ์ˆœ์„œ๋ฅผ ๋’ค๋ฐ”๊ฟ”๋„ ์ค‘๊ฐ„์— ๊ฐœ์ž…ํ•˜๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค.
  • ๊ธฐ์กด ํ”„๋ ˆ์ž„์›Œํฌ(Python ๋“ฑ): ์š”๋ฆฌ ๊ณผ์ • ํ•˜๋‚˜ํ•˜๋‚˜๋ฅผ ๋ณต์žกํ•œ C++ ํ”„๋กœ๊ทธ๋žจ์œผ๋กœ ์ž‘์„ฑํ•ด์„œ ๋กœ๋ด‡ ํŒ”์„ ์ œ์–ดํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๋ฉ”๋‰ด๋ฅผ ๋ฐ”๊พธ๋ ค๋ฉด ๋ณต์žกํ•œ ์ฝ”๋“œ๋ฅผ ๋‹ค์‹œ ์งœ์•ผ ํ•˜๋ฏ€๋กœ ์œ ์—ฐํ•˜์ง€ ๋ชปํ•ฉ๋‹ˆ๋‹ค.
  • AgentSPEX: **โ€œ๋ ˆ์‹œํ”ผ ์นด๋“œ(์–ธ์–ด)โ€œ**์™€ **โ€œ์ฃผ๋ฐฉ ๊ด€๋ฆฌ์ž(ํ•˜๋‹ˆ์Šค)โ€œ**๋ฅผ ๋ถ„๋ฆฌํ•œ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ฐœ๋ฐœ์ž๋Š” โ€œ1. ์–‘ํŒŒ๋ฅผ ์ฐ์–ด๋ผ โ†’ 2. ๋ณถ์•„๋ผ โ†’ 3. if ๋งต๋‹ค๋ฉด: ๋ฌผ์„ ์ถ”๊ฐ€ํ•ด๋ผโ€์ฒ˜๋Ÿผ ์‰ฌ์šด ์–ธ์–ด(๋ ˆ์‹œํ”ผ)๋กœ ์ž‘์—… ์ˆœ์„œ๋ฅผ ์ ์Šต๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋ฉด ์ฃผ๋ฐฉ ๊ด€๋ฆฌ์ž(Interpreter)๊ฐ€ ์ด ๋ ˆ์‹œํ”ผ๋ฅผ ์ฝ์–ด ์ฃผ๋ฐฉ์žฅ(LLM)๊ณผ ๋„๊ตฌ(์นผ, ๋ƒ„๋น„)๋ฅผ ์ ์ ˆํ•˜๊ฒŒ ํ†ต์ œํ•ฉ๋‹ˆ๋‹ค. ๋ ˆ์‹œํ”ผ๋งŒ ๋ฐ”๊พธ๋ฉด ๋ฉ”๋‰ด๋ฅผ ์‰ฝ๊ฒŒ ๋ฐ”๊ฟ€ ์ˆ˜ ์žˆ๊ณ , ์ฃผ๋ฐฉ์žฅ์ด ์•„ํŒŒ๋„ ์ฒดํฌํฌ์ธํŠธ(์ค‘๊ฐ„ ์ €์žฅ) ๋•๋ถ„์— ์ด์–ด์„œ ์š”๋ฆฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋‹จ๊ณ„๋ณ„ ๋™์ž‘ ์›๋ฆฌ

AgentSPEX ์‹œ์Šคํ…œ์€ ํฌ๊ฒŒ ์„ธ ๊ฐ€์ง€ ์ฃผ์š” ๋ถ€๋ถ„์œผ๋กœ ๋‚˜๋‰˜์–ด ๋™์ž‘ํ•ฉ๋‹ˆ๋‹ค.

  1. ํ•ด์„๊ธฐ(Interpreter): ์‚ฌ์šฉ์ž๊ฐ€ ์ž‘์„ฑํ•œ ์›Œํฌํ”Œ๋กœ์šฐ ํŒŒ์ผ์„ ๋ฐ›์•„์„œ ๊ตฌ์กฐ๊ฐ€ ์˜ฌ๋ฐ”๋ฅธ์ง€ ๊ฒ€์‚ฌํ•ฉ๋‹ˆ๋‹ค. ๊ทธ๋ฆฌ๊ณ  ๋ ˆ์‹œํ”ผ์˜ ์ˆœ์„œ๋Œ€๋กœ ์ž‘์—…์„ ๋ถ„๋ฐฐํ•ฉ๋‹ˆ๋‹ค. ๋งŒ์•ฝ ๋ฐ˜๋ณต๋ฌธ์ด๋‚˜ ์กฐ๊ฑด๋ฌธ(if/else)์ด ์žˆ๋‹ค๋ฉด ์ด๋ฅผ ์ ์ ˆํ•˜๊ฒŒ ์ฒ˜๋ฆฌํ•˜๊ณ , ๊ฐ ์ž‘์—…์— ๊ณ ์œ ํ•œ ๋ฒˆํ˜ธ(์˜ˆ: 3.2.1)๋ฅผ ๋ถ™์—ฌ ๊ธฐ๋กํ•ฉ๋‹ˆ๋‹ค.

  2. ์‹คํ–‰๊ธฐ(Executor): ์‹ค์ œ๋กœ LLM๊ณผ ๋„๊ตฌ๊ฐ€ ์†Œํ†ตํ•˜๋Š” ๊ณณ์ž…๋‹ˆ๋‹ค. ์‹คํ–‰๊ธฐ๋Š” LLM์—๊ฒŒ โ€œ์ง€๊ธˆ ์ด ์ž‘์—…์„ ํ•ดโ€๋ผ๊ณ  ๋ช…๋ นํ•˜๊ณ , LLM์ด โ€œ๊ฒ€์ƒ‰ํ•ด์ค˜โ€, โ€œํŒŒ์ผ ์จ์ค˜โ€๋ผ๊ณ  ์š”์ฒญํ•˜๋ฉด(Model Context Protocol ํ™œ์šฉ) ๊ทธ ์š”์ฒญ์„ ์ฒ˜๋ฆฌํ•œ ๋’ค ๋‹ค์‹œ LLM์—๊ฒŒ ์•Œ๋ ค์ค๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์„ ์ž‘์—…์ด ๋๋‚  ๋•Œ๊นŒ์ง€ ๋ฐ˜๋ณตํ•ฉ๋‹ˆ๋‹ค.

  3. ์‹คํ–‰ ํ™˜๊ฒฝ(Execution Environment): ์š”๋ฆฌ๊ฐ€ ์ผ์–ด๋‚˜๋Š” ๊นจ๋—ํ•œ ์ฃผ๋ฐฉ ๊ณต๊ฐ„์ž…๋‹ˆ๋‹ค. ๋„์ปค(Docker) ๊ธฐ๋ฐ˜์˜ ์ƒŒ๋“œ๋ฐ•์Šค ์•ˆ์—์„œ ์ž‘์—…์ด ์ง„ํ–‰๋˜๋ฏ€๋กœ, ์—์ด์ „ํŠธ๊ฐ€ ์‹ค์ˆ˜๋กœ ์ค‘์š”ํ•œ ์‹œ์Šคํ…œ ํŒŒ์ผ์„ ์ง€์šฐ๊ฑฐ๋‚˜ ์•…์„ฑ ์ฝ”๋“œ๋ฅผ ์‹คํ–‰ํ•ด๋„ ๋ฐ–์œผ๋กœ ๋‚˜์˜ค์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์—๋Š” ์›น ๋ธŒ๋ผ์šฐ์ €, ํŒŒ์ผ ์‹œ์Šคํ…œ, ์ฝ”๋“œ ์‹คํ–‰ ๋„๊ตฌ ๋“ฑ 50๊ฐ€์ง€ ์ด์ƒ์˜ ๋„๊ตฌ๊ฐ€ ๋น„์น˜๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ๋ฐ ํŠน์ง•

์ด ๋…ผ๋ฌธ์€ ๋ณต์žกํ•œ ์ˆ˜์‹๋ณด๋‹ค๋Š” **๊ตฌ์กฐ์ ์ธ ์ œ์–ด(Structured Control)**์— ์ค‘์ ์„ ๋‘ก๋‹ˆ๋‹ค. ํ•ต์‹ฌ์€ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ํŒŒ์ด์ฌ ์ฝ”๋“œ๊ฐ€ ์•„๋‹Œ ์ •ํ˜•ํ™”๋œ ์Šคํ‚ค๋งˆ๋กœ ์ •์˜ํ•œ๋‹ค๋Š” ์ ์ž…๋‹ˆ๋‹ค. ๊ฐ ๋‹จ๊ณ„(Step)๋Š” ํƒ€์ž…์„ ๊ฐ€์ง€๋ฉฐ, ๋ถ„๊ธฐ(Branching), ๋ฐ˜๋ณต(Loops), ๋ณ‘๋ ฌ ์‹คํ–‰(Parallel Execution)์ด ๋ช…์‹œ์ ์œผ๋กœ ์ •์˜๋ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ๊ณ„์ธต์  ๋‹จ๊ณ„ ์‹๋ณ„์ž(Hierarchical Step Identifier, ์˜ˆ: 3.2.1)๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์–ธ์ œ๋“  ์ค‘๋‹จ๋œ ์ง€์ ๋ถ€ํ„ฐ ๋‹ค์‹œ ์‹œ์ž‘ํ•  ์ˆ˜ ์žˆ๋Š” ๋‚ด๊ตฌ์„ฑ(Durability)์„ ์•Œ๊ณ ๋ฆฌ์ฆ˜์ ์œผ๋กœ ๋ณด์žฅํ•ฉ๋‹ˆ๋‹ค.

3. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ถ„์„

์–ด๋–ค ๋ฒค์น˜๋งˆํฌ์—์„œ ํ…Œ์ŠคํŠธํ–ˆ๋‚˜?

์—ฐ๊ตฌ์ง„์€ AgentSPEX์˜ ์„ฑ๋Šฅ์„ ๊ฒ€์ฆํ•˜๊ธฐ ์œ„ํ•ด ๊ณผํ•™, ์ˆ˜ํ•™, ๊ธ€์“ฐ๊ธฐ, ๋…ผ๋ฌธ ์ดํ•ด, ์†Œํ”„ํŠธ์›จ์–ด ์—”์ง€๋‹ˆ์–ด๋ง ๋“ฑ 7๊ฐœ์˜ ์„œ๋กœ ๋‹ค๋ฅธ ์˜์—ญ์—์„œ ํ™•๋ฆฝ๋œ ๋ฒค์น˜๋งˆํฌ๋ฅผ ์‚ฌ์šฉํ–ˆ์Šต๋‹ˆ๋‹ค. ๋‹จ์ˆœํ•œ ์„ฑ๋Šฅ ์ธก์ •์„ ๋„˜์–ด ์‹ค์ œ ํ™œ์šฉ ๊ฐ€๋Šฅ์„ฑ์„ ๋ณด์—ฌ์ฃผ๊ธฐ ์œ„ํ•ด ์„ธ ๊ฐ€์ง€ ๊ตฌ์ฒด์ ์ธ ์—์ด์ „ํŠธ ๋ฐ๋ชจ๋„ ํ•จ๊ป˜ ์ œ์‹œํ–ˆ์Šต๋‹ˆ๋‹ค.

๊ธฐ์กด ๋ฐฉ์‹ ๋Œ€๋น„ ์„ฑ๊ณผ ๋ฐ ์ฃผ๋ชฉํ•  ๋งŒํ•œ ์ 

  1. Deep Research ์—์ด์ „ํŠธ: OpenAI์˜ Deep Research๋‚˜ ๊ตฌ๊ธ€์˜ ์ œํ’ˆ๊ณผ ์œ ์‚ฌํ•œ ์„ฑ๋Šฅ์„ ๋ณด์—ฌ์ฃผ๋Š” ์‹ฌ์ธต ๋ฆฌํฌํŠธ ์ƒ์„ฑ ์—์ด์ „ํŠธ๋ฅผ ๊ตฌํ˜„ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด ์‹œ์Šคํ…œ์€ ์‚ฌ์šฉ์ž ์งˆ๋ฌธ์„ ๋ฐ›์•„ ์—ฌ๋Ÿฌ ๋‹จ๊ณ„์— ๊ฑธ์ณ ์ •๋ณด๋ฅผ ์ˆ˜์ง‘ํ•˜๊ณ , ์ด๋ฅผ ์ข…ํ•ฉํ•˜์—ฌ ๋งˆํฌ๋‹ค์šด ํ˜•ํƒœ์˜ ๋ณด๊ณ ์„œ๋ฅผ ์ƒ์„ฑํ•ฉ๋‹ˆ๋‹ค. ๋„ˆ๋น„์™€ ๊นŠ์ด ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์กฐ์ ˆํ•˜์—ฌ ๊ฒ€์ƒ‰ ์ „๋žต์„ ์ œ์–ดํ•  ์žˆ๋‹ค๋Š” ์ ์ด ํŠน์ง•์ž…๋‹ˆ๋‹ค.

  2. AI Scientist ์—์ด์ „ํŠธ: ์‚ฌ์šฉ์ž์˜ ์˜๋„๋ฅผ ๋ฐ›์•„ ์ƒˆ๋กœ์šด ํ•™์ˆ  ์—ฐ๊ตฌ ์ œ์•ˆ์„œ๋ฅผ ์ƒ์„ฑํ•˜๋Š” ๋‘ ๋‹จ๊ณ„ ํŒŒ์ดํ”„๋ผ์ธ์„ ์‹œ์—ฐํ–ˆ์Šต๋‹ˆ๋‹ค. โ€˜์ƒ๊ฐ๊ฐ€(Thinker)โ€™ ๋‹จ๊ณ„์—์„œ๋Š” ์•ˆ์ „์„ฑ ๋ถ„๋ฅ˜์™€ ๊ด€๋ จ ์—ฐ๊ตฌ ๊ฒ€์ƒ‰์„ ํ†ตํ•ด ์•„์ด๋””์–ด๋ฅผ ๊ตฌ์ฒดํ™”ํ•˜๊ณ , โ€˜์ž‘๊ฐ€(Writer)โ€™ ๋‹จ๊ณ„์—์„œ๋Š” ๋…ผ๋ฌธ์˜ ๊ฐ ์„น์…˜์„ ์ˆœ์ฐจ์ ์œผ๋กœ ์ž‘์„ฑํ•˜๋ฉฐ ๋ณ‘๋ ฌ๋กœ ์ธ์šฉ ์ž‘์—…์ž๋ฅผ ๋Œ๋ ค ์ฐธ๊ณ ๋ฌธํ—Œ์„ ์ฐพ์•„ ๋„ฃ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ณต์žกํ•œ ํ˜‘์—… ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ AgentSPEX๋กœ ์–ผ๋งˆ๋‚˜ ์šฐ์•„ํ•˜๊ฒŒ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋Š”์ง€๋ฅผ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

  3. ์ •๋Ÿ‰์  ๋น„๊ต: ๊ตฌ์ฒด์ ์ธ ์ˆ˜์น˜๋Š” ์ œ๊ณต๋œ ํ…์ŠคํŠธ์— ๋ช…์‹œ๋˜์–ด ์žˆ์ง€ ์•Š์œผ๋‚˜, ๋…ผ๋ฌธ์€ ๊ธฐ์กด์˜ ๋ฒ ์ด์Šค๋ผ์ธ๊ณผ ์—์ด์ „ํŠธ ํ”„๋ ˆ์ž„์›Œํฌ๋“ค๊ณผ ๋น„๊ตํ•˜์—ฌ AgentSPEX ์›Œํฌํ”Œ๋กœ์šฐ๊ฐ€ ๊ฐ ๋ฒค์น˜๋งˆํฌ์—์„œ ๊ฒฝ์Ÿ๋ ฅ ์žˆ๊ฑฐ๋‚˜ ๋” ์šฐ์ˆ˜ํ•œ ์„ฑ๋Šฅ์„ ๊ฑฐ๋‘์—ˆ์Œ์„ ์ฃผ์žฅํ•ฉ๋‹ˆ๋‹ค. ํŠนํžˆ, ๊ตฌ์กฐ์ ์ธ ์›Œํฌํ”Œ๋กœ์šฐ๊ฐ€ ์žฅ๊ธฐ๊ฐ„์˜ ์ž‘์—…(Long-horizon tasks)์—์„œ ๋ฐ˜์‘ํ˜• ๋ฐฉ์‹๋ณด๋‹ค ๋น„์šฉ ํšจ์œจ์„ฑ๊ณผ ์žฌํ˜„์„ฑ ๋ฉด์—์„œ ์œ ๋ฆฌํ•จ์„ ์ž…์ฆํ–ˆ์Šต๋‹ˆ๋‹ค.

4. ํ•œ๊ณ„์ ๊ณผ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

์ €์ž๊ฐ€ ์–ธ๊ธ‰ํ•œ ํ•œ๊ณ„

์ œ๊ณต๋œ ํ…์ŠคํŠธ์—์„œ ๋ช…์‹œ์ ์ธ ํ•œ๊ณ„์ (Limitations) ์„น์…˜์€ ๋ฐœ์ทŒ๋˜์ง€ ์•Š์•˜์œผ๋‚˜, ์ผ๋ฐ˜์ ์œผ๋กœ ์ด๋Ÿฌํ•œ DSL(Domain Specific Language) ๊ธฐ๋ฐ˜ ์ ‘๊ทผ ๋ฐฉ์‹์€ ์ƒˆ๋กœ์šด ์–ธ์–ด๋ฅผ ํ•™์Šตํ•ด์•ผ ํ•˜๋Š” ์ง„์ž… ์žฅ๋ฒฝ์ด ์กด์žฌํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋˜ํ•œ, ์–ธ์–ด ์ž์ฒด๊ฐ€ ์ œ๊ณตํ•˜๋Š” ๊ธฐ๋Šฅ ๋‚ด์—์„œ๋งŒ ์›Œํฌํ”Œ๋กœ์šฐ๋ฅผ ํ‘œํ˜„ํ•ด์•ผ ํ•˜๋ฏ€๋กœ, ํŒŒ์ด์ฌ ์ž์œ ๋„๊ฐ€ ํ•„์š”ํ•œ ๋งค์šฐ ํŠน์ดํ•œ ๋กœ์ง์—๋Š” ์ œ์•ฝ์ด ์žˆ์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๊ฐœ์„  ๊ฐ€๋Šฅํ•œ ์  (ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ)

์—ฐ๊ตฌ ๋ฐฉํ–ฅ์œผ๋กœ๋Š” AgentSPEX ์–ธ์–ด ์ž์ฒด์˜ ํ‘œํ˜„๋ ฅ ํ™•์žฅ, ๋” ๋‹ค์–‘ํ•œ ๋„๊ตฌ์™€์˜ ํ†ตํ•ฉ, ๊ทธ๋ฆฌ๊ณ  ์›Œํฌํ”Œ๋กœ์šฐ์˜ ์„ฑ๋Šฅ์„ ์ตœ์ ํ™”ํ•˜๋Š” ์ปดํŒŒ์ผ๋Ÿฌ ๊ธฐ์ˆ ์˜ ๊ฐœ๋ฐœ์ด ์žˆ์„ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋˜ํ•œ, ํ˜„์žฌ ์ œ์•ˆ๋œ ํ•˜๋‹ˆ์Šค(Harness)๋ฅผ ๋‹ค๋ฅธ ๊ธฐ๋ฐ˜ ๋ชจ๋ธ์ด๋‚˜ ํ”Œ๋žซํผ์œผ๋กœ ํ™•์žฅํ•˜๋Š” ๊ฒƒ๋„ ๊ณ ๋ คํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

5. ์‹ค๋ฌด ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ

์–ด๋””์— ๋ฐ”๋กœ ์ ์šฉ ๊ฐ€๋Šฅํ•œ๊ฐ€?

  • ์—”ํ„ฐํ”„๋ผ์ด์ฆˆ ์ž๋™ํ™”: ์—ฌ๋Ÿฌ ๋‹จ๊ณ„์˜ ์Šน์ธ, ๊ฒ€์ƒ‰, ๋ฌธ์„œ ์ƒ์„ฑ์ด ํ•„์š”ํ•œ ๊ธฐ์—… ๋‚ด ๋ณต์žกํ•œ ์—…๋ฌด ์ž๋™ํ™”์— ์ ํ•ฉํ•ฉ๋‹ˆ๋‹ค. ์ฝ”๋“œ๊ฐ€ ์•„๋‹Œ ๋ช…์„ธ์„œ๋กœ ๊ด€๋ฆฌ๋˜๋ฏ€๋กœ ๋น„๊ฐœ๋ฐœ์ž๋„ ๋กœ์ง์„ ์ดํ•ดํ•˜๊ธฐ ์‰ฝ์Šต๋‹ˆ๋‹ค.
  • ์—ฐ๊ตฌ ์ง€์› ๋„๊ตฌ: โ€˜AI Scientistโ€™ ๋ฐ๋ชจ์ฒ˜๋Ÿผ ๋ฐฉ๋Œ€ํ•œ ๋ฌธํ—Œ ์กฐ์‚ฌ์™€ ์ดˆ์•ˆ ์ž‘์„ฑ์ด ํ•„์š”ํ•œ R&D ๋ถ€์„œ์—์„œ ์—ฐ๊ตฌ์›์„ ๋ณด์กฐํ•˜๋Š” ์—์ด์ „ํŠธ๋กœ ์ฆ‰์‹œ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ ์—์ด์ „ํŠธ: ๊นƒํ—ˆ๋ธŒ ์ด์Šˆ ํ•ด๊ฒฐ์ด๋‚˜ ์ฝ”๋“œ ๋ฆฌ๋ทฐ์ฒ˜๋Ÿผ ์—ฌ๋Ÿฌ ๋„๊ตฌ(๊ฒ€์ƒ‰, ํŒŒ์ผ ์—ด๊ธฐ, ํ„ฐ๋ฏธ๋„ ์‹คํ–‰)๋ฅผ ์ˆœ์„œ๋Œ€๋กœ ์‚ฌ์šฉํ•ด์•ผ ํ•˜๋Š” ์ž‘์—…์— ํšจ๊ณผ์ ์ž…๋‹ˆ๋‹ค.

ํ•„์š”ํ•œ ๋ฆฌ์†Œ์Šค

  • ํ•˜๋“œ์›จ์–ด: ๊ณ ์„ฑ๋Šฅ LLM ์ถ”๋ก ์„ ์œ„ํ•œ GPU ๋ฆฌ์†Œ์Šค๊ฐ€ ํ•„์š”ํ•˜์ง€๋งŒ, AgentSPEX ์ž์ฒด๋Š” ๊ฐ€๋ฒผ์šด ์–ธ์–ด ์ฒ˜๋ฆฌ๋ฅผ ์ˆ˜ํ–‰ํ•˜๋ฏ€๋กœ ์ผ๋ฐ˜ ์„œ๋ฒ„ ํ™˜๊ฒฝ์—์„œ๋„ ์‹คํ–‰ ์—”์ง„ ๊ตฌ๋™์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
  • ์†Œํ”„ํŠธ์›จ์–ด: ๋„์ปค(Docker) ํ™˜๊ฒฝ์ด ํ•„์ˆ˜์ ์ด๋ฉฐ, Model Context Protocol(MCP)์„ ์ง€์›ํ•˜๋Š” ๋„๊ตฌ๋“ค๊ณผ ํ†ตํ•ฉ ํ™˜๊ฒฝ์ด ๊ฐ–์ถฐ์ ธ์•ผ ํ•ฉ๋‹ˆ๋‹ค.
  • ๋ฐ์ดํ„ฐ: ํŠน์ • ๋„๋ฉ”์ธ์— ์ ์šฉํ•˜๋ ค๋ฉด ํ•ด๋‹น ๋„๋ฉ”์ธ์˜ ์ „๋ฌธ ์ง€์‹์ด ํฌํ•จ๋œ ํ”„๋กฌํ”„ํŠธ ํ…œํ”Œ๋ฆฟ๊ณผ ๊ฒ€์ƒ‰ ๋ฐ์ดํ„ฐ๋ฒ ์ด์Šค๊ฐ€ ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

6. ์ด ๋…ผ๋ฌธ์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•œ ์‚ฌ์ „ ์ง€์‹

  1. LLM ์—์ด์ „ํŠธ(LLM Agent): ์–ธ์–ด ๋ชจ๋ธ์ด ์Šค์Šค๋กœ ํŒ๋‹จํ•˜์—ฌ ๋„๊ตฌ๋ฅผ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜ ๋ชฉํ‘œ๋ฅผ ๋‹ฌ์„ฑํ•˜๊ธฐ ์œ„ํ•ด ํ–‰๋™ํ•˜๋Š” ์ž์œจ์ ์ธ ์‹œ์Šคํ…œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.
  2. ReAct (Reasoning and Acting): ์–ธ์–ด ๋ชจ๋ธ์ด ์ถ”๋ก (Reasoning)๊ณผ ํ–‰๋™(Acting)์„ ๋ฒˆ๊ฐˆ์•„ ๊ฐ€๋ฉฐ ์ˆ˜ํ–‰ํ•˜์—ฌ ๋ฌธ์ œ๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๋Œ€ํ‘œ์ ์ธ ํ”„๋กฌํ”„ํŒ… ํŒจํ„ด์ž…๋‹ˆ๋‹ค.
  3. ์˜ค์ผ€์ŠคํŠธ๋ ˆ์ด์…˜(Orchestration): ์—ฌ๋Ÿฌ AI ๋ชจ๋ธ์ด๋‚˜ ๋„๊ตฌ๋“ค์ด ์„œ๋กœ ์กฐํ™”๋กญ๊ฒŒ ์ž‘๋™ํ•˜๋„๋ก ์ œ์–ดํ•˜๊ณ  ์กฐ์ •ํ•˜๋Š” ๊ณผ์ •์„ ๋งํ•ฉ๋‹ˆ๋‹ค.
  4. ์ œ์–ด ํ๋ฆ„(Control Flow): ํ”„๋กœ๊ทธ๋žจ์˜ ์‹คํ–‰ ์ˆœ์„œ๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๊ตฌ์กฐ๋กœ, ์ˆœ์ฐจ ์‹คํ–‰, ์กฐ๊ฑด๋ฌธ, ๋ฐ˜๋ณต๋ฌธ ๋“ฑ์ด ํฌํ•จ๋ฉ๋‹ˆ๋‹ค.
  5. ์ƒŒ๋“œ๋ฐ•์Šค(Sandbox): ์™ธ๋ถ€ ์‹œ์Šคํ…œ์œผ๋กœ๋ถ€ํ„ฐ ๊ฒฉ๋ฆฌ๋œ ์•ˆ์ „ํ•œ ์‹คํ–‰ ํ™˜๊ฒฝ์œผ๋กœ, ํ”„๋กœ๊ทธ๋žจ์ด ์‹œ์Šคํ…œ์— ํ•ด๋ฅผ ๋ผ์น˜์ง€ ๋ชปํ•˜๋„๋ก ์ œํ•œ์„ ๊ฒ๋‹ˆ๋‹ค.
  6. MCP (Model Context Protocol): AI ๋ชจ๋ธ์ด ์™ธ๋ถ€ ๋ฐ์ดํ„ฐ ์†Œ์Šค๋‚˜ ๋„๊ตฌ์™€ ํ‘œ์ค€ํ™”๋œ ๋ฐฉ์‹์œผ๋กœ ์ƒํ˜ธ์ž‘์šฉํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•ด์ฃผ๋Š” ํ”„๋กœํ† ์ฝœ์ž…๋‹ˆ๋‹ค.
  7. ์ฒดํฌํฌ์ธํŒ…(Checkpointing): ๊ธด ์ž‘์—… ๋„์ค‘ ํ˜„์žฌ ์ƒํƒœ๋ฅผ ์ €์žฅํ•ด ๋‘์–ด, ์ค‘๋‹จ๋˜์—ˆ์„ ๋•Œ ๊ทธ ์ง€์ ๋ถ€ํ„ฐ ๋‹ค์‹œ ์‹œ์ž‘ํ•  ์ˆ˜ ์žˆ๊ฒŒ ํ•˜๋Š” ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค.

๐Ÿ“š ์ด๋ฒˆ ์ฃผ ๊ด€๋ จ Deep Dive

์ˆœ์œ„๋…ผ๋ฌธDeep Dive
๐Ÿฅ‡Tstars-Tryon 1.0: Robust and Realisโ€ฆDD-072
๐ŸฅˆLLaDA2.0-Uni: Unifying Multimodal Uโ€ฆDD-073
๐Ÿฅ‰AgentSPEX: An Agent SPecification aโ€ฆ๐Ÿ“ ํ˜„์žฌ ๋ฌธ์„œ
4.Extending One-Step Image Generationโ€ฆDD-075
5.OneVL: One-Step Latent Reasoning anโ€ฆDD-076

๐Ÿ“… ์ƒ์„ฑ์ผ: 2026-04-26 | ๐Ÿค– GLM-4.7 Deep Dive