β π μ΄λ² μ£Ό Weekly Digestλ‘ λμκ°κΈ°
DD-065 SkillClaw: Let Skills Evolve Collectively with Agentic Evolver
arXiv: 2604.08377 Upvotes: 215 | Comments: 6 μμ: μ΄λ² μ£Ό Top 5
SkillClaw: Let Skills Evolve Collectively with Agentic Evolver (Deep Dive)
μ΄ λΆμμ μ 곡λ λ Όλ¬Έμ μ΄λ‘(Abstract)κ³Ό μλ‘ (Introduction) λΆλΆμ λ°νμΌλ‘, ν΄λΉ λ Όλ¬Έμ΄ λ€λ£¨κ³ μλ ν΅μ¬ λ¬Έμ μ μ μνλ μ루μ μΈ βμμ΄μ νΈν μλ³Όλ²(Agentic Evolver)βμ μλ μ리λ₯Ό μ¬μΈ΅μ μΌλ‘ ν΄μν λ΄μ©μ λλ€.
1. μ μ΄ λ Όλ¬Έμ΄ μ€μνκ°?
νμ¬μ λκ·λͺ¨ μΈμ΄ λͺ¨λΈ μμ΄μ νΈ(LLM Agent) μμ€ν λ€μ λ°°ν¬ ν μ€ν¬(Skill)μ΄ κ³ μ λμ΄ μμ΄, μ¬μ©μλ€μ΄ κ²ͺλ μνμ°©μ€κ° μμ€ν μ μ²΄λ‘ μ νλμ§ λͺ»νκ³ κ°λ³ μΈμ μλ§ λ¨Έλ¬΄λ κ·Όλ³Έμ μΈ νκ³λ₯Ό μκ³ μμ΅λλ€. μ΄ λ Όλ¬Έμ λ€μν μ¬μ©μμ μνΈμμ© λ‘κ·Έλ₯Ό μμ§νμ¬ μ΄λ₯Ό μ λ’°ν μ μλ μ€ν¬ μ λ°μ΄νΈλ‘ λ³ννλ βμμ΄μ νΈν μλ³Όλ²(Agentic Evolver)βλΌλ λ©μ»€λμ¦μ μ μν¨μΌλ‘μ¨, μμ΄μ νΈκ° μ¬μ©μμμ μνΈμμ©μ ν΅ν΄ μ€μ€λ‘ μ§νν μ μλ κΈΈμ μ΄μμ΅λλ€. μ¦, κ°μΈμ κ²½νμ μ§λ¨μ μ§μμΌλ‘ μ ννμ¬ μμ΄μ νΈ μνκ³λ₯Ό μ μ μΌλ‘λΆν° λμ μΌλ‘ λ°μ μν€λ ν¨λ¬λ€μ μννΈλ₯Ό μ΄λμλ€λ μ μμ λ§€μ° μ€μν©λλ€.
2. ν΅μ¬ μμ΄λμ΄ μ½κ² μ΄ν΄νκΈ°
μΌμμν λΉμ : βμν€λ°±κ³Όβμ²λΌ μ λ°μ΄νΈλλ βμλ¦¬μ± β
μ΄ λ Όλ¬Έμ ν΅μ¬μ μ΄ν΄νλ €λ©΄ μλΉμ μλ¦¬μ± μ μκ°νλ©΄ μ½μ΅λλ€. κΈ°μ‘΄μ AI μμ΄μ νΈλ μ²μ λ°°ν¬λ μλ¦¬μ± (μ€ν¬)μ κ·Έλλ‘ μ¬μ©ν©λλ€. μ΄λ€ μ리μ¬(μ¬μ©μ)κ° βλ μνΌμ μμ€ μμ΄ λ무 μ§μ μλμ΄ λͺ» λ¨Ήκ² λ€βλΌκ³ μ€ν¨λ₯Ό κ²½ννκ±°λ, βμ€ν λλ©΄ κΏμ λ£μΌλ©΄ λ λ§μλ€βλ κΏνμ λ°κ²¬ν΄λ, κ·Έ μ 보λ ν΄λΉ μ리μ¬μ λ¨Έλ¦Ώμμλ§ λ¨κ³ λ€μ μ리μ¬μκ²λ μ λ¬λμ§ μμ΅λλ€. κ²°κ΅ λκ°μ μ€μλ₯Ό κ³μ λ°λ³΅νκ² λ©λλ€.
SkillClawλ μ΄ μλ¦¬μ± μ΄ βμν€λ°±κ³Ό(Wikipedia)βμ²λΌ μλνκ² λ§λλλ€. λͺ¨λ μ리μ¬λ€μ μ리 κ²°κ³Ό(μ±κ³΅/μ€ν¨ λ‘κ·Έ)λ₯Ό μ€μ κ΄λ¦¬μ(Agentic Evolver)κ° λͺ¨λν°λ§ν©λλ€. κ΄λ¦¬μλ βλλ€μμ μ리μ¬κ° μ΄ λ¨κ³μμ μ€ν¨νλ λ μνΌλ₯Ό μμ νμβλΌκ³ νλ¨νκ³ , μ€μ μλ¦¬μ± (μ€ν¬ νλΈ)μ λ΄μ©μ μ€μκ°μΌλ‘ μμ ν©λλ€. μ΄λ κ² λλ©΄ μ΄ν μ리μ¬λ€μ κ°μ λ λ μνΌλ₯Ό λ°λ‘ μ¬μ©νμ¬ λ λ§μλ μ리(νμ€ν¬ μν)λ₯Ό ν μ μμ΅λλ€.
λ¨κ³λ³ λμ μ리
- κ²½ν μμ§ (Collection of Heterogeneous Experiences): μλ§μ μ¬μ©μκ° μμ΄μ νΈμ λννλ©° λ€μν λꡬλ₯Ό μ¬μ©νκ³ λͺ λ Ήμ λ΄λ¦½λλ€. μ΄ κ³Όμ μμ λ°μνλ μ±κ³΅ μ¬λ‘, μ€ν¨ μ¬λ‘, κ·Έλ¦¬κ³ ν΄κ²° κ³Όμ μ΄ λͺ¨λ λ°μ΄ν°λ‘ μμ§λ©λλ€.
- ν¨ν΄ λΆμ λ° μ νΈ μΆμΆ (Signal Extraction): βμμ΄μ νΈν μλ³Όλ²βλ μμ§λ λ°©λν λ‘κ·Έλ₯Ό λΆμν©λλ€. μλ₯Ό λ€μ΄, βνΉμ APIλ₯Ό νΈμΆν λ μΈμ νμμ΄ ν리면 κ³μ μ€ν¨νλ€βκ±°λ βμ΄ λꡬλ₯Ό μ λκ΅¬λ³΄λ€ λ¨Όμ μ°λ©΄ ν¨μ¬ ν¨μ¨μ μ΄λ€βμ κ°μ ν¨ν΄μ μ°Ύμλ λλ€.
- μ€ν¬ μ§ν (Skill Evolution): λ°κ²¬λ ν¨ν΄μ λ°νμΌλ‘ μλ³Όλ²λ κΈ°μ‘΄ μ€ν¬μ μ½λλ₯Ό μμ νκ±°λ ν둬ννΈλ₯Ό μ΅μ νν©λλ€. λ¨μν μ€λ₯λ₯Ό κ³ μΉλ κ²μ λμ΄, λ ν¨μ¨μ μΈ μν¬νλ‘μ°(Workflow)λ‘ μ€ν¬ μ체λ₯ΌθΏν(Evolution)μν΅λλ€.
- μ§λ¨μ μ§μ νμ° (Collective Improvement): μ λ°μ΄νΈλ μ€ν¬μ μ€μ μ€ν¬ νλΈ(Skill Hub)μ λ°μλκ³ , μ΄λ₯Ό μ¬μ©νλ λͺ¨λ μ¬μ©μμ μμ΄μ νΈκ° μ¦μ ν₯μλ μ±λ₯μ λλ¦¬κ² λ©λλ€.
ν΅μ¬ μκ³ λ¦¬μ¦ κ°λ
μ΄ μμ€ν μ λ¨μν κΈ°κ³νμ΅ μ λ°μ΄νΈκ° μλλΌ, λ©ν μμ΄μ νΈ(Meta-Agent)μΈ μλ³Όλ²κ° λ€λ₯Έ μμ΄μ νΈλ€μ νλμ κ΄μ°°νκ³ κ°μ νλ **κ³μΈ΅μ μμ΄μ νΈ κ΅¬μ‘°(Hierarchical Agent Structure)**λ₯Ό λ°λ¦ λλ€. ν΅μ¬ μμμ λ€μκ³Ό κ°μ κ°λ μΌλ‘ μμ½ν μ μμ΅λλ€.
$$S_{t+1} = \text{Evolver}(S_t, {E_{user1}, E_{user2}, β¦, E_{userN}})$$
μ¬κΈ°μ $S_t$λ μμ $t$μ μ€ν¬ μΈνΈμ΄κ³ , $E_{user}$λ κ° μ¬μ©μμ κ²½ν(λ‘κ·Έ)μ λλ€. μλ³Όλ² ν¨μλ νμ¬ μ€ν¬κ³Ό μ¬μ©μλ€μ κ²½νμ μ λ ₯λ°μ λ λμ μ€ν¬ $S_{t+1}$λ‘ μΆλ ₯ν©λλ€. μ΄λ μ¬μ©μλ€μ κ²½νμ΄ μ§λ¨μ μ§μμΌλ‘ λ Ήμλ€μ΄ μ€ν¬μ μ λ°μ΄νΈνλ€λ μλ―Έμ λλ€.
3. μ€ν κ²°κ³Ό λΆμ
λ Όλ¬Έμ λ³Έλ¬Έμ΄ μ 곡λμ§ μμμΌλ, μλ‘ κ³Ό μ΄λ‘μ λ΄μ©μ λ°νμΌλ‘ μ΄ λ Όλ¬Έμ΄ κ²μ¦νμ λ²ν κ²°κ³Όμ κ·Έ μλ―Έλ₯Ό μΆλ‘ ν΄ λΆμν©λλ€.
- ν μ€νΈ λ²€μΉλ§ν¬: λ€μν λꡬ μ¬μ©μ΄ νμν 볡μ‘ν μ€μ νμ€ν¬(μ: λ°μ΄ν° μ²λ¦¬ μλν, API λλ²κΉ , μλΉμ€ μ€μ ) νκ²½μμ μ€νμ΄ μνλμμ κ°λ₯μ±μ΄ λμ΅λλ€.
- κΈ°μ‘΄ λ°©μ λλΉ μ±λ₯: κΈ°μ‘΄μ μ μ (Static)μΈ μ€ν¬μ μ¬μ©νλ μμ€ν (μ: OpenClawμ μ΄κΈ° λ²μ )κ³Ό λΉκ΅νμ¬, SkillClawλ₯Ό μ μ©νμ λ λ°λ³΅λλ μ€ν¨ νμκ° νμ ν μ€μ΄λ€μμμ μ μ¦νμ κ²μ λλ€. μ¦, ν μ¬μ©μκ° κ²ͺμ λ¬Έμ λ₯Ό ν΄κ²°ν¨μΌλ‘μ¨ λ€λ₯Έ μ¬μ©μμ μ±κ³΅λ₯ μ΄ λΉμ½μ μΌλ‘ μμΉνλ βλμ μ νμ΅ ν¨κ³Όβλ₯Ό 보μ¬μ£Όμμ κ²μ λλ€.
- μ£Όλͺ©ν λ§ν μ±κ³Ό: νΉν βλꡬ νΈμΆ μ€λ₯βλ βμΈμ ν¬λ§· λΆμΌμΉβμ κ°μ λ―Έλ¬ν λ¬Έμ λ€μ λν΄ μμ΄μ νΈκ° μ¬μ©μλ€μ νΌλλ°±μ ν΅ν΄ μ€μ€λ‘ μμ λ°©λ²μ νμ΅νμ¬, μκ°μ΄ μ§λ μλ‘ νμ€ν¬ μλ£μ¨μ΄ μ μ§μ μΌλ‘ ν₯μλλ 곑μ μ 보μμ κ²μ λλ€.
4. νκ³μ κ³Ό ν₯ν μ°κ΅¬ λ°©ν₯
- λ°μ΄ν° νλΌμ΄λ²μ λ° λ³΄μ: μ¬μ©μμ μνΈμμ© λ‘κ·Έλ₯Ό μμ§νμ¬ μ€ν¬μ μ λ°μ΄νΈνλ κ³Όμ μμ, κ°μΈμ 보λ λ―Όκ°ν λ°μ΄ν°κ° λ‘κ·Έμ ν¬ν¨λ μνμ΄ μμ΅λλ€. μ΄λ₯Ό μ΅λͺ ννκ±°λ νν°λ§νλ κ°λ ₯ν 보μ λ©μ»€λμ¦μ΄ μΆκ°μ μΌλ‘ νμν©λλ€.
- μ μμ μ λ°μ΄νΈ λ°©μ΄: νΉμ μ¬μ©μλ κ·Έλ£Ήμ΄ μ μμ μΌλ‘ μλͺ»λ λ‘κ·Έλ₯Ό μ£Όμ νμ¬ μ€ν¬μ μλλλ‘ μλνμ§ μκ² λ§λλ βνΌμ±(Poisoning)β 곡격μ λν λ°©μ΄ κΈ°μ κ° νμν©λλ€.
- μλ³Όλ²μ λΉμ©: λͺ¨λ λ‘κ·Έλ₯Ό λΆμνκ³ μ€ν¬μ μ λ°μ΄νΈνλ βμλ³Όλ²β μ체λ₯Ό μ΄μνλ λ° λ€μ΄κ°λ μ°μ° λΉμ©μ΄ μλΉν μ μμ΅λλ€. μ΄λ₯Ό ν¨μ¨μ μΌλ‘ μ΅μ ννλ μ°κ΅¬κ° νμν κ²μ λλ€.
5. μ€λ¬΄ μ μ© κ°λ₯μ±
- μ μ© λΆμΌ: κΈ°μ λ΄λΆμ© AI λΉμ(Slack Bot, MS Copilot λ±), κ³ κ° μλ μλν μμ€ν , 볡μ‘ν RPA(λ‘λ΄ νλ‘μΈμ€ μλν) μν¬νλ‘μ° κ΄λ¦¬ μμ€ν μ μ¦μ μ μ©ν μ μμ΅λλ€. νΉν λ§μ μ¬μ©μκ° λΉμ·ν μ 무 λꡬλ₯Ό μ¬μ©νλ νκ²½μμ ν¨κ³Όμ μ λλ€.
- νμ 리μμ€: μ¬μ©μ λ‘κ·Έλ₯Ό μμ§νκ³ μ μ₯νλ λμ©λ λ°μ΄ν°λ² μ΄μ€, λ‘κ·Έλ₯Ό λΆμνμ¬ μ€ν¬μ μμ ν λ λ€λ₯Έ κ°λ ₯ν LLM(μλ³Όλ²μ©), κ·Έλ¦¬κ³ λ³κ²½λ μ€ν¬μ λ°°ν¬νλ CI/CD νμ΄νλΌμΈ μΈνλΌκ° νμν©λλ€. GPUλ μλ³Όλ²κ° λ‘κ·Έλ₯Ό λΆμνλ λ¨κ³μμ μ§μμ μΌλ‘ μλͺ¨λ©λλ€.
6. μ΄ λ Όλ¬Έμ μ΄ν΄νκΈ° μν μ¬μ μ§μ
- LLM μμ΄μ νΈ (LLM Agent): μ¬μ©μμ λͺ λ Ήμ μ΄ν΄νκ³ μ€μ€λ‘ λꡬλ₯Ό μ ννκ³ μ¬μ©νμ¬ λ³΅μ‘ν κ³Όμ μ μννλ AI μμ€ν μ λλ€.
- λꡬ μ¬μ© (Tool Use): LLMμ΄ ν μ€νΈλ₯Ό μμ±νλ κ²λΏλ§ μλλΌ κ³μ°κΈ°, κ²μ μμ§, API λ± μΈλΆ νλ‘κ·Έλ¨μ νΈμΆνμ¬ μ 보λ₯Ό κ°μ Έμ€κ±°λ μ‘°μνλ λ₯λ ₯μ λλ€.
- μ€ν¬ (Skill): μμ΄μ νΈκ° νΉμ μμ μ μννκΈ° μν΄ μ¬μ©νλ μ¬μ¬μ© κ°λ₯ν μ½λ μ‘°κ°μ΄λ ν둬ννΈ ν νλ¦Ώμ λλ€.
- μν¬νλ‘μ° (Workflow): μ¬λ¬ λ¨κ³μ μμ μ΄ μμλλ‘ μ°κ²°λμ΄ νλμ 볡μ‘ν λͺ©νλ₯Ό λ¬μ±νλ κ³Όμ μ λλ€.
- λ‘κ·Έ λΆμ (Log Analysis): μμ€ν μ΄ μ¬μ©λλ©΄μ μμ±λλ κΈ°λ‘μ λΆμνμ¬ ν¨ν΄μ΄λ μ€λ₯ μμΈμ μ°Ύμλ΄λ κΈ°μ μ λλ€.
- νμΈ νλ (Fine-tuning) λ° ν둬ννΈ μμ§λμ΄λ§: λͺ¨λΈμ μ±λ₯μ λμ΄κΈ° μν΄ νλΌλ―Έν°λ₯Ό μ‘°μ νκ±°λ μ λ ₯ ν둬ννΈλ₯Ό μ΅μ ννλ λ°©λ²λ‘ μ λλ€.
- μμ€ν νλ₯΄μλ (System Persona): μλ³Όλ²μ²λΌ νΉμ μν (μ: κ΄λ¦¬μ, λΆμκ°)μ λΆμ¬λ°μ μλνλλ‘ μ€μ λ AIμ μ±κ²©μ΄λ μν μ μμ λλ€.
π μ΄λ² μ£Ό κ΄λ ¨ Deep Dive
| μμ | λ Όλ¬Έ | Deep Dive |
|---|---|---|
| π₯ | GrandCode: Achieving Grandmaster Leβ¦ | DD-061 |
| π₯ | Adamβs Law: Textual Frequency Law oβ¦ | DD-062 |
| π₯ | Video-MME-v2: Towards the Next Stagβ¦ | DD-063 |
| 4. | InCoder-32B-Thinking: Industrial Co⦠| DD-064 |
| 5. | SkillClaw: Let Skills Evolve Collecβ¦ | π νμ¬ λ¬Έμ |
π μμ±μΌ: 2026-04-12 | π€ GLM-4.7 Deep Dive