โ ๐ ์ด๋ฒ ์ฃผ Weekly Digest๋ก ๋์๊ฐ๊ธฐ
DD-079 Heterogeneous Scientific Foundation Model Collaboration
arXiv: 2604.27351 ๊ธฐ๊ด: University of Illinois at Urbana-Champaign Upvotes: 187 | Comments: 2 ์์: ์ด๋ฒ ์ฃผ Top 3
๋ ผ๋ฌธ ๋ฆฌ๋ทฐ: Heterogeneous Scientific Foundation Model Collaboration
1. ์ ์ด ๋ ผ๋ฌธ์ด ์ค์ํ๊ฐ?
ํ์ฌ์ AI ์์ด์ ํธ ์์คํ ์ ์ฃผ๋ก ํ ์คํธ๋ฅผ ๊ธฐ๋ฐ์ผ๋ก ์๋ํ๋ฉฐ, ์ด๋ ๋ณต์กํ ๊ณผํ์ ๋ฐ์ดํฐ๋ ์์, ์๊ณ์ด ๋ฐ์ดํฐ๋ฅผ ๋ค๋ฃจ๋ ๋ฐ์๋ ์น๋ช ์ ์ธ ํ๊ณ๊ฐ ์์ต๋๋ค. ์ด ๋ ผ๋ฌธ์ ์ธ์ด ๋ชจ๋ธ(Large Language Model)์ ์ถ๋ก ๋ฅ๋ ฅ๊ณผ ๋ถ์ผ๋ณ ์ ๋ฌธ ๊ธฐ์ด ๋ชจ๋ธ(Scientific Foundation Model)์ ์ ๋ฐํ ๊ณ์ฐ ๋ฅ๋ ฅ์ ์๋ก ๋ค๋ฅธ ์ข ์กฑ์ด ์ํตํ๋ โ์ฐจํค์ด๋ฃจ(Tsaheylu)โ ๋ฐฉ์์ผ๋ก ์ฐ๊ฒฐํฉ๋๋ค. ์ด๋ฅผ ํตํด ํ ์คํธ๋ง์ผ๋ก๋ ๋ถ๊ฐ๋ฅํ๋ ๊ณ ๋์ด๋ ๊ณผํ ๋ฌธ์ ํด๊ฒฐ์ ์ ํ๋๋ฅผ ๋์ด๊ณ , ๋น์ฉ๊ณผ ์์ ์๋ชจ๋ฅผ ํ๊ธฐ์ ์ผ๋ก ์ค์ด๋ ์๋ก์ด ํจ๋ฌ๋ค์์ ์ ์ํ์ต๋๋ค.
2. ํต์ฌ ์์ด๋์ด ์ฝ๊ฒ ์ดํดํ๊ธฐ
์ํ โ์๋ฐํโ์ ๊ฐ์ ํ์ ์์คํ
์ด ๋ ผ๋ฌธ์ ํต์ฌ ๋น์ ๋ ์ํ โ์๋ฐํโ์ ๋์ค๋ ํ๋๋ผ ํ์ฑ์ ์ํ๊ณ์ ๋๋ค. ์ํ์์ ๋๋น์กฑ(์ธ๊ฐ์ ๊ฐ๊น์ด ์ง์ฑ์ฒด)์ ๊ฐ์ข ๋๋ฌผ๋ค(๋ง, ์ดํฌ๋ ๋ฑ)๊ณผ ์ ๊ฒฝ์ ์ฐ๊ฒฐํ๋ โ์ฐจํค์ด๋ฃจโ๋ฅผ ํตํด ์๋ก์ ์๊ฐ์ ๊ณต์ ํ๊ณ ํ์ ํฉ๋๋ค.
์ด ๋ ผ๋ฌธ์์๋ ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ(LLM)์ โ๋๋น์กฑโ์ฒ๋ผ ์ํฉ์ ํ๋จํ๊ณ ์ ๋ต์ ์ธ์ฐ๋ ์งํ๊ด์ผ๋ก ๋ด ๋๋ค. ๋ฐ๋ฉด, ๋ ์จ๋ฅผ ์์ธกํ๊ฑฐ๋ ๋จ๋ฐฑ์ง ๊ตฌ์กฐ๋ฅผ ๋ถ์ํ๋ ์ ๋ฌธ ๊ธฐ์ด ๋ชจ๋ธ(Scientific Foundation Model)๋ค์ ๊ฐ์์ ํน์ํ ๋ฅ๋ ฅ์ ๊ฐ์ง โ๋๋ฌผโ๋ค์ ๋น์ ํ ์ ์์ต๋๋ค. ๊ธฐ์กด์๋ ์งํ๊ด์ด ์ง์ ๋ฐ์ด๋ค์ด ์ฒ์ ๋ค ๋ฌ๋ฆฌ๊ฑฐ๋(๋นํจ์จ), ์งํ๊ด์ด ๋๋ฌผ์ ์ธ์ด๋ฅผ ์ดํดํ์ง ๋ชปํด ์ํต์ด ์ ๋๋(์ ํ๋ ์ ํ) ๋ฌธ์ ๊ฐ ์์์ต๋๋ค. Eywa๋ ์ด ๋ ์ฌ์ด์ โ์ ๊ฒฝ ์ฐ๊ฒฐ(์ธํฐํ์ด์ค)โ์ ์ค์นํ์ฌ, ์งํ๊ด์ ๋ช ๋ น๋ง ๋ด๋ฆฌ๊ณ ์ ๋ฌธ๊ฐ๋ ๊ทธ์ ๋ง๋ ์์ง์์ ์ ํํ ์ํํ ๋ค ๊ฒฐ๊ณผ๋ฅผ ๋ค์ ์งํ๊ด์๊ฒ ์ ๋ฌํ๋ ์์คํ ์ ๋๋ค.
๋จ๊ณ๋ณ ๋์ ๊ณผ์
์ด ์์คํ ์ ํฌ๊ฒ ์ธ ๊ฐ์ง ๋จ๊ณ๋ก ์๋ํฉ๋๋ค.
์ฒซ์งธ, EywaAgent ๊ตฌ์ถ ๋จ๊ณ์ ๋๋ค. ์ธ์ด ๋ชจ๋ธ๊ณผ ์ ๋ฌธ ๋ชจ๋ธ ์ฌ์ด์ ๋ฒ์ญ๊ธฐ ๊ฐ์ ์ธํฐํ์ด์ค๋ฅผ ๋ง๋ญ๋๋ค. ์ธ์ด ๋ชจ๋ธ์ด โ๋ด์ผ์ ๋ ์จ๋ฅผ ๊ทธ๋ํ๋ก ๊ทธ๋ ค์คโ๋ผ๊ณ ๋ช ๋ นํ๋ฉด, ์ด ์ธํฐํ์ด์ค๊ฐ ๊ทธ ๋ช ๋ น์ ๋ ์จ ์์ธก ๋ชจ๋ธ์ด ์ดํดํ ์ ์๋ ๊ธฐ๊ณ์ด ๋ช ๋ น์ด๋ก ๋ฐ๊ฟ์ค๋๋ค.
๋์งธ, EywaMAS ํ์ ๋จ๊ณ์ ๋๋ค. ์ฌ๋ฌ ๊ฐ์ EywaAgent์ ์ผ๋ฐ ์ธ์ด ๋ชจ๋ธ ์์ด์ ํธ๊ฐ ํ๋์ ํ์ ์ด๋ฃน๋๋ค. ์๋ฅผ ๋ค์ด, ์ด๋ค ์์ด์ ํธ๋ ๋ ผ๋ฌธ์ ์ฝ๊ณ (์ธ์ด), ๋ค๋ฅธ ์์ด์ ํธ๋ ๊ทธ ๋ ผ๋ฌธ์ ์์์ ๊ฒ์ฆ(์ํ ๋ชจ๋ธ)ํ๋ ์์ผ๋ก ์๋ก ์ ๋ณด๋ฅผ ์ฃผ๊ณ ๋ฐ์ผ๋ฉฐ ๋ณตํฉ์ ์ธ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํฉ๋๋ค.
์ ์งธ, EywaOrchestra ์งํ ๋จ๊ณ์ ๋๋ค. ์ ์ฒด ์์คํ ์ ๊ฐ๋ ํ๋ ์งํ์๊ฐ ์ํฉ์ ๋ง์ถฐ ์ด๋ค ์์ด์ ํธ๋ฅผ ๊นจ์ธ์ง, ๋๊ตฌ์๊ฒ ์ผ์ ๋งก๊ธธ์ง ๋์ ์ผ๋ก ์กฐ์ ํฉ๋๋ค. ๋ณต์กํ ๋ฌธ์ ๊ฐ ๋ค์ด์ค๋ฉด ๊ด๋ จ๋ ์ ๋ฌธ๊ฐ๋ค์ ์์งํ๊ณ , ๊ฐ๋จํ ๋ฌธ์ ๋ฉด ๊ฐ๋ฒผ์ด ์์ด์ ํธ๋ฅผ ์ฒ๋ฆฌํ๊ฒ ํ๋ ์์ ๋๋ค.
ํต์ฌ ์๊ณ ๋ฆฌ์ฆ: FM-LLM Tsaheylu
์ด ๋ ผ๋ฌธ์ ๊ธฐ์ ์ ํต์ฌ์ ๋ ๋ชจ๋ธ ์ฌ์ด์ ์ํต์ ์ ์ํ ์์์ ๋๋ค.
์ ๋ฌธ ๋ชจ๋ธ์ $F_k$, ์ธ์ด ๋ชจ๋ธ์ $A_{LLM}$์ด๋ผ๊ณ ํ ๋, ์ด ๋์ ์ฐ๊ฒฐํ๋ ์ธํฐํ์ด์ค๋ ๋ ๊ฐ์ง ํจ์๋ก ๊ตฌ์ฑ๋ฉ๋๋ค.
์ฒซ ๋ฒ์งธ๋ **์ฟผ๋ฆฌ ์ปดํ์ผ๋ฌ(Query Compiler, $\phi_k$)**์ ๋๋ค. ์ด๊ฒ์ ์ธ์ด ๋ชจ๋ธ์ ์๊ฐ์ธ ์ํ(State, $S$)๋ฅผ ์ ๋ฌธ ๋ชจ๋ธ์ด ์ดํดํ ์ ์๋ ์ ์ด ์ ๋ ฅ(Control Input, $U_k$)์ผ๋ก ๋ณํํด์ค๋๋ค. ์ฆ, ์ธ๊ฐ์ ์ธ์ด๋ฅผ ๊ธฐ๊ณ์ ๋ช ๋ น์ด๋ก ๋ฒ์ญํ๋ ๊ณผ์ ์ ๋๋ค.
๋ ๋ฒ์งธ๋ **์๋ต ์ด๋ํฐ(Response Adapter, $\psi_k$)**์ ๋๋ค. ์ ๋ฌธ ๋ชจ๋ธ์ด ๊ณ์ฐํ ๊ฒฐ๊ณผ๋ฌผ(Output, $O_k$)์ ๋ค์ ์ธ์ด ๋ชจ๋ธ์ด ์ดํดํ๊ณ ์ถ๋ก ํ ์ ์๋ ๋ฌธ๋งฅ(Context, $Z_k$)์ผ๋ก ๋ฐ๊ฟ์ค๋๋ค. ์ฆ, ๋ณต์กํ ๋ฐ์ดํฐ ์ํธ๋ฅผ ๊ฐ๊ฒฐํ ๋ณด๊ณ ์ ์์ฝ๋ณธ์ผ๋ก ๋ฐ๊พธ๋ ๊ณผ์ ์ ๋๋ค.
์ด ๊ณผ์ ์ ํตํด ์ธ์ด ๋ชจ๋ธ์ ์ ๋ฌธ ๋ฐ์ดํฐ์ ํ์์ ๋ชฐ๋ผ๋, ๊ทธ ๊ฒฐ๊ณผ๋ฅผ ๋ฐํ์ผ๋ก ๋ค์ ๋จ๊ณ๋ฅผ ๊ณํํ ์ ์๊ฒ ๋ฉ๋๋ค.
3. ์คํ ๊ฒฐ๊ณผ ๋ถ์
์ฐ๊ตฌ์ง์ ๋ฌผ๋ฆฌํ, ์๋ช ๊ณผํ, ์ฌํ๊ณผํ ๋ฑ ๋ค์ํ ๋ถ์ผ๋ฅผ ์์ฐ๋ฅด๋ ์๋ก์ด ๋ฒค์น๋งํฌ์ธ EywaBench๋ฅผ ๊ตฌ์ถํ์ฌ ์ฑ๋ฅ์ ํ ์คํธํ์ต๋๋ค.
๊ธฐ์กด์ ์ธ์ด ๋ชจ๋ธ๋ง ์ฌ์ฉํ๋ ์์ด์ ํธ ์์คํ ๊ณผ ๋น๊ตํ์ ๋, Eywa๋ ํจ์ฌ ๋ ๋์ ๋ฌธ์ ํด๊ฒฐ ์ ํธ๋ฆฌํฐ(Utility)๋ฅผ ๋ณด์ฌ์ฃผ์์ต๋๋ค. ๊ตฌ์ฒด์ ์ธ ์์น๋ ๊ณต๊ฐ๋ ์์ฝ๋ฌธ์ ๋ช ์๋์ด ์์ง ์์ผ๋, ๋จ์ํ ํ ์คํธ๋ก ์ถ์ธกํ๋ ๊ธฐ์กด ๋ฐฉ์๊ณผ ๋ฌ๋ฆฌ ์ค์ ์ ๋ฌธ ๋ชจ๋ธ์ ์ฌ์ฉํ๊ธฐ ๋๋ฌธ์ ๊ณ์ฐ์ ์ ํ๋์์ ์๋์ ์ธ ์ฐ์๋ฅผ ์ ํ๋ค๊ณ ์ ์๋ค์ ์ฃผ์ฅํฉ๋๋ค.
ํนํ ์ฃผ๋ชฉํ ๋งํ ์ฑ๊ณผ๋ ๋น์ฉ ํจ์จ์ฑ์ ๋๋ค. ์ธ์ด ๋ชจ๋ธ์ด ๋ชจ๋ ๊ฒ์ ํ ์คํธ๋ก ์ฒ๋ฆฌํ๋ ค๋ฉด ์์ฒญ๋ ์์ ํ ํฐ(๊ธ์ ์)์ ์๋นํด์ผ ํ์ง๋ง, Eywa๋ ์ ๋ฌธ ๋ชจ๋ธ์๊ฒ ๊ณ์ฐ์ ์์ํจ์ผ๋ก์จ ๋ถํ์ํ ์ธ์ด์ ์๋ค ๊ฐ๋ค๋ฅผ ์ค์์ต๋๋ค. ์คํ ๊ฒฐ๊ณผ, ์ ์ฒด ํ ํฐ ์ฌ์ฉ๋๊ณผ ์ถ๋ก ๋น์ฉ(Inference Cost)์ด ์ ์๋ฏธํ๊ฒ ๊ฐ์ํ์ฌ, ์ค์ ์ฐ์ ํ์ฅ์์๋ ๊ฒฝ์ ์ ์ผ๋ก ์ฌ์ฉํ ์ ์์์ ์ ์ฆํ์ต๋๋ค.
4. ํ๊ณ์ ๊ณผ ํฅํ ์ฐ๊ตฌ ๋ฐฉํฅ
์ ์๋ค์ ์ด ํ๋ ์์ํฌ๋ฅผ ๊ตฌ์ถํ๊ธฐ ์ํด ๊ฐ ์ ๋ฌธ ๋ชจ๋ธ๋ณ๋ก ์ธํฐํ์ด์ค(์ปดํ์ผ๋ฌ์ ์ด๋ํฐ)๋ฅผ ์๋์ผ๋ก ์ค๊ณํด์ผ ํ๋ค๋ ์ ์ ํ๊ณ๋ก ๊ผฝ์์ต๋๋ค. ์๋ก์ด ๊ณผํ ๋ถ์ผ๊ฐ ์ถ๊ฐ๋ ๋๋ง๋ค ๊ฐ๋ฐ์๊ฐ ์ง์ ์ฐ๊ฒฐ ์ฅ์น๋ฅผ ์ฝ๋ฉํด์ผ ํ๋ค๋ ๋ป์ ๋๋ค.
๋ํ, ๋ค์์ ์์ด์ ํธ๊ฐ ๋์์ ํต์ ํ ๋ ๋ฐ์ํ ์ ์๋ ์ง์ฐ ์๊ฐ(Latency)์ด๋ ๋๊ท๋ชจ ์์คํ ์์์ ์ค์ผ์คํธ๋ ์ด์ ์ค๋ฒํค๋ ๊ฐ์ ๊ธฐ์ ์ ๋ฌธ์ ๋ค๋ ๋จ์ ์์ต๋๋ค.
ํฅํ ์ฐ๊ตฌ์์๋ ์ด๋ฌํ ์ธํฐํ์ด์ค๋ฅผ ์๋์ผ๋ก ์์ฑํ๊ฑฐ๋ ํ์ตํ๋ ๋ฐฉ๋ฒ์ ์ฐ๊ตฌํ๊ณ , ๋์ฑ ๋ณต์กํ๊ณ ๋์ ์ธ ์ค์๊ฐ ํ์ ํ๊ฒฝ์ผ๋ก ํ์ฅํ๋ ๊ฒ์ ๋ชฉํ๋ก ํฉ๋๋ค.
5. ์ค๋ฌด ์ ์ฉ ๊ฐ๋ฅ์ฑ
์ด ํ๋ ์์ํฌ๋ ์ ์ฝ ํ์ฌ์ ์ ์ฝ ๊ฐ๋ฐ์ด๋ ๊ธฐ์ ์์ธก ๊ธฐ๊ด ๊ฐ์ ๊ณผํ ๊ธฐ์ ๊ธฐ์ ์ ๋ฐ๋ก ์ ์ฉํ ์ ์์ต๋๋ค. ์๋ฅผ ๋ค์ด, ์ฐ๊ตฌ์์ด โ์์ธ ํ์ด๋จธ ์น๋ฃ์ ๊ฐ๋ฅํ ๋ถ์ ๊ตฌ์กฐ๋ฅผ ์ฐพ์์คโ๋ผ๊ณ ์์ฒญํ๋ฉด, ์์คํ ์ด ์๋์ผ๋ก ํํ ๊ตฌ์กฐ ์์ธก ๋ชจ๋ธ์ ๋๋ ค ํ๋ณด๊ตฐ์ ์ถ์ฒํ๊ณ , ์ด๋ฅผ ๋ฐํ์ผ๋ก ์ธ์ด ๋ชจ๋ธ์ด ๋ณด๊ณ ์๋ฅผ ์์ฑํด์ฃผ๋ ์์ ์๋ํ๋ ์ํฌํ๋ก์ฐ๋ฅผ ๊ตฌ์ถํ ์ ์์ต๋๋ค.
์ ์ฉ์ ์ํด์๋ ๊ณ ํ์ง์ ์ธ์ด ๋ชจ๋ธ(์: GPT-4 ๋ฑ)๊ณผ ๋๋ฉ์ธ๋ณ ์ ๋ฌธ ๊ธฐ์ด ๋ชจ๋ธ(์: ๋จ๋ฐฑ์ง ์ ํ ์์ธก ๋ชจ๋ธ ๋ฑ)์ ๋ํ ์ ๊ทผ ๊ถํ์ด ํ์ํฉ๋๋ค. ๋ํ, ์ด ๋์ ์ฐ๊ฒฐํ๋ API ์๋ฒ์ ๊ฐ๋จํ ์ฐ๊ฒฐ ๋ก์ง์ ๊ตฌํํ ์ ์๋ ๊ฐ๋ฐ ์ธ๋ ฅ์ด ์์๋ฉ๋๋ค. GPU ์์์ ๊ฐ ๋ชจ๋ธ์ ํธ์คํ ํ๋ ํ๊ฒฝ์ ๋ฐ๋ผ ๋ฌ๋ผ์ง์ง๋ง, ์ธ์ด ๋ชจ๋ธ์ ์ฐ์ฐ๋์ ์ค์ฌ์ฃผ๋ฏ๋ก ์ ์ฒด์ ์ธ ์๋ฒ ๋ถํ๋ฅผ ๋ฎ์ถ๋ ํจ๊ณผ๋ ๊ธฐ๋ํ ์ ์์ต๋๋ค.
6. ์ด ๋ ผ๋ฌธ์ ์ดํดํ๊ธฐ ์ํ ์ฌ์ ์ง์
- Large Language Model (LLM, ๋๊ท๋ชจ ์ธ์ด ๋ชจ๋ธ): GPT๋ Claude์ฒ๋ผ ๋ฐฉ๋ํ ํ ์คํธ ๋ฐ์ดํฐ๋ก ํ์ตํ์ฌ ์์ฐ์ด๋ฅผ ์ดํดํ๊ณ ์์ฑํ๋ ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ์ ๋๋ค.
- Foundation Model (๊ธฐ์ด ๋ชจ๋ธ): ๊ด๋ฒ์ํ ๋ฐ์ดํฐ๋ก ์ฌ์ ํ์ต๋์ด ์ฌ๋ฌ ๋ค์ด์คํธ๋ฆผ ์์ ์ ์ ์ฉ ๊ฐ๋ฅํ ๊ฑฐ๋ ๋ชจ๋ธ์ ์๋ฏธํ๋ฉฐ, ์ฌ๊ธฐ์๋ ์ธ์ด๊ฐ ์๋ ๊ณผํ ๋ฐ์ดํฐ ์ ์ฉ ๋ชจ๋ธ์ ๋ปํฉ๋๋ค.
- Agentic AI (์์ด์ ํธํ AI): ์ฌ์ฉ์์ ์์ฒญ๋ง ๋ฐ๋ ๊ฒ์ด ์๋๋ผ ์ค์ค๋ก ์ํฉ์ ํ๋จํ๊ณ ๋๊ตฌ๋ฅผ ์ฌ์ฉํ์ฌ ๋ชฉํ๋ฅผ ๋ฌ์ฑํ๋ ค๋ ์์จ์ ์ธ AI ์์คํ ์ ๋๋ค.
- Inference (์ถ๋ก ): ํ์ต๋ ๋ชจ๋ธ์ ์ฌ์ฉํ์ฌ ์๋ก์ด ๋ฐ์ดํฐ์ ๋ํ ๊ฒฐ๊ณผ๋ฅผ ์์ธกํ๊ฑฐ๋ ์์ฑํ๋ ๊ณผ์ ์ ๋๋ค.
- Modality (๋ชจ๋ฌ๋ฆฌํฐ): ๋ฐ์ดํฐ์ ํํ๋ฅผ ์๋ฏธํฉ๋๋ค. ํ ์คํธ, ์ด๋ฏธ์ง, ์ค๋์ค, ์์, ์๊ณ์ด ๋ฐ์ดํฐ ๋ฑ์ด ์๋ก ๋ค๋ฅธ ๋ชจ๋ฌ๋ฆฌํฐ์ ์ํฉ๋๋ค.
- API (Application Programming Interface): ํ๋ก๊ทธ๋จ๋ค์ด ์๋ก ํต์ ํ๊ธฐ ์ํด ์ฌ์ฉํ๋ ๊ท์น์ด๋ ์ธํฐํ์ด์ค๋ก, ์ฌ๊ธฐ์๋ ์ธ์ด ๋ชจ๋ธ๊ณผ ์ ๋ฌธ ๋ชจ๋ธ์ด ๋ํํ๋ ์ฐฝ๊ตฌ ์ญํ ์ ํฉ๋๋ค.
- Orchestration (์ค์ผ์คํธ๋ ์ด์ ): ์ฌ๋ฌ ๊ฐ์ ์ํํธ์จ์ด ๊ตฌ์ฑ ์์๋ ์๋น์ค๋ฅผ ์กฐ์จํ์ฌ ํ๋์ ์์ ์ ์ํํ๋๋ก ๊ด๋ฆฌํ๋ ๊ธฐ์ ์ ๋๋ค.
๐ ์ด๋ฒ ์ฃผ ๊ด๋ จ Deep Dive
| ์์ | ๋ ผ๋ฌธ | Deep Dive |
|---|---|---|
| ๐ฅ | Recursive Multi-Agent Systems | DD-077 |
| ๐ฅ | Agentic World Modeling: Foundationsโฆ | DD-078 |
| ๐ฅ | Heterogeneous Scientific Foundationโฆ | ๐ ํ์ฌ ๋ฌธ์ |
| 4. | From Skills to Talent: Organising Hโฆ | DD-080 |
| 5. | World-R1: Reinforcing 3D Constraintโฆ | DD-081 |
๐ ์์ฑ์ผ: 2026-05-03 | ๐ค GLM-4.7 Deep Dive