โ† ๐Ÿ“š ์ด๋ฒˆ ์ฃผ Weekly Digest๋กœ ๋Œ์•„๊ฐ€๊ธฐ

DD-071 QuanBench+: A Unified Multi-Framework Benchmark for LLM-Based Quantum Code Generation

arXiv: 2604.08570 ๊ธฐ๊ด€: American University of Beirut Upvotes: 121 | Comments: 5 ์ˆœ์œ„: ์ด๋ฒˆ ์ฃผ Top 5


๋…ผ๋ฌธ ๋ถ„์„: QuanBench+: A Unified Multi-Framework Benchmark for LLM-Based Quantum Code Generation

1. ์™œ ์ด ๋…ผ๋ฌธ์ด ์ค‘์š”ํ•œ๊ฐ€?

๊ธฐ์กด์˜ ์–‘์ž ์ฝ”๋“œ ์ƒ์„ฑ ๋ฒค์น˜๋งˆํฌ๋Š” ํŠน์ • ํ”„๋ ˆ์ž„์›Œํฌ, ์˜ˆ๋ฅผ ๋“ค์–ด Qiskit์ด๋‚˜ Cirq ์ค‘ ํ•˜๋‚˜์—๋งŒ ์ง‘์ค‘ํ•˜์—ฌ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๋ชจ๋ธ์ด ์ฝ”๋“œ๋ฅผ ๋ชป ์ƒ์„ฑํ•œ ์ด์œ ๊ฐ€ ์–‘์ž ์—ญํ•™์— ๋Œ€ํ•œ ์ดํ•ด ๋ถ€์กฑ์ธ์ง€, ์•„๋‹ˆ๋ฉด ๋‹จ์ˆœํžˆ ํŠน์ • ๋ผ์ด๋ธŒ๋Ÿฌ๋ฆฌ์˜ ๋ฌธ๋ฒ•์„ ๋ชฐ๋ผ์„œ ๊ทธ๋Ÿฐ ๊ฒƒ์ธ์ง€ ๊ตฌ๋ณ„ํ•˜๊ธฐ ์–ด๋ ต๊ฒŒ ๋งŒ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ ์„ธ ๊ฐ€์ง€ ์ฃผ์š” ์–‘์ž ํ”„๋กœ๊ทธ๋ž˜๋ฐ ํ”„๋ ˆ์ž„์›Œํฌ(Qiskit, PennyLane, Cirq)๋ฅผ ์•„์šฐ๋ฅด๋Š” ํ†ตํ•ฉ ๋ฒค์น˜๋งˆํฌ(QuanBench+)๋ฅผ ์ œ์‹œํ•˜์—ฌ, ๋ชจ๋ธ์˜ ์ˆœ์ˆ˜ํ•œ ์–‘์ž์  ์‚ฌ๊ณ  ๋Šฅ๋ ฅ๊ณผ ํ”„๋ ˆ์ž„์›Œํฌ ๊ตฌํ˜„ ๋Šฅ๋ ฅ์„ ๋ถ„๋ฆฌํ•˜์—ฌ ํ‰๊ฐ€ํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ์ค€์„ ๋งˆ๋ จํ–ˆ์Šต๋‹ˆ๋‹ค.

2. ํ•ต์‹ฌ ์•„์ด๋””์–ด ์‰ฝ๊ฒŒ ์ดํ•ดํ•˜๊ธฐ

์š”๋ฆฌ์‚ฌ์™€ ์ฃผ๋ฐฉ ๊ธฐ๊ตฌ ๋น„์œ 

์ด ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ์„ ์ดํ•ดํ•˜๋ ค๋ฉด โ€˜์š”๋ฆฌ์‚ฌโ€™์™€ โ€˜์ฃผ๋ฐฉ ๊ธฐ๊ตฌโ€™๋ฅผ ๋น„์œ ๋กœ ๋“ค๋ฉด ์ข‹์Šต๋‹ˆ๋‹ค. ์–‘์ž ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์„ค๊ณ„ํ•˜๋Š” ๋Šฅ๋ ฅ์€ โ€˜์š”๋ฆฌ์‚ฌ์˜ ๋ ˆ์‹œํ”ผ ์ดํ•ด๋„โ€™์ด๊ณ , ์ด๋ฅผ Qiskit์ด๋‚˜ Cirq ๊ฐ™์€ ์–ธ์–ด๋กœ ๊ตฌํ˜„ํ•˜๋Š” ๊ฒƒ์€ โ€˜ํŠน์ • ๋ธŒ๋žœ๋“œ์˜ ๋ธ”๋ Œ๋”๋‚˜ ์˜ค๋ธ ์‚ฌ์šฉ๋ฒ•โ€™๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๊ธฐ์กด ํ‰๊ฐ€๋Š” โ€œ์‚ผ์„ฑ ์˜ค๋ธ์—์„œ๋งŒ ์š”๋ฆฌํ•˜๊ฒŒ ์‹œ์ผœ์„œโ€ ์š”๋ฆฌ์‚ฌ๊ฐ€ ์š”๋ฆฌ๋ฅผ ๋ชป ํ•˜๋Š” ๊ฑด์ง€, ์˜ค๋ธ ์‚ฌ์šฉ๋ฒ•์„ ๋ชฐ๋ผ์„œ ๋ชป ํ•˜๋Š” ๊ฑด์ง€ ์•Œ ์ˆ˜ ์—†์—ˆ์Šต๋‹ˆ๋‹ค. QuanBench+๋Š” ๋™์ผํ•œ ์š”๋ฆฌ(์–‘์ž ๊ณผ์ œ)๋ฅผ ์‚ผ์„ฑ, LG, ๋‹ค์ด์Šจ ์ฃผ๋ฐฉ(๊ฐ๊ธฐ ๋‹ค๋ฅธ ํ”„๋ ˆ์ž„์›Œํฌ)์—์„œ ๋ชจ๋‘ ํ•ด๋ณด๊ฒŒ ํ•˜์—ฌ, ์ง„์งœ ์š”๋ฆฌ ์‹ค๋ ฅ(์–‘์ž ์ถ”๋ก  ๋Šฅ๋ ฅ)์„ ํ‰๊ฐ€ํ•ฉ๋‹ˆ๋‹ค.

๋™์ž‘ ๊ณผ์ •

์ฒซ์งธ, ์—ฐ๊ตฌ์ง„์€ ์–‘์ž ์•Œ๊ณ ๋ฆฌ์ฆ˜, ๊ฒŒ์ดํŠธ ๋ถ„ํ•ด, ์ƒํƒœ ์ค€๋น„ ๋“ฑ 42๊ฐ€์ง€์˜ ๊ณผ์ œ๋ฅผ ์ค€๋น„ํ•ฉ๋‹ˆ๋‹ค. ๋‘˜์งธ, ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์—๊ฒŒ ์ด ๊ณผ์ œ๋ฅผ Qiskit, PennyLane, Cirq ์„ธ ๊ฐ€์ง€ ๋ฒ„์ „์œผ๋กœ ๊ฐ๊ฐ ์ฝ”๋“œ๋ฅผ ์ž‘์„ฑํ•˜๋ผ๊ณ  ์š”์ฒญํ•ฉ๋‹ˆ๋‹ค. ์…‹์งธ, ์ž‘์„ฑ๋œ ์ฝ”๋“œ๋ฅผ ์‹ค์ œ๋กœ ์‹คํ–‰์‹œ์ผœ ๋ณด๋Š”๋ฐ, ์—ฌ๊ธฐ์„œ ์ค‘์š”ํ•œ ์ ์€ ์–‘์ž ์ปดํ“จํ„ฐ์˜ ๊ฒฐ๊ณผ๋Š” ํ™•๋ฅ ์ ์ด๋ผ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๋”ฐ๋ผ์„œ ๋‹จ์ˆœํžˆ ์ •๋‹ต๊ณผ ์˜ค๋‹ต์„ ๋‚˜๋ˆ„๋Š” ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ๋ชจ๋ธ์ด ๋งŒ๋“ค์–ด๋‚ธ ํ™•๋ฅ  ๋ถ„ํฌ๊ฐ€ ์ •๋‹ต ๋ถ„ํฌ์™€ ์–ผ๋งˆ๋‚˜ ๋น„์Šทํ•œ์ง€๋ฅผ ์ˆ˜ํ•™์ ์œผ๋กœ ๊ฒ€์ฆํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์ง€๋ง‰์œผ๋กœ, ์‹คํ–‰ ์˜ค๋ฅ˜๊ฐ€ ๋ฐœ์ƒํ–ˆ์„ ๋•Œ ๋ชจ๋ธ์ด ํ”ผ๋“œ๋ฐฑ์„ ๋ฐ›์•„ ์Šค์Šค๋กœ ์ฝ”๋“œ๋ฅผ ์ˆ˜์ •ํ•  ์ˆ˜ ์žˆ๋Š”์ง€๊นŒ์ง€ ํ…Œ์ŠคํŠธํ•ฉ๋‹ˆ๋‹ค.

ํ•ต์‹ฌ ๊ฐœ๋…: ํ™•๋ฅ ์  ์ถœ๋ ฅ๊ณผ KL ๋ฐœ์‚ฐ

์ผ๋ฐ˜์ ์ธ ์ฝ”๋”ฉ ํ…Œ์ŠคํŠธ๋Š” โ€˜1+1โ€™์„ ๋ฌผ์–ด๋ณด๊ณ  โ€˜2โ€™๊ฐ€ ๋‚˜์˜ค๋ฉด ๋งž์Šต๋‹ˆ๋‹ค. ํ•˜์ง€๋งŒ ์–‘์ž ์ปดํ“จํ„ฐ๋Š” ๋™์ „ ๋˜์ง€๊ธฐ์ฒ˜๋Ÿผ ๊ฒฐ๊ณผ๊ฐ€ ํ™•๋ฅ ์ ์œผ๋กœ ๋‚˜์˜ต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด โ€˜0โ€™์ด 50%, โ€˜1โ€™์ด 50% ๋‚˜์™€์•ผ ํ•˜๋Š” ์ƒํƒœ์—์„œ, ๋ชจ๋ธ์ด ๋งŒ๋“  ์ฝ”๋“œ๊ฐ€ โ€˜0โ€™์ด 51%, โ€˜1โ€™์ด 49%๊ฐ€ ๋‚˜์˜จ๋‹ค๋ฉด ์ด๋Š” ๊ฑฐ์˜ ์ •๋‹ต์ž…๋‹ˆ๋‹ค. ๋…ผ๋ฌธ์—์„œ๋Š” ์ด ๋‘ ํ™•๋ฅ  ๋ถ„ํฌ์˜ ์ฐจ์ด๋ฅผ ์žฌ๊ธฐ ์œ„ํ•ด KL ๋ฐœ์‚ฐ(KL-Divergence)์ด๋ผ๋Š” ์ง€ํ‘œ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค. ์ด ๊ฐ’์ด 0.05 ์ดํ•˜์ด๋ฉด ๋‘ ํ™•๋ฅ  ๋ถ„ํฌ๊ฐ€ ์‚ฌ์‹ค์ƒ ๊ฐ™๋‹ค๊ณ  ํŒ๋‹จํ•˜์—ฌ ์ •๋‹ต์œผ๋กœ ์ธ์ •ํ•ฉ๋‹ˆ๋‹ค.

3. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ถ„์„

๋ฒค์น˜๋งˆํฌ ๋ฐ ๋ชจ๋ธ ์„ฑ๋Šฅ

์—ฐ๊ตฌ์ง„์€ QuanBench+๋ผ๋Š” 42๊ฐœ์˜ ๊ณผ์ œ ๋ฐ์ดํ„ฐ์…‹์„ ์‚ฌ์šฉํ•˜์—ฌ ์ตœ์‹  LLM๋“ค์„ ํ‰๊ฐ€ํ–ˆ์Šต๋‹ˆ๋‹ค. ๊ฐ€์žฅ ๊ฐ•๋ ฅํ•œ ๋ชจ๋ธ์˜ ๊ฒฝ์šฐ, ํ•œ ๋ฒˆ์˜ ์‹œ๋„(One-shot)๋กœ ์ •๋‹ต์„ ๋งžํžŒ ๋น„์œจ์ธ Pass@1์€ Qiskit์—์„œ 59.5%, Cirq์—์„œ 54.8%, PennyLane์—์„œ 42.9%๋ฅผ ๊ธฐ๋กํ–ˆ์Šต๋‹ˆ๋‹ค. ์ด๋Š” ๊ฐ™์€ ์–‘์ž ๋ฌธ์ œ๋ฅผ ํ’€๋”๋ผ๋„ ์‚ฌ์šฉํ•˜๋Š” ํ”„๋ ˆ์ž„์›Œํฌ์— ๋”ฐ๋ผ ์„ฑ๋Šฅ ์ฐจ์ด๊ฐ€ ๊ฝค ๋‚œ๋‹ค๋Š” ๊ฒƒ์„ ๋ณด์—ฌ์ค๋‹ˆ๋‹ค.

ํ”ผ๋“œ๋ฐฑ ๊ธฐ๋ฐ˜ ์ˆ˜์ •์˜ ํšจ๊ณผ

๊ฐ€์žฅ ์ฃผ๋ชฉํ•  ๋งŒํ•œ ๊ฒฐ๊ณผ๋Š” ์‹คํ–‰ ์˜ค๋ฅ˜ ๋ฉ”์‹œ์ง€๋‚˜ ํ‹€๋ฆฐ ๋‹ต์„ ํ”ผ๋“œ๋ฐฑ์œผ๋กœ ์ฃผ์—ˆ์„ ๋•Œ์ž…๋‹ˆ๋‹ค. ๋ชจ๋ธ์ด ์Šค์Šค๋กœ ์ฝ”๋“œ๋ฅผ ์ˆ˜์ •ํ•  ๊ธฐํšŒ๋ฅผ ์ฃผ๋ฉด(Repair), ์„ฑ๋Šฅ์ด ํฌ๊ฒŒ ํ–ฅ์ƒ๋˜์—ˆ์Šต๋‹ˆ๋‹ค. Qiskit์˜ ๊ฒฝ์šฐ 59.5%์—์„œ 83.3%๋กœ, Cirq๋Š” 54.8%์—์„œ 76.2%๋กœ, PennyLane์€ 42.9%์—์„œ 66.7%๋กœ ๊ฐ๊ฐ ๋›ฐ์–ด์˜ฌ๋ž์Šต๋‹ˆ๋‹ค. ์ด๋Š” LLM์ด ์–‘์ž ์ฝ”๋“œ ์ž‘์„ฑ ์‹œ ์ดˆ๊ธฐ์—๋Š” ์‹ค์ˆ˜๋ฅผ ํ•˜๋”๋ผ๋„ ๋””๋ฒ„๊น… ๊ณผ์ •์„ ํ†ตํ•ด ํ›จ์”ฌ ๋” ์ •ํ™•ํ•œ ์ฝ”๋“œ๋ฅผ ๋งŒ๋“ค์–ด๋‚ผ ์ˆ˜ ์žˆ์Œ์„ ์‹œ์‚ฌํ•ฉ๋‹ˆ๋‹ค.

4. ํ•œ๊ณ„์ ๊ณผ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

์ €์ž๋“ค์€ QuanBench+๊ฐ€ 42๊ฐœ์˜ ๊ณผ์ œ๋กœ ๊ตฌ์„ฑ๋˜์–ด ์žˆ์ง€๋งŒ, ์–‘์ž ์ปดํ“จํŒ… ์ „์ฒด ์˜์—ญ์„ ์•„์šฐ๋ฅด๊ธฐ์—๋Š” ์•„์ง ๊ทœ๋ชจ๊ฐ€ ์ž‘์„ ์ˆ˜ ์žˆ๋‹ค๊ณ  ์ธ์ •ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ, ํ˜„์žฌ์˜ ํ‰๊ฐ€ ๋ฐฉ์‹์ด โ€˜๊ณผ์ œ๊ฐ€ ์„ฑ๊ณต์ ์œผ๋กœ ์ˆ˜ํ–‰๋˜์—ˆ๋Š”๊ฐ€โ€™์— ์ง‘์ค‘๋˜์–ด ์žˆ์–ด, ์ฝ”๋“œ์˜ ๋‚ด๋ถ€ ๊ตฌ์กฐ๊ฐ€ ์ตœ์ ํ™”๋˜์–ด ์žˆ๋Š”์ง€(์˜ˆ: ์–‘์ž ๊ฒŒ์ดํŠธ ์ˆ˜ ์ตœ์†Œํ™”)์— ๋Œ€ํ•ด์„œ๋Š” ์ถฉ๋ถ„ํžˆ ํ‰๊ฐ€ํ•˜์ง€ ๋ชปํ•œ๋‹ค๋Š” ํ•œ๊ณ„๋ฅผ ์ง€์ ํ•ฉ๋‹ˆ๋‹ค. ํ–ฅํ›„ ์—ฐ๊ตฌ์—์„œ๋Š” ๋” ๋‹ค์–‘ํ•œ ์–‘์ž ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ํฌํ•จํ•˜๊ณ , ๋‹จ์ˆœ ์‹คํ–‰ ๊ฐ€๋Šฅ์„ฑ์„ ๋„˜์–ด ์ฝ”๋“œ์˜ ํšจ์œจ์„ฑ์ด๋‚˜ ์‹ค์ œ ํ•˜๋“œ์›จ์–ด์—์„œ์˜ ํ˜ธํ™˜์„ฑ์„ ํ‰๊ฐ€ํ•˜๋Š” ๋ฐฉํ–ฅ์œผ๋กœ ํ™•์žฅ๋  ํ•„์š”๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

5. ์‹ค๋ฌด ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ

์ด ๋…ผ๋ฌธ์˜ ๊ฒฐ๊ณผ๋Š” ์–‘์ž ์†Œํ”„ํŠธ์›จ์–ด ๊ฐœ๋ฐœ ๋„๊ตฌ๋ฅผ ๋งŒ๋“œ๋Š” ๊ธฐ์—…์ด๋‚˜ ์—ฐ๊ตฌ์†Œ์— ์ฆ‰์‹œ ์ ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ์–‘์ž ์•Œ๊ณ ๋ฆฌ์ฆ˜์„ ์ž๋™์œผ๋กœ ์ƒ์„ฑํ•ด์ฃผ๋Š” ์ฝ”ํŒŒ์ผ๋Ÿฟ(Copilot) ์‹œ์Šคํ…œ์„ ๊ฐœ๋ฐœํ•  ๋•Œ, ์ด ๋ฒค์น˜๋งˆํฌ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๋ชจ๋ธ์ด ํŠน์ • ํ”„๋ ˆ์ž„์›Œํฌ์—๋งŒ ํŽธํ–ฅ๋˜์ง€ ์•Š๊ณ  ๋ฒ”์šฉ์ ์œผ๋กœ ์ž˜ ์ž‘๋™ํ•˜๋Š”์ง€ ํ…Œ์ŠคํŠธํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฆฌ์†Œ์Šค ์ธก๋ฉด์—์„œ๋Š” ์‹ค์ œ ์–‘์ž ํ•˜๋“œ์›จ์–ด๊ฐ€ ํ•„์š”ํ•œ ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ์ผ๋ฐ˜ ๊ณ ์„ฑ๋Šฅ ์ปดํ“จํ„ฐ๋‚˜ ํด๋ผ์šฐ๋“œ ํ™˜๊ฒฝ์—์„œ ์–‘์ž ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ๋ฅผ ๋Œ๋ฆด ์ˆ˜ ์žˆ๋Š” ์ •๋„์˜ ํŒŒ์›Œ๋งŒ ์žˆ์œผ๋ฉด ํ‰๊ฐ€๊ฐ€ ๊ฐ€๋Šฅํ•˜๋ฏ€๋กœ ์ ‘๊ทผ์„ฑ์ด ๋†’์Šต๋‹ˆ๋‹ค.

6. ์ด ๋…ผ๋ฌธ์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•œ ์‚ฌ์ „ ์ง€์‹

  • LLM(Large Language Model): ๋ฐฉ๋Œ€ํ•œ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋กœ ํ•™์Šตํ•˜์—ฌ ์ธ๊ฐ„์ฒ˜๋Ÿผ ์ž์—ฐ์–ด๋ฅผ ์ดํ•ดํ•˜๊ณ  ์ƒ์„ฑํ•˜๋Š” ์ธ๊ณต์ง€๋Šฅ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.
  • ์–‘์ž ์ปดํ“จํŒ…(Quantum Computing): ์ค‘์ฒฉ๊ณผ ์–ฝํž˜ ๊ฐ™์€ ์–‘์ž ์—ญํ•™์  ํ˜„์ƒ์„ ์ด์šฉํ•˜์—ฌ ์—ฐ์‚ฐ์„ ์ˆ˜ํ–‰ํ•˜๋Š” ์ฐจ์„ธ๋Œ€ ์ปดํ“จํŒ… ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.
  • Qiskit, PennyLane, Cirq: IBM, Xanadu, Google ๋“ฑ์—์„œ ๊ฐœ๋ฐœํ•œ ์–‘์ž ์ปดํ“จํŒ… ํ”„๋กœ๊ทธ๋žจ์„ ์ž‘์„ฑํ•˜๊ธฐ ์œ„ํ•œ ๋Œ€ํ‘œ์ ์ธ ์†Œํ”„ํŠธ์›จ์–ด ํ”„๋ ˆ์ž„์›Œํฌ์ž…๋‹ˆ๋‹ค.
  • ํ™•๋ฅ  ๋ถ„ํฌ(Probability Distribution): ์‹คํ—˜์ด๋‚˜ ์‚ฌ๊ฑด์—์„œ ์ผ์–ด๋‚  ์ˆ˜ ์žˆ๋Š” ๋ชจ๋“  ๊ฒฐ๊ณผ์— ๋Œ€ํ•œ ํ™•๋ฅ ๊ฐ’์˜ ๋ชฉ๋ก์ž…๋‹ˆ๋‹ค. ์–‘์ž ์ปดํ“จํ„ฐ์˜ ์ธก์ • ๊ฒฐ๊ณผ๋Š” ์ด ๋ถ„ํฌ๋กœ ํ‘œํ˜„๋ฉ๋‹ˆ๋‹ค.
  • KL ๋ฐœ์‚ฐ(Kullback-Leibler Divergence): ๋‘ ํ™•๋ฅ  ๋ถ„ํฌ ๊ฐ„์˜ ์ฐจ์ด๋ฅผ ์ธก์ •ํ•˜๋Š” ๊ฐ’์œผ๋กœ, 0์— ๊ฐ€๊นŒ์šธ์ˆ˜๋ก ๋‘ ๋ถ„ํฌ๊ฐ€ ์„œ๋กœ ๊ฐ™์Œ์„ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.
  • Pass@k: ์ฝ”๋“œ ์ƒ์„ฑ ๋ชจ๋ธ์ด k๊ฐœ์˜ ๋‹ต์•ˆ์„ ์ƒ์„ฑํ–ˆ์„ ๋•Œ, ๊ทธ์ค‘ ์ ์–ด๋„ ํ•˜๋‚˜๊ฐ€ ์ •๋‹ต์ผ ํ™•๋ฅ ์„ ๋‚˜ํƒ€๋‚ด๋Š” ํ‰๊ฐ€ ์ง€ํ‘œ์ž…๋‹ˆ๋‹ค.
  • ์‹œ๋ฎฌ๋ ˆ์ดํ„ฐ(Simulator): ์‹ค์ œ ์–‘์ž ํ•˜๋“œ์›จ์–ด ์—†์ด ์ปดํ“จํ„ฐ ์ƒ์—์„œ ์–‘์ž ํšŒ๋กœ์˜ ๋™์ž‘์„ ๋ชจ์‚ฌํ•˜์—ฌ ์‹คํ—˜ํ•ด ๋ณผ ์ˆ˜ ์žˆ๋Š” ์†Œํ”„ํŠธ์›จ์–ด ๋„๊ตฌ์ž…๋‹ˆ๋‹ค.

๐Ÿ“š ์ด๋ฒˆ ์ฃผ ๊ด€๋ จ Deep Dive

์ˆœ์œ„๋…ผ๋ฌธDeep Dive
๐Ÿฅ‡WildDet3D: Scaling Promptable 3D Deโ€ฆDD-067
๐ŸฅˆSeedance 2.0: Advancing Video Generโ€ฆDD-068
๐Ÿฅ‰The Past Is Not Past: Memory-Enhancโ€ฆDD-069
4.ClawGUI: A Unified Framework for Trโ€ฆDD-070
5.QuanBench+: A Unified Multi-Framewoโ€ฆ๐Ÿ“ ํ˜„์žฌ ๋ฌธ์„œ

๐Ÿ“… ์ƒ์„ฑ์ผ: 2026-04-19 | ๐Ÿค– GLM-4.7 Deep Dive