← πŸ“š 이번 μ£Ό Weekly Digest둜 λŒμ•„κ°€κΈ°

DD-072 Tstars-Tryon 1.0: Robust and Realistic Virtual Try-On for Diverse Fashion Items

arXiv: 2604.19748 κΈ°κ΄€: alibaba-inc Upvotes: 244 | Comments: 7 μˆœμœ„: 이번 μ£Ό Top 1


μ•ˆλ…•ν•˜μ„Έμš”! AI/ML μ „λ¬Έκ°€μ΄μž λ…Όλ¬Έ λ¦¬λ·°μ–΄λ‘œμ„œ, Tstars-Tryon 1.0 논문을 μ£Όλ‹ˆμ–΄ κ°œλ°œμžλ„ μ‰½κ²Œ 이해할 수 μžˆλ„λ‘ 심측 뢄석해 λ“œλ¦¬κ² μŠ΅λ‹ˆλ‹€. 이 논문은 μ‹€μ œ μƒμš©ν™” ν™˜κ²½μ—μ„œ μ–Όλ§ˆλ‚˜ κ°•λ ₯ν•˜κ³  효율적인 가상 ν”ΌνŒ… 기술이 ν•„μš”ν•œμ§€λ₯Ό 잘 λ³΄μ—¬μ£ΌλŠ” μ‚¬λ‘€μž…λ‹ˆλ‹€.

μš”μ²­ν•˜μ‹  ν˜•μ‹μ— 맞좰 상세 뢄석을 μ‹œμž‘ν•˜κ² μŠ΅λ‹ˆλ‹€.


1. μ™œ 이 논문이 μ€‘μš”ν•œκ°€?

기쑴의 가상 ν”ΌνŒ… 연ꡬ듀은 κΉ¨λ—ν•œ μ •λ©΄ μ‚¬μ§„μ΄λ‚˜ λ‹¨μˆœν•œ μ˜·μ—μ„œλŠ” 잘 μž‘λ™ν–ˆμ§€λ§Œ, μ‹€μ œ μ‚¬μš©μžκ°€ 찍은 μ–΄λ‘μš΄ 사진, 흔듀린 사진, κ³Όκ²©ν•œ 포즈 λ“± ν˜„μ‹€μ˜ λ³΅μž‘ν•œ 상황(In-the-wild)μ—μ„œλŠ” μ„±λŠ₯이 κΈ‰κ²©νžˆ λ–¨μ–΄μ§€λŠ” ν•œκ³„κ°€ μžˆμ—ˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ μƒμš©ν™” μ„œλΉ„μŠ€μ— μ μš©ν•˜κΈ°μ—λŠ” 생성 속도가 λ„ˆλ¬΄ 느렀 μ‚¬μš©μž κ²½ν—˜μ„ ν•΄μΉ˜λŠ” λ¬Έμ œκ°€ μžˆμ—ˆμŠ΅λ‹ˆλ‹€. 이 논문은 λ³΅μž‘ν•œ ν˜„μ‹€ ν™˜κ²½μ—μ„œλ„ νŠΌνŠΌν•˜κ²Œ μž‘λ™(robust)ν•˜λ©΄μ„œλ„, μ‹€μ œ μ‚¬μ§„μ²˜λŸΌ 보이게 λ§Œλ“œλŠ” 고해상도 생성(realistic) 기술과 μ‹€μ‹œκ°„μ— κ°€κΉŒμš΄ μ΄ˆκ³ μ† μΆ”λ‘  νš¨μœ¨μ„±(efficiency)을 λ™μ‹œμ— λ‹¬μ„±ν•˜μ—¬, 연ꡬ싀 단계λ₯Ό λ„˜μ–΄ λŒ€κ·œλͺ¨ μƒμš© μ„œλΉ„μŠ€(Taobao App)에 μ„±κ³΅μ μœΌλ‘œ μ•ˆμ°©μ‹œν‚¨ μ μ—μ„œ 맀우 μ€‘μš”ν•œ 의미λ₯Ό κ°€μ§‘λ‹ˆλ‹€.

2. 핡심 아이디어 μ‰½κ²Œ μ΄ν•΄ν•˜κΈ°

μΌμƒμƒν™œ λΉ„μœ : β€˜μˆœλ°œλ ₯ λ„˜μΉ˜λŠ” 졜고의 ν…ŒμΌλŸ¬β€™

이 μ‹œμŠ€ν…œμ„ 마치 β€˜μ΄ˆλŠ₯λ ₯을 κ°€μ§„ ν…ŒμΌλŸ¬β€™λΌκ³  μƒκ°ν•΄λ³΄μ„Έμš”. μ†λ‹˜μ΄ 흐린 λ‚  흔듀린 μΉ΄λ©”λΌλ‘œ 찍은 κ³Όκ²©ν•œ λŒ„μŠ€ 포즈 사진을 가져와도, 이 ν…ŒμΌλŸ¬λŠ” 눈 κΉœμ§ν•  사이에 옷의 질감과 주름을 μ™„λ²½ν•˜κ²Œ μ‚΄λ €μ„œ μ†λ‹˜μ˜ 사진에 μž…ν˜€μ€λ‹ˆλ‹€. κ²Œλ‹€κ°€ μ†λ‹˜μ€ β€œμ΄ 바지와 μ € μ €μ§€, 그리고 이 λͺ¨μžκΉŒμ§€ ν•œ λ²ˆμ— μž…μ–΄λ΄β€λΌκ³  6κ°€μ§€μ˜ μ˜·μ„ λ™μ‹œμ— μš”μ²­ν•  수 있고, 배경도 μ›ν•˜λŠ” λŒ€λ‘œ λ°”κΏ€ 수 μžˆμŠ΅λ‹ˆλ‹€. 보톡 ν…ŒμΌλŸ¬λΌλ©΄ 이 일을 ν•˜λŠ” 데 며칠이 κ±Έλ¦¬κ² μ§€λ§Œ, AI ν…ŒμΌλŸ¬λŠ” 1μ΄ˆλ„ μ•ˆ λ˜μ–΄ μ™„λ²½ν•œ 결과물을 λ‚΄λ†“μŠ΅λ‹ˆλ‹€. 이것이 λ°”λ‘œ Tstars-Tryon 1.0이 ν•˜λŠ” μΌμž…λ‹ˆλ‹€.

단계별 λ™μž‘ 방식

이 μ‹œμŠ€ν…œμ€ 크게 λ„€ κ°€μ§€ λ‹¨κ³„λ‘œ λ‚˜λˆ„μ–΄ λ³Ό 수 μžˆμŠ΅λ‹ˆλ‹€.

첫째, 데이터 엔진을 ν†΅ν•œ 견고함 확보. λͺ¨λΈμ΄ ν›ˆλ ¨λ˜κΈ° 전에, μ‹€μ œ μ„Έκ³„μ˜ λ‹€μ–‘ν•œ μ–΄λ €μš΄ 상황(μ‘°λͺ… 문제, 흐림 λ“±)을 μΈμœ„μ μœΌλ‘œ 더 많이 λ§Œλ“€μ–΄λ‚΄μ–΄ ν•™μŠ΅ 데이터λ₯Ό κ°•ν™”ν•©λ‹ˆλ‹€. 마치 ν…ŒμΌλŸ¬κ°€ μ΅œμ•…μ˜ μƒν™©μ—μ„œλ„ 일할 수 μžˆλ„λ‘ ν›ˆλ ¨μ‹œν‚€λŠ” 것과 λΉ„μŠ·ν•©λ‹ˆλ‹€.

λ‘˜μ§Έ, ν†΅ν•©λœ μ•„ν‚€ν…μ²˜ 섀계. κΈ°μ‘΄ 방식듀은 μ‚¬λžŒμ˜ ν˜•νƒœλ₯Ό νŒŒμ•…ν•˜λŠ” 단계와 μ˜·μ„ ν•©μ„±ν•˜λŠ” 단계가 λ”°λ‘œ λ–¨μ–΄μ Έ μžˆμ–΄ 였λ₯˜κ°€ λ°œμƒν•˜κΈ° μ‰¬μ› μŠ΅λ‹ˆλ‹€. 이 μ‹œμŠ€ν…œμ€ 이λ₯Ό ν•˜λ‚˜λ‘œ μ—°κ²°λœ νŒŒμ΄ν”„λΌμΈμœΌλ‘œ μ„€κ³„ν•˜μ—¬, μ‚¬λžŒμ˜ 신체 ꡬ쑰와 옷의 νŠΉμ„±μ„ 더 μ •κ΅ν•˜κ²Œ λ§€μΉ­ν•©λ‹ˆλ‹€.

μ…‹μ§Έ, 닀쀑 이미지 ν•©μ„± λŠ₯λ ₯. μ‚¬μš©μžκ°€ μ—¬λŸ¬ μ˜·μ„ μ°Έκ³  μ΄λ―Έμ§€λ‘œ μ£Όλ©΄(μ΅œλŒ€ 6μž₯), λͺ¨λΈμ€ 이λ₯Ό ν•˜λ‚˜μ˜ μŠ€νƒ€μΌλ‘œ ν†΅ν•©ν•˜μ—¬ μ²˜λ¦¬ν•©λ‹ˆλ‹€. μ΄λ•Œ μ‚¬μš©μžμ˜ 얼꡴은 κ·ΈλŒ€λ‘œ μœ μ§€ν•˜λ©΄μ„œ λ°°κ²½μ΄λ‚˜ 옷만 μžμ—°μŠ€λŸ½κ²Œ λ°”λ€λ‹ˆλ‹€.

λ„·μ§Έ, μΆ”λ‘  속도 μ΅œμ ν™”. λ³΅μž‘ν•œ 연산을 거쳐도 κ²°κ³Όκ°€ λ‚˜μ˜€λŠ” 속도가 μ€‘μš”ν•˜λ―€λ‘œ, λͺ¨λΈ ꡬ쑰λ₯Ό κ²½λŸ‰ν™”ν•˜κ³  μ‹œμŠ€ν…œ 인프라λ₯Ό νŠœλ‹ν•˜μ—¬ μ‚¬μš©μžκ°€ κΈ°λ‹€λ¦Ό 없이 κ²°κ³Όλ₯Ό λ³Ό 수 μžˆλ„λ‘ λ§Œλ“­λ‹ˆλ‹€.

핡심 μ•Œκ³ λ¦¬μ¦˜ 및 기술

λ…Όλ¬Έμ—μ„œλŠ” ꡬ체적인 μˆ˜μ‹μ„ κ³΅κ°œν•˜μ§€ μ•Šμ•˜μ§€λ§Œ, β€˜λ‹€λ‹¨κ³„ ν›ˆλ ¨ νŒ¨λŸ¬λ‹€igm(Multi-stage training paradigm)β€˜μ„ μ–ΈκΈ‰ν•©λ‹ˆλ‹€. μ΄λŠ” λͺ¨λΈμ΄ ν•œ λ²ˆμ— λͺ¨λ“  것을 λ°°μš°λŠ” 것이 μ•„λ‹ˆλΌ, 1λ‹¨κ³„μ—μ„œλŠ” 옷의 ν˜•νƒœλ₯Ό 작고, 2λ‹¨κ³„μ—μ„œλŠ” μ„¬μ„Έν•œ 질감과 μž¬μ§ˆμ„ ν•™μŠ΅ν•˜λŠ” μ‹μœΌλ‘œ λ‹¨κ³„λ³„λ‘œ ν•™μŠ΅ λͺ©ν‘œλ₯Ό μ„ΈλΆ„ν™”ν–ˆμŒμ„ μ‹œμ‚¬ν•©λ‹ˆλ‹€. λ˜ν•œ β€˜μ΄λ―Έμ§€ 생성(Image generation)’ κΈ°μˆ μ„ ν™œμš©ν•˜μ—¬, μ˜·μ„ λ‹¨μˆœνžˆ λΆ™μ—¬ λ„£λŠ” 것이 μ•„λ‹ˆλΌ ν”½μ…€ λ‹¨μœ„λ‘œ μƒˆλ‘œμš΄ 사진을 κ·Έλ €λ‚΄λŠ” 생성 λͺ¨λΈ(μ•„λ§ˆλ„ Diffusion λͺ¨λΈμ΄λ‚˜ κ³ λ„ν™”λœ GAN 계열)을 기반으둜 κ΅¬μ„±λ˜μ–΄ μžˆμ„ κ²ƒμœΌλ‘œ μΆ”μ •λ©λ‹ˆλ‹€.

3. μ‹€ν—˜ κ²°κ³Ό 뢄석

벀치마크 및 μ„±λŠ₯ 평가

이 논문은 μ—°κ΅¬μžλ“€μ΄ κ³΅κ°œν•œ κΈ°μ‘΄ λ°μ΄ν„°μ…‹λΏλ§Œ μ•„λ‹ˆλΌ, μ €μžλ“€μ΄ 직접 μƒˆλ‘œ λ§Œλ“  포괄적인 λ²€μΉ˜λ§ˆν¬μ—μ„œ μ„±λŠ₯을 κ²€μ¦ν–ˆμŠ΅λ‹ˆλ‹€. 특히 κΈ°μ‘΄ λͺ¨λΈλ“€μ΄ 자주 μ‹€νŒ¨ν•˜λ˜ β€˜κ·Ήλ‹¨μ μΈ ν¬μ¦ˆβ€™, β€˜μ‹¬ν•œ μ‘°λͺ… 변화’, β€˜λͺ¨μ…˜ λΈ”λŸ¬(Motion blur)β€˜κ°€ ν¬ν•¨λœ μ–΄λ €μš΄ ν…ŒμŠ€νŠΈ μΌ€μ΄μŠ€λ₯Ό 주둜 λ‹€λ£¨μ—ˆμŠ΅λ‹ˆλ‹€.

κΈ°μ‘΄ SOTA(State-of-the-Art) λŒ€λΉ„ μ„±λŠ₯

ꡬ체적인 μˆ˜μΉ˜κ°€ 곡개된 μ •λŸ‰μ  비ꡐ ν‘œλŠ” 제곡된 μš”μ•½μ— μ—†μ§€λ§Œ, β€œμ„ λ„μ μΈ μ „λ°˜μ μΈ μ„±λŠ₯(leading overall performance)β€œμ„ λ‹¬μ„±ν–ˆλ‹€κ³  λͺ…μ‹œν•˜κ³  μžˆμŠ΅λ‹ˆλ‹€. μ΄λŠ” μ •λŸ‰μ  μ§€ν‘œ(FID, LPIPS λ“±)뿐만 μ•„λ‹ˆλΌ, μ‹€μ œ μ‚¬λžŒμ΄ λ³΄μ•˜μ„ λ•Œ ν’ˆμ§ˆμ„ ν‰κ°€ν•˜λŠ” 정성적 ν…ŒμŠ€νŠΈμ—μ„œλ„ κΈ°μ‘΄ 졜고 μˆ˜μ€€μ˜ λͺ¨λΈλ“€μ„ μ••λ„ν–ˆμŒμ„ μ˜λ―Έν•©λ‹ˆλ‹€. 특히 AIκ°€ λ§Œλ“  μ΄λ―Έμ§€μ—μ„œ ν”νžˆ λ³΄μ΄λŠ” 인곡적인 μž‘μŒμ΄λ‚˜ μ™œκ³‘(Artifacts)을 크게 쀄여, 옷의 질감과 μž¬μ§ˆμ„ 사진 κ·ΈλŒ€λ‘œ λ³΄μ‘΄ν•˜λŠ” 데 νƒμ›”ν•œ μ„±κ³Όλ₯Ό λ³΄μ˜€μŠ΅λ‹ˆλ‹€.

μ£Όλͺ©ν•  λ§Œν•œ μ„±κ³Ό

κ°€μž₯ 인상적인 μ„±κ³ΌλŠ” 기술적 완성도λ₯Ό λ„˜μ–΄μ„  μ‹€μ§ˆμ μΈ 운영 μ„±κ³Όμž…λ‹ˆλ‹€. 이 λͺ¨λΈμ€ νƒ€μ˜€λ°”μ˜€(Taobao) 앱에 μ‹€μ œλ‘œ νƒ‘μž¬λ˜μ–΄ 수백만 λͺ…μ˜ μ‚¬μš©μžμ—κ²Œ μ„œλΉ„μŠ€λ˜μ—ˆμœΌλ©°, 수천만 건의 μš”μ²­μ„ μ²˜λ¦¬ν–ˆμŠ΅λ‹ˆλ‹€. μ΄λŠ” λ‹¨μˆœν•œ λ…Όλ¬ΈμœΌλ‘œμ„œμ˜ 성곡이 μ•„λ‹ˆλΌ, μ‹€μ œ λΉ„μ¦ˆλ‹ˆμŠ€ μƒν™©μ—μ„œ λ°œμƒν•˜λŠ” μ—„μ²­λ‚œ νŠΈλž˜ν”½μ„ 견디며 μ‚¬μš©μžμ—κ²Œ 만쑱슀러운 κ²°κ³Όλ₯Ό μ£Όμ—ˆλ‹€λŠ” κ°•λ ₯ν•œ 싀증 λ°μ΄ν„°μž…λ‹ˆλ‹€.

4. ν•œκ³„μ κ³Ό ν–₯ν›„ 연ꡬ λ°©ν–₯

μ €μžκ°€ μ–ΈκΈ‰ν•œ ν•œκ³„ 및 μΆ”λ‘  κ³Όμ •μ—μ„œμ˜ κ³ λ―Ό

비둝 μš”μ•½μ— λͺ…μ‹œλœ ν•œκ³„μ μ€ μ—†μ§€λ§Œ, β€˜λ‹€μ€‘ 이미지 합성’을 μ΅œλŒ€ 6μž₯으둜 μ œν•œν•œ μ μ΄λ‚˜, 극단적인 μƒν™©μ—μ„œμ˜ μ„±λŠ₯ μœ μ§€λ₯Ό μœ„ν•΄ μ‹œμŠ€ν…œ ꡬ쑰λ₯Ό μ–Όλ§ˆλ‚˜ λ³΅μž‘ν•˜κ²Œ λ§Œλ“€μ—ˆλŠ”μ§€κ°€ 암묡적인 trade-off둜 μž‘μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€. λͺ¨λΈμ΄ λ³΅μž‘ν•΄μ§ˆμˆ˜λ‘ μœ μ§€λ³΄μˆ˜ λΉ„μš©μ΄λ‚˜ μ„œλ²„ λΆ€ν•˜κ°€ 증가할 수 있기 λ•Œλ¬Έμž…λ‹ˆλ‹€.

κ°œμ„  κ°€λŠ₯μ„± 및 ν–₯ν›„ λ°©ν–₯

ν˜„μž¬λŠ” μ •μ§€λœ 사진(Still image)에 μ΄ˆμ μ„ λ§žμΆ”κ³  μžˆμ§€λ§Œ, μΆ”ν›„ μ—°κ΅¬μ—μ„œλŠ” **λ™μ˜μƒ 가상 ν”ΌνŒ…(Video Virtual Try-On)**으둜 ν™•μž₯될 κ°€λŠ₯성이 ν½λ‹ˆλ‹€. μ‚¬μš©μžκ°€ λŒμ•„κ°€κ±°λ‚˜ κ±·λŠ” λ™μž‘μ— 맞좰 옷의 물리적 μ›€μ§μž„μ„ μ‹€μ‹œκ°„μœΌλ‘œ λ°˜μ˜ν•˜λŠ” 기술이 λ‹€μŒ 단계가 될 κ²ƒμž…λ‹ˆλ‹€. λ˜ν•œ, ν˜„μž¬ 8개의 νŒ¨μ…˜ μΉ΄ν…Œκ³ λ¦¬λ₯Ό μ§€μ›ν•˜μ§€λ§Œ, 이λ₯Ό μ•‘μ„Έμ„œλ¦¬λ‚˜ μ‹ λ°œ λ“± 더 λ‹€μ–‘ν•œ μ•„μ΄ν…œμœΌλ‘œ ν™•μž₯ν•˜λŠ” 것도 κ³Όμ œκ°€ 될 κ²ƒμž…λ‹ˆλ‹€.

5. 싀무 적용 κ°€λŠ₯μ„±

μ¦‰μ‹œ 적용 κ°€λŠ₯ν•œ λΆ„μ•Ό

이 κΈ°μˆ μ€ 이컀머슀 ν”Œλž«νΌμ— κ°€μž₯ μ ν•©ν•©λ‹ˆλ‹€. 옷 μ‡Όν•‘ μ‹œ νλ ˆμ΄μ…˜λœ λͺ¨λΈ 사진이 μ•„λ‹Œ, λ‚΄ 사진에 직접 μ˜·μ„ μž…μ–΄λ³΄λŠ” β€˜λ‚΄ ν”ΌνŒ…β€™ κΈ°λŠ₯을 μ œκ³΅ν•˜μ—¬ ꡬ맀 μ „ν™˜μœ¨μ„ 획기적으둜 높일 수 μžˆμŠ΅λ‹ˆλ‹€. λ˜ν•œ νŒ¨μ…˜ μŠ€νƒ€μΌλ§ μΆ”μ²œ μ„œλΉ„μŠ€, λ©”νƒ€λ²„μŠ€ 아바타 κΎΈλ―ΈκΈ°, μ†Œμ…œ λ―Έλ””μ–΄ ν•„ν„° μ•± 등에도 μ¦‰μ‹œ μ μš©ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

ν•„μš”ν•œ λ¦¬μ†ŒμŠ€

이 μ‹œμŠ€ν…œμ„ 싀무에 λ„μž…ν•˜κΈ° μœ„ν•΄μ„œλŠ” κ³ μ„±λŠ₯의 GPU ν΄λŸ¬μŠ€ν„°κ°€ ν•„μˆ˜μ μž…λ‹ˆλ‹€. 특히 수천만 건의 μš”μ²­μ„ μ‹€μ‹œκ°„μ— κ°€κΉκ²Œ μ²˜λ¦¬ν•˜λ €λ©΄ μΆ”λ‘  속도 μ΅œμ ν™”κ°€ λ˜μ–΄ μžˆλ”λΌλ„, λŒ€κ·œλͺ¨ 병렬 μ²˜λ¦¬κ°€ κ°€λŠ₯ν•œ μ„œλ²„ 인프라(예: NVIDIA A100μ΄λ‚˜ H100 기반의 μ„œλ²„)κ°€ ν•„μš”ν•©λ‹ˆλ‹€. λ˜ν•œ λͺ¨λΈμ˜ νŠœλ‹μ„ μœ„ν•΄μ„œλŠ” λ‹€μ–‘ν•œ μ²΄ν˜•κ³Ό 옷으둜 κ΅¬μ„±λœ κ³ ν’ˆμ§ˆμ˜ λŒ€κ·œλͺ¨ 데이터셋이 ν™•λ³΄λ˜μ–΄μ•Ό ν•©λ‹ˆλ‹€.

6. 이 논문을 μ΄ν•΄ν•˜κΈ° μœ„ν•œ 사전 지식

  • Virtual Try-On (VTO): μ‚¬μš©μžμ˜ 이미지에 κ°€μƒμœΌλ‘œ μ˜·μ„ μž…ν˜€λ³΄λŠ” 기술둜, 컴퓨터 λΉ„μ „κ³Ό 이미지 생성 기술이 κ²°ν•©λœ λΆ„μ•Όμž…λ‹ˆλ‹€.
  • In-the-wild: μ‹€ν—˜μ‹€μ΄λ‚˜ ν†΅μ œλœ ν™˜κ²½μ΄ μ•„λ‹Œ, μ‹€μ œ μΌμƒμƒν™œ μ†μ—μ„œ 촬영된 μ‘°λͺ…, 각도, 배경이 λ‹€μ–‘ν•œ λ³΅μž‘ν•œ 이미지 ν™˜κ²½μ„ μ˜λ―Έν•©λ‹ˆλ‹€.
  • Diffusion Model (디퓨전 λͺ¨λΈ): μ μ§„μ μœΌλ‘œ λ…Έμ΄μ¦ˆλ₯Ό μ œκ±°ν•˜μ—¬ μ›ν•˜λŠ” 이미지λ₯Ό μƒμ„±ν•˜λŠ” μ΅œμ‹ μ˜ μƒμ„±ν˜• AI λͺ¨λΈλ‘œ, κ³ ν’ˆμ§ˆ 이미지 생성에 주둜 μ‚¬μš©λ©λ‹ˆλ‹€.
  • Pose Estimation (μžμ„Έ μΆ”μ •): μ΄λ―Έμ§€λ‚˜ λΉ„λ””μ˜€μ—μ„œ μ‚¬λžŒμ˜ κ΄€μ ˆ μœ„μΉ˜μ™€ 신체 μ›€μ§μž„μ„ μΆ”μ •ν•˜λŠ” 기술둜, 가상 ν”ΌνŒ… μ‹œ 옷이 어디에 μ–΄λ–»κ²Œ μœ„μΉ˜ν•΄μ•Ό ν• μ§€ κ²°μ •ν•˜λŠ” 기반이 λ©λ‹ˆλ‹€.
  • Inference Optimization (μΆ”λ‘  μ΅œμ ν™”): ν•™μŠ΅λœ λͺ¨λΈμ΄ μ‹€μ œ μ„œλΉ„μŠ€ ν™˜κ²½μ—μ„œ λΉ λ₯΄κ²Œ 응닡할 수 μžˆλ„λ‘ λͺ¨λΈμ˜ 크기λ₯Ό μ€„μ΄κ±°λ‚˜ μ—°μ‚° 과정을 κ°„μ†Œν™”ν•˜λŠ” κΈ°μˆ μž…λ‹ˆλ‹€.
  • Latency (μ§€μ—° μ‹œκ°„): μ‚¬μš©μžκ°€ μš”μ²­μ„ 보낸 μ‹œμ λΆ€ν„° κ²°κ³Όκ°€ λ‚˜μ˜¬ λ•ŒκΉŒμ§€ κ±Έλ¦¬λŠ” μ‹œκ°„μœΌλ‘œ, μ‚¬μš©μž κ²½ν—˜μ„ κ²°μ •ν•˜λŠ” 핡심 μ§€ν‘œμž…λ‹ˆλ‹€.

πŸ“š 이번 μ£Ό κ΄€λ ¨ Deep Dive

μˆœμœ„λ…Όλ¬ΈDeep Dive
πŸ₯‡Tstars-Tryon 1.0: Robust and Realisβ€¦πŸ“ ν˜„μž¬ λ¬Έμ„œ
πŸ₯ˆLLaDA2.0-Uni: Unifying Multimodal U…DD-073
πŸ₯‰AgentSPEX: An Agent SPecification a…DD-074
4.Extending One-Step Image Generation…DD-075
5.OneVL: One-Step Latent Reasoning an…DD-076

πŸ“… 생성일: 2026-04-26 | πŸ€– GLM-4.7 Deep Dive