โ† ๐Ÿ“š ์ด๋ฒˆ ์ฃผ Weekly Digest๋กœ ๋Œ์•„๊ฐ€๊ธฐ

DD-096 TransitLM: A Large-Scale Dataset and Benchmark for Map-Free Transit Route Generation

arXiv: 2605.22355 ๊ธฐ๊ด€: AMAP-ML Upvotes: 167 | Comments: 2 ์ˆœ์œ„: ์ด๋ฒˆ ์ฃผ Top 5


๋…ผ๋ฌธ ๋ฆฌ๋ทฐ: TransitLM - ์ง€๋„ ์—†๋Š” ๋Œ€์ค‘๊ตํ†ต ๊ฒฝ๋กœ ์ƒ์„ฑ์„ ์œ„ํ•œ ๋Œ€๊ทœ๋ชจ ๋ฐ์ดํ„ฐ์…‹๊ณผ ๋ฒค์น˜๋งˆํฌ

1. ์™œ ์ด ๋…ผ๋ฌธ์ด ์ค‘์š”ํ•œ๊ฐ€?

๊ธฐ์กด์˜ ๋Œ€์ค‘๊ตํ†ต ๊ฒฝ๋กœ ํƒ์ƒ‰ ์‹œ์Šคํ…œ์€ ๋ณต์žกํ•œ ์ง€๋„ ์ธํ”„๋ผ์™€ ์ •๋ฐ€ํ•œ ๋ผ์šฐํŒ… ์—”์ง„์— ์ ˆ๋Œ€์ ์œผ๋กœ ์˜์กดํ•ด์•ผ ํ–ˆ์œผ๋ฉฐ, ์ด๋ฅผ ํ•™์Šตํ•  ๋งŒํ•œ ์™„์ „ํ•œ ๋ฐ์ดํ„ฐ์…‹์€ ์กด์žฌํ•˜์ง€ ์•Š์•˜์Šต๋‹ˆ๋‹ค. ์ด ๋…ผ๋ฌธ์€ 1,300๋งŒ ๊ฐœ ์ด์ƒ์˜ ์‹ค์ œ ๊ฒฝ๋กœ ๊ธฐ๋ก ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด, ์™ธ๋ถ€ ์ง€๋„๋‚˜ ๋ณ„๋„์˜ ์—”์ง„ ์—†์ด๋„ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ์ด ์ถœ๋ฐœ์ง€์™€ ๋ชฉ์ ์ง€๋งŒ์œผ๋กœ ๋์—์„œ ๋๊นŒ์ง€ ์™„๋ฒฝํ•œ ๊ฒฝ๋กœ๋ฅผ ์ƒ์„ฑํ•  ์ˆ˜ ์žˆ์Œ์„ ์ฒ˜์Œ์œผ๋กœ ์ฆ๋ช…ํ–ˆ์Šต๋‹ˆ๋‹ค.

2. ํ•ต์‹ฌ ์•„์ด๋””์–ด ์‰ฝ๊ฒŒ ์ดํ•ดํ•˜๊ธฐ

์ผ์ƒ์ƒํ™œ ๋น„์œ : ์ง€๋„๋ฅผ ์™ธ์šด ํ˜„์ง€ ๊ฐ€์ด๋“œ

์ด ๋…ผ๋ฌธ์˜ ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š” โ€˜๋‚ด๋น„๊ฒŒ์ด์…˜ ์•ฑโ€™๊ณผ โ€˜๊ฒฝํ—˜์ด ํ’๋ถ€ํ•œ ํ˜„์ง€ ํƒ์‹œ ๊ธฐ์‚ฌโ€™์˜ ์ฐจ์ด์™€ ๋น„์Šทํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด ์‹œ์Šคํ…œ์€ ๋งค๋ฒˆ ์ง€๋„๋ฅผ ํŽด๋†“๊ณ  ๋ˆˆ์œผ๋กœ ๊ธธ์„ ํ™•์ธํ•˜๋ฉฐ ๊ณ„์‚ฐํ•˜๋Š” ๋‚ด๋น„๊ฒŒ์ด์…˜ ์•ฑ(์ง€๋„ ๊ธฐ๋ฐ˜ ๋ผ์šฐํŒ… ์—”์ง„)๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด, ์ด ๋…ผ๋ฌธ์—์„œ ์ œ์•ˆํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ์ˆ˜์‹ญ ๋…„๊ฐ„ ๊ทธ ๋„์‹œ์˜ ๋ชจ๋“  ๊ณจ๋ชฉ์„ ๋‹ฌ๋ ค๋ณธ ๊ฒฝํ—˜ ๋งŽ์€ ํƒ์‹œ ๊ธฐ์‚ฌ์ฒ˜๋Ÿผ, ๋ณต์žกํ•œ ์ง€๋„๋ฅผ ํŽด์น˜์ง€ ์•Š์•„๋„ ๋‡Œ ์†์˜ ์ง€ํ˜•์ง€๋ฌผ๋งŒ ๋ณด๊ณ ๋„ ์ฆ‰์‹œ โ€œ์—ฌ๊ธฐ์„œ ์ €๊ธฐ๊นŒ์ง€ ๊ฐ€๋ ค๋ฉด 3๋ฒˆ ๋ฒ„์ „ ํƒ€๊ณ  ํ™˜์Šนํ•ด๋ผโ€๋ผ๊ณ  ๋งํ•ด์ฃผ๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ๋ชจ๋ธ์ด ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ๋„์‹œ์˜ ๊ตฌ์กฐ๋ฅผ โ€˜์ฒดํ™”โ€™์‹œํ‚ค๋Š” ๊ฒƒ์ด์ฃ .

๋‹จ๊ณ„๋ณ„ ๋™์ž‘ ๋ฐฉ์‹

  1. ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ ๋ฐ ๊ตฌ์„ฑ: ์ค‘๊ตญ์˜ 4๊ฐœ ์ฃผ์š” ๋„์‹œ(๋ฒ ์ด์ง•, ์ƒํ•˜์ด, ์„ ์ „, ์ฒญ๋‘)์—์„œ ์ˆ˜์ง‘๋œ ์‹ค์ œ ๋‚ด๋น„๊ฒŒ์ด์…˜ ๋กœ๊ทธ 1,290๋งŒ ๊ฑด์„ ๋ชจ์๋‹ˆ๋‹ค. ์ด ๋ฐ์ดํ„ฐ์—๋Š” ๋‹จ์ˆœํ•œ ์ขŒํ‘œ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ์Šน๊ฐ์ด ์–ด๋–ค ๋ฒ„์Šค๋ฅผ ํƒ€๊ณ  ์–ด๋””์„œ ๋‚ด๋ ธ๋Š”์ง€, ์–ผ๋งˆ๋‚˜ ๊ฑธ์—ˆ๋Š”์ง€ ๋“ฑ ์‚ฌ๋žŒ์˜ ์ด๋™ ํ–‰๋™ ํŒจํ„ด์ด ๋ชจ๋‘ ํฌํ•จ๋˜์–ด ์žˆ์Šต๋‹ˆ๋‹ค.
  2. ์•”์‹œ์  ๊ณต๊ฐ„ ํ•™์Šต(Implicit Spatial Grounding): ๋ชจ๋ธ์—๊ฒŒ โ€œ์„œ์šธ์—ญ ์œ„๋„ 37.5, ๊ฒฝ๋„ 127.0โ€์ด๋ผ๋Š” ์ขŒํ‘œ์™€ โ€œ์„œ์šธ์—ญ ์ง€ํ•˜์ฒ ์—ญโ€์ด๋ผ๋Š” ID๋ฅผ ์—ฐ๊ฒฐํ•ด์ฃผ๋Š” ์ •๋‹ต์ง€๋ฅผ ๋”ฐ๋กœ ์ฃผ์ง€ ์•Š์Šต๋‹ˆ๋‹ค. ๋Œ€์‹  ์ˆ˜์ฒœ๋งŒ ๊ฑด์˜ ๋กœ๊ทธ๋ฅผ ํ†ตํ•ด ์ด ์ขŒํ‘œ ๊ทผ์ฒ˜์—์„œ ์‚ฌ๋žŒ๋“ค์ด ์ž์ฃผ ์‚ฌ์šฉํ•˜๋Š” ์—ญ ID๊ฐ€ ๋ฌด์—‡์ธ์ง€ ์Šค์Šค๋กœ ํŒจํ„ด์„ ์ฐพ์•„๋‚ด๊ฒŒ ํ•ฉ๋‹ˆ๋‹ค. ๋งˆ์น˜ ์•„์ด์—๊ฒŒ ๋‹จ์–ด์˜ ๋œป์„ ๊ฐ€๋ฅด์ณ์ฃผ์ง€ ์•Š์•„๋„ ๋ฌธ๋งฅ์„ ํ†ตํ•ด ๋‹จ์–ด๋ฅผ ์ตํžˆ๋Š” ๊ฒƒ๊ณผ ๋น„์Šทํ•ฉ๋‹ˆ๋‹ค.
  3. end-to-end ์ƒ์„ฑ: ์‚ฌ์šฉ์ž๊ฐ€ โ€œ์ง‘์—์„œ ํšŒ์‚ฌ๊นŒ์ง€ ๋นจ๋ฆฌ ๊ฐ€๊ณ  ์‹ถ์–ดโ€๋ผ๊ณ  ๋ฌป๊ฑฐ๋‚˜ ๋‹จ์ˆœํžˆ ์ขŒํ‘œ๋งŒ ์ž…๋ ฅํ•ด๋„, ๋ชจ๋ธ์€ ์ด๋ฅผ ์ดํ•ดํ•˜๊ณ  ์ง€๋„๋ฅผ ์ฐธ์กฐํ•˜์ง€ ์•Š์€ ์ฑ„ ์ฆ‰์‹œ ๋ฒ„์Šค ๋…ธ์„ , ์ง€ํ•˜์ฒ ์—ญ ID, ํ™˜์Šน ์ •๋ณด๊ฐ€ ๋‹ด๊ธด ๊ฒฝ๋กœ(JSON ํ˜•์‹)๋ฅผ ๋ฐ”๋กœ ๋งŒ๋“ค์–ด๋ƒ…๋‹ˆ๋‹ค.

3. ์‹คํ—˜ ๊ฒฐ๊ณผ ๋ถ„์„

ํ…Œ์ŠคํŠธ ๋ฒค์น˜๋งˆํฌ

์—ฐ๊ตฌ์ง„์€ ๋ชจ๋ธ์˜ ์„ฑ๋Šฅ์„ ํ‰๊ฐ€ํ•˜๊ธฐ ์œ„ํ•ด ์„ธ ๊ฐ€์ง€ ๊ณผ์ œ๋ฅผ ์ˆ˜ํ–‰ํ–ˆ์Šต๋‹ˆ๋‹ค. ์ตœ์  ๊ฒฝ๋กœ ์ƒ์„ฑ(ORG), ์‚ฌ์šฉ์ž ์„ ํ˜ธ ๊ธฐ๋ฐ˜ ๊ฒฝ๋กœ ์ƒ์„ฑ(PRG, ์˜ˆ: ์ง€ํ•˜์ฒ  ์šฐ์„ , ํ™˜์Šน ์ตœ์†Œํ™” ๋“ฑ), ๊ทธ๋ฆฌ๊ณ  ๋‹ค์–‘ํ•œ ๊ฒฝ๋กœ ์ƒ์„ฑ(DRG)์ž…๋‹ˆ๋‹ค. ๊ฐ ๊ณผ์ œ๋Š” 1๋งŒ ๊ฐœ์˜ ํ…Œ์ŠคํŠธ ์ƒ˜ํ”Œ์„ ํ†ตํ•ด ์ •ํ™•๋„์™€ ๊ตฌ์กฐ์  ์œ ํšจ์„ฑ์„ ๊ฒ€์ฆ๋ฐ›์•˜์Šต๋‹ˆ๋‹ค.

๊ธฐ์กด ๋ชจ๋ธ ๋Œ€๋น„ ์„ฑ๋Šฅ ํ–ฅ์ƒ

์ผ๋ฐ˜์ ์ธ ๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์ธ GPT-3.5๋‚˜ GPT-4๋Š” ๊ฒฝ๋กœ ์ƒ์„ฑ์— ์‹ฌ๊ฐํ•œ ์–ด๋ ค์›€์„ ๊ฒช์—ˆ์Šต๋‹ˆ๋‹ค. ์ด๋“ค์€ ์กด์žฌํ•˜์ง€ ์•Š๋Š” ์—ญ์„ ์ง€์–ด๋‚ด๊ฑฐ๋‚˜(Hallucination), ์„œ๋กœ ์—ฐ๊ฒฐ๋˜์ง€ ์•Š๋Š” ๋…ธ์„ ์„ ์ œ์•ˆํ•˜๋Š” ์‹คํŒจ๋ฅผ ๊ฒช์—ˆ์Šต๋‹ˆ๋‹ค. ๋ฐ˜๋ฉด, TransitLM์œผ๋กœ ํ•™์Šต๋œ ๋ชจ๋ธ์€ ๊ตฌ์กฐ์ ์œผ๋กœ ์œ ํšจํ•˜๊ณ  ์‹ค์ œ ์ด๋™์ด ๊ฐ€๋Šฅํ•œ ๊ฒฝ๋กœ๋ฅผ ๋งค์šฐ ๋†’์€ ์ •ํ™•๋„๋กœ ์ƒ์„ฑํ–ˆ์Šต๋‹ˆ๋‹ค.

์ฃผ๋ชฉํ•  ๋งŒํ•œ ์„ฑ๊ณผ

๊ฐ€์žฅ ์ธ์ƒ์ ์ธ ์ ์€ โ€˜์•”์‹œ์  ๊ณต๊ฐ„ ํ•™์Šตโ€™์˜ ํšจ๊ณผ์ž…๋‹ˆ๋‹ค. ์ž…๋ ฅ๊ฐ’์œผ๋กœ ์—ญ ์ด๋ฆ„(POI)์„ ์ค„ ๋•Œ๋ฟ๋งŒ ์•„๋‹ˆ๋ผ, ์•„๋ฌด๋Ÿฐ ๋ฌธ๋งฅ ์—†์ด GPS ์ขŒํ‘œ๋งŒ ์ฃผ์—ˆ์„ ๋•Œ๋„ ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ๊ฑฐ์˜ ์—†์—ˆ์Šต๋‹ˆ๋‹ค. ์ฆ‰, ๋ชจ๋ธ์ด ์ขŒํ‘œ๋งŒ ๋ด๋„ ํ•ด๋‹น ์œ„์น˜๊ฐ€ ์‹ค์ œ๋กœ ์–ด๋–ค ์—ญ ๊ทผ์ฒ˜์ธ์ง€ ์ •ํ™•ํžˆ ํŒŒ์•…ํ–ˆ๋‹ค๋Š” ๋œป์ž…๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์ธ LLM๋“ค์€ ์ขŒํ‘œ๋งŒ ์ž…๋ ฅํ•˜๋ฉด ์„ฑ๋Šฅ์ด ๊ธ‰๊ฒฉํžˆ ๋–จ์–ด์ง€๋Š” ๊ฒƒ๊ณผ ๋Œ€์กฐ์ ์ž…๋‹ˆ๋‹ค.

4. ํ•œ๊ณ„์ ๊ณผ ํ–ฅํ›„ ์—ฐ๊ตฌ ๋ฐฉํ–ฅ

์ €์ž๋“ค์€ ๋ฐ์ดํ„ฐ๊ฐ€ ์ค‘๊ตญ์˜ 4๊ฐœ ๋„์‹œ์™€ ๋‹จ์ผ ํ”Œ๋žซํผ(Amap)์— ๊ตญํ•œ๋˜์–ด ์žˆ๋‹ค๋Š” ์ ์„ ์ธ์ •ํ•ฉ๋‹ˆ๋‹ค. ์ฆ‰, ๋‹ค๋ฅธ ๋‚˜๋ผ๋‚˜ ๋ฌธํ™”๊ถŒ์—์„œ๋„ ์–ผ๋งˆ๋‚˜ ์ž˜ ์ž‘๋™ํ• ์ง€๋Š” ์ถ”๊ฐ€ ๊ฒ€์ฆ์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค. ๋˜ํ•œ ํ˜„์žฌ ๋ฐ์ดํ„ฐ๋Š” ์ •์ ์ธ ์‹œ๊ฐ„ํ‘œ์— ๊ธฐ๋ฐ˜ํ•˜๋ฏ€๋กœ, ๋Œ๋ฐœ ์ƒํ™ฉ์ด๋‚˜ ์‹ค์‹œ๊ฐ„ ๊ตํ†ต ์ง€์ฒด ๊ฐ™์€ ๋™์ ์ธ ํ™˜๊ฒฝ ๋ณ€ํ™”๋Š” ๋ฐ˜์˜ํ•˜์ง€ ๋ชปํ•œ๋‹ค๋Š” ํ•œ๊ณ„๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค. ํ–ฅํ›„ ์—ฐ๊ตฌ๋กœ๋Š” ๋” ๋‹ค์–‘ํ•œ ๋„์‹œ์™€ ๊ตํ†ต ์ˆ˜๋‹จ์œผ๋กœ ๋ฐ์ดํ„ฐ๋ฅผ ํ™•์žฅํ•˜๊ณ , ์‹ค์‹œ๊ฐ„ ๊ตํ†ต ์ •๋ณด๋ฅผ ํ†ตํ•ฉํ•˜๋Š” ๋ฐฉํ–ฅ์ด ์ œ์‹œ๋˜์—ˆ์Šต๋‹ˆ๋‹ค.

5. ์‹ค๋ฌด ์ ์šฉ ๊ฐ€๋Šฅ์„ฑ

์ด ๊ธฐ์ˆ ์€ ๊ธฐ์กด์— ๋ฌด๊ฒ๊ณ  ๋ณต์žกํ•˜๊ฒŒ ๊ตฌ์ถ•๋˜์–ด ์žˆ๋˜ ๋‚ด๋น„๊ฒŒ์ด์…˜ ๋ฐฑ์—”๋“œ ์‹œ์Šคํ…œ์„ ๊ฒฝ๋Ÿ‰ํ™”ํ•˜๋Š” ๋ฐ ๋ฐ”๋กœ ์ ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋ณ„๋„์˜ ๋ฐฉ๋Œ€ํ•œ ์ง€๋„ ์„œ๋ฒ„๋‚˜ ๋ณต์žกํ•œ ์ตœ๋‹จ ๊ฒฝ๋กœ ์•Œ๊ณ ๋ฆฌ์ฆ˜ ์—”์ง„ ์—†์ด, ํ…์ŠคํŠธ ์ƒ์„ฑ ๋ชจ๋ธ ํ•˜๋‚˜๋กœ ํ•ฉ์Šน ์„œ๋น„์Šค, ์—ฌํ–‰ ์ถ”์ฒœ ์ฑ—๋ด‡, ๋ฌผ๋ฅ˜ ์ตœ์ ํ™” ๋“ฑ์˜ ๊ธฐ๋Šฅ์„ ๊ตฌํ˜„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋‹ค๋งŒ, ์ด๋ฅผ ์„œ๋น„์Šคํ•˜๋ ค๋ฉด ์ˆ˜๋ฐฑ๋งŒ ๊ฑด์˜ ๋ฐ์ดํ„ฐ๋ฅผ ์ฒ˜๋ฆฌํ•  ์ˆ˜ ์žˆ๋Š” ์ถฉ๋ถ„ํ•œ GPU ๋ฆฌ์†Œ์Šค์™€ ๋ชจ๋ธ์„ ๋ฏธ๋ฆฌ ํ•™์Šต์‹œํ‚ค๋Š” ๊ณผ์ •์ด ํ•„์š”ํ•ฉ๋‹ˆ๋‹ค.

6. ์ด ๋…ผ๋ฌธ์„ ์ดํ•ดํ•˜๊ธฐ ์œ„ํ•œ ์‚ฌ์ „ ์ง€์‹

  • LLM(Large Language Model): ๋Œ€๊ทœ๋ชจ ํ…์ŠคํŠธ ๋ฐ์ดํ„ฐ๋กœ ์‚ฌ์ „ ํ•™์Šต๋˜์–ด ์ž์—ฐ์–ด ์ดํ•ด ๋ฐ ์ƒ์„ฑ ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜ ์ธ๊ณต์ง€๋Šฅ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค.
  • Hallucination(ํ• ๋ฃจ์‹œ๋„ค์ด์…˜): AI๊ฐ€ ์‚ฌ์‹ค์ด ์•„๋‹Œ ๋‚ด์šฉ์„ ๋งˆ์น˜ ์ง„์‹ค์ธ ๊ฒƒ์ฒ˜๋Ÿผ ๊ทธ๋Ÿด์‹ธํ•˜๊ฒŒ ์ƒ์„ฑํ•˜๋Š” ํ˜„์ƒ์ž…๋‹ˆ๋‹ค.
  • Grounding(๊ทธ๋ผ์šด๋”ฉ): AI์˜ ์–ธ์–ด์  ํ‘œํ˜„์ด ์‹ค์ œ ๋ฌผ๋ฆฌ์  ์„ธ๊ณ„์˜ ๋ฐ์ดํ„ฐ๋‚˜ ์˜๋ฏธ์™€ ํ™•์‹คํ•˜๊ฒŒ ์—ฐ๊ฒฐ๋˜๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค.
  • End-to-End Learning(๋์—์„œ ๋๊นŒ์ง€ ํ•™์Šต): ์ž…๋ ฅ์—์„œ ์ถœ๋ ฅ๊นŒ์ง€ ์ค‘๊ฐ„์— ์‚ฌ๋žŒ์ด ๊ฐœ์ž…ํ•˜์—ฌ ๋‹จ๊ณ„๋ฅผ ๋‚˜๋ˆ„์ง€ ์•Š๊ณ , ๋ชจ๋ธ์ด ์ „์ฒด ๊ณผ์ •์„ ์Šค์Šค๋กœ ํ•™์Šตํ•˜๋Š” ๋ฐฉ์‹์ž…๋‹ˆ๋‹ค.
  • POI(Point of Interest): ์ง€๋„ ์ƒ์˜ ํŠน์ • ์ง€์ ์ด๋‚˜ ์žฅ์†Œ(์˜ˆ: ์นดํŽ˜, ์ง€ํ•˜์ฒ ์—ญ, ๋ณ‘์› ๋“ฑ)๋ฅผ ์˜๋ฏธํ•ฉ๋‹ˆ๋‹ค.
  • Fine-Tuning(ํŒŒ์ธ ํŠœ๋‹): ์ด๋ฏธ ํ•™์Šต๋œ ๋ชจ๋ธ์„ ํŠน์ • ์ž‘์—…์ด๋‚˜ ๋ฐ์ดํ„ฐ์— ๋งž์ถฐ ์ถ”๊ฐ€๋กœ ํ•™์Šต์‹œ์ผœ ์„ฑ๋Šฅ์„ ์ตœ์ ํ™”ํ•˜๋Š” ๊ณผ์ •์ž…๋‹ˆ๋‹ค.

๐Ÿ“š ์ด๋ฒˆ ์ฃผ ๊ด€๋ จ Deep Dive

์ˆœ์œ„๋…ผ๋ฌธDeep Dive
๐Ÿฅ‡CiteVQA: Benchmarking Evidence Attrโ€ฆDD-092
๐ŸฅˆCode as Agent HarnessDD-093
๐Ÿฅ‰Anti-Self-Distillation for Reasoninโ€ฆDD-094
4.DelTA: Discriminative Token Credit โ€ฆDD-095
5.TransitLM: A Large-Scale Dataset anโ€ฆ๐Ÿ“ ํ˜„์žฌ ๋ฌธ์„œ

๐Ÿ“… ์ƒ์„ฑ์ผ: 2026-05-24 | ๐Ÿค– GLM-4.7 Deep Dive