๐Ÿฆ‰ ๋ถ€์„œ์ง„ ๋ชจ๋ธ์—์„œ ์‚ด์•„์žˆ๋Š” ์‹œ์Šคํ…œ์œผ๋กœ: GPU ์—†์ด AI๋ฅผ ๊ตฌ์ถ•ํ•œ ๋‚˜์˜ ์—ฌ์ •

๋ฐœํ–‰: (2025๋…„ 12์›” 26์ผ ์˜คํ›„ 01:56 GMT+9)
7 min read
์›๋ฌธ: Dev.to

Source: Dev.to

์†Œ๊ฐœ

์ดˆ๊ธฐ์˜ ์‹ค์ˆ˜๋ถ€ํ„ฐ ํ˜„์žฌ ์ง„ํ–‰ ์ค‘์ธ ์‹คํ—˜๊นŒ์ง€ ์—ฌ์ •์„ ๊ฐ„๋žตํžˆ ์‚ดํŽด๋ณด๊ณ , ๊ทธ ๊ณผ์ •์—์„œ ์–ป์€ ๊ตํ›ˆ๋“ค์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค.

ํ”„๋กœ์ ํŠธ #1: Lynqbit โ€” ๋‚ด๊ฐ€ ๊ฐ€์žฅ ์ข‹์•„ํ•˜๋Š” ์‹คํŒจ

Lynqbit์€ ๋‚˜์˜ ์ฒซ ๋ฒˆ์งธ ์ง„์ •ํ•œ ์‚ฌ๋ž‘์ด์—ˆ์Šต๋‹ˆ๋‹ค: 90โ€ฏMโ€‘parameter ๋ชจ๋ธ๋กœ, ์•ผ์‹ฌ ์ฐจ๊ณ , ์‹œ์ ์ด๋ฉฐ, ์•ฝ๊ฐ„ ์ด์ƒํ–ˆ์Šต๋‹ˆ๋‹ค.

  • ์‹คํŒจ ํฌ์ธํŠธ
    • ์‹œ์Šคํ…œ ๊ตฌ์„ฑ ๋ฌธ์ œ
    • ์ ์ ˆํ•œ ํ•™์Šต ์ธํ”„๋ผ ๋ถ€์กฑ
    • ๋ฐ˜๋ณต์„ ์ง€์†ํ•  GPU ์—†์Œ

๋‘ ๋‹ฌ๊ฐ„์˜ ์ง‘์ค‘์ ์ธ ์ž‘์—…์ด ์‚ฌ๋ผ์กŒ๊ณ , ํ”„๋กœ์ ํŠธ๋Š” ๋ถ•๊ดด๋˜์—ˆ์Šต๋‹ˆ๋‹ค. ์ƒ์ฒ˜๊ฐ€ ๋˜์—ˆ์ง€๋งŒ, ์‹คํŒจ๊ฐ€ ๊ฐ€ํ˜นํ•˜์ง€๋งŒ ๋ช…ํ™•ํ•œ ์Šค์Šน์ด๋ผ๋Š” ๊ฒƒ์„ ๋ฐฐ์› ์Šต๋‹ˆ๋‹ค.

์ธ์‚ฌ์ดํŠธ #1: ํ›ˆ๋ จ์€ ๋Š๊ธฐ์ง€ ์•Š๊ณ  ํ๋ฅด๊ฒŒ ํ•ด์•ผ ํ•œ๋‹ค

Lynqbit์˜ ์‚ฌ๋ง์€ ์งˆ๋ฌธ์„ ๋ถˆ๋Ÿฌ์ผ์œผ์ผฐ๋‹ค:

๋งŒ์•ฝ ํ›ˆ๋ จ์ด ํ•˜๋‚˜์˜ ์ทจ์•ฝํ•œ ์‹œ์Šคํ…œ์— ์˜์กดํ•˜์ง€ ์•Š๋Š”๋‹ค๋ฉด ์–ด๋–จ๊นŒ์š”?
๋ฐ์ดํ„ฐ์™€ ํ•™์Šต์ด ์ŠคํŠธ๋ฆฌ๋ฐ๋  ์ˆ˜ ์žˆ๋‹ค๋ฉด ์–ด๋–จ๊นŒ์š”?

๊ทธ ์•„์ด๋””์–ด๊ฐ€ ๋‚ด ๋‹ค์Œ ์‹คํ—˜์„ ์ด๋Œ์—ˆ๋‹ค.

Project #2: Barn Owl AI โ€” Short Life, Big Lesson

Barn Owl AI explored streamed training:

  • Concept: ํด๋ผ์šฐ๋“œโ€‘ํ˜ธ์ŠคํŒ… ๋ฐ์ดํ„ฐ์…‹, ์ƒ˜ํ”Œ๋ง ๊ธฐ๋ฐ˜ ํ•™์Šต, ์ง€์†์  ํ•™์Šต.
  • Reality: ํด๋ผ์šฐ๋“œ ๋ฐ์ดํ„ฐ์…‹์ด ๋ฉฐ์น  ํ›„์— ์ค‘๋‹จ๋˜์—ˆ๊ณ , ๋ฒ„๊ทธ๋Š” ์ˆ˜์ •๋˜์ง€ ์•Š์•˜์œผ๋ฉฐ ํ”„๋กœ์ ํŠธ๋Š” ์‹คํŒจํ–ˆ์Šต๋‹ˆ๋‹ค.

Lesson learned: ์†์‹ค์€ ์ž‘์•˜์ง€๋งŒ ํ†ต์ฐฐ์€ ๊ฑฐ๋Œ€ํ–ˆ์Šต๋‹ˆ๋‹ค.

ํ”„๋กœ์ ํŠธ #3: Elf Owl AI โ€” ๋‚˜์˜ ์ฒซ ๋ฒˆ์งธ ์ง„์ •ํ•œ ์„ฑ๊ณต

Elf Owl AI๋Š” ์ž‘๊ณ  ํ˜ผ๋ˆ์Šค๋Ÿฌ์šด, โ€œ์‚ด์•„์žˆ๋Š”โ€ ๋ชจ๋ธ์ด์—ˆ์Šต๋‹ˆ๋‹ค:

  • 2500๋งŒ ํŒŒ๋ผ๋ฏธํ„ฐ
  • ์ฐฝ์˜์ ์ด๊ณ  ํ™˜๊ฐ์ ์ธ, ์„ ํƒ์  ๋ฌธ๋ฒ•๊ณผ ๋ณ€๋•์Šค๋Ÿฌ์šด ์„ฑ๊ฒฉ์„ ๊ฐ€์ง

์„ฑ๊ณต ์‚ฌ๋ก€

  • ์™„์ „ํžˆ ํ•™์Šต๋˜๊ณ  ์˜คํ”ˆ์†Œ์Šคํ™”๋จ
  • ๊ณต๊ฐœ์ ์œผ๋กœ ์ถœ์‹œ๋จ (์™„๋ฒฝํ•˜์ง€๋Š” ์•Š์ง€๋งŒ ์กด์žฌํ–ˆ์Œ)

์กด์žฌ ์ž์ฒด๊ฐ€ ์ค‘์š”ํ•ฉ๋‹ˆ๋‹ค.

Project #4: Xenoglaux AI (Xeno AI) โ€” The Ongoing Battle

  • GitHub:
  • Dataset: 75โ€ฏ000๊ฐœ ์ด์ƒ์˜ ์ˆ˜์ž‘์—… + ์˜คํ”ˆ์†Œ์Šค ํ•ญ๋ชฉ, ์ŠคํŠธ๋ฆฌ๋ฐ ํ•™์Šต์„ ์œ„ํ•ด ์„ค๊ณ„๋จ
  • Modular evolution: ์˜ฌ๋นผ๋ฏธ ์‹œ๋ฆฌ์ฆˆ ํŒŒํŠธโ€ฏ2

Training bottleneck

  • GPU์—์„œ ์•ฝโ€ฏ15โ€ฏ์‹œ๊ฐ„ (ํ—ˆ์šฉ ๊ฐ€๋Šฅ)
  • CPU์—์„œ๋Š” ๋„ˆ๋ฌด ๋А๋ฆผ
  • ์˜จ๋ผ์ธ TPU๋Š” ๊ฐ„์‹ ํžˆ ํ˜‘์กฐํ•จ

ํ˜„์žฌ ์žฅ์• ๋ฌผ์€ ๋ชจ๋ธ์ด๋‚˜ ๋ฐ์ดํ„ฐ๊ฐ€ ์•„๋‹ˆ๋ผ ํ•˜๋“œ์›จ์–ด ์ œํ•œ์ž…๋‹ˆ๋‹ค.

์‚ฌ์ด๋“œ ํ€˜์ŠคํŠธ: ๋‹น์‹ ์„ ๋ฐฐ์šฐ๋Š” ๊ฒŒ์ž„

Xeno์™€ ์”จ๋ฆ„ํ•˜๋˜ ์ค‘, ํ”Œ๋ ˆ์ด์–ด์—๊ฒŒ์„œ ํ•™์Šตํ•˜๋Š” AI ์ƒ๋Œ€๊ฐ€ ์žˆ๋Š” ๊ฒŒ์ž„์„ ๋งŒ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค:

  1. ๋งค์น˜ 1 โ€“ AI๋Š” ๋ฌธ์ž ๊ทธ๋Œ€๋กœ ๋ธ”๋ก์œผ๋กœ ์‹œ์ž‘ํ•ฉ๋‹ˆ๋‹ค.
  2. ๋ฐ์ดํ„ฐ ์ˆ˜์ง‘ โ€“ ํ”Œ๋ ˆ์ด์–ด์˜ ์›€์ง์ž„, ์œ„์น˜, ๊ฒฐ์ •์ด JSON ํ˜•ํƒœ๋กœ ์ €์žฅ๋ฉ๋‹ˆ๋‹ค.
  3. ์žฌํ•™์Šต ๋ฃจํ”„ โ€“ ๊ฐ ๋งค์น˜๊ฐ€ ๋๋‚œ ๋’ค AI๋Š” ๋งˆ์ง€๋ง‰ ์ฒดํฌํฌ์ธํŠธ๋ฅผ ๋ถˆ๋Ÿฌ์™€ ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ๋กœ ์žฌํ•™์Šตํ•˜๊ณ , ์ด๋ฅผ ๋ฐ˜๋ณตํ•ฉ๋‹ˆ๋‹ค.

๊ฒฐ๊ณผ (๋น„๊ณต๊ฐœ ํ…Œ์ŠคํŠธ)

  • 20โ€“30 ๋งค์น˜ โ†’ ๊ดœ์ฐฎ์€ ํ”Œ๋ ˆ์ด์–ด ์ˆ˜์ค€
  • 400โ€“500 ๋งค์น˜ โ†’ ์ด๊ธธ ์ˆ˜ ์—†์Œ

์ด๊ฒƒ์€ ์Šคํฌ๋ฆฝํŠธ๋œ ํ–‰๋™์ด ์•„๋‹ˆ๋ผ โ€œํš๋“๋œ ์ง€๋Šฅโ€์ž…๋‹ˆ๋‹ค.

์ง€๊ธˆ๊นŒ์ง€ ๊นจ๋‹ฌ์€ ์ 

  • ์‹คํŒจ๋Š” ๋‚ญ๋น„๋œ ์ž‘์—…์ด ์•„๋‹ˆ๋ผ ์••์ถ•๋œ ์ง€์‹์ด๋‹ค.
  • ์ž‘์€ ๋ชจ๋ธ๋„ ์—ฌ์ „ํžˆ ์‚ด์•„์žˆ๋Š” ๋А๋‚Œ์„ ์ค„ ์ˆ˜ ์žˆ๋‹ค.
  • ์ŠคํŠธ๋ฆฌ๋ฐ + ์ ์ง„์  ํ•™์Šต์€ ๊ณผ์†Œํ‰๊ฐ€๋˜๊ณ  ์žˆ๋‹ค.
  • ํ•˜๋“œ์›จ์–ด๊ฐ€ ์ฐฝ์˜์„ฑ์„ ์ œํ•œํ•˜๋Š” ์ •๋„๊ฐ€ ์•„์ด๋””์–ด๋ณด๋‹ค ํฌ๋‹ค.

์ œํ•œ๋œ ์ž์›์œผ๋กœ ๊ตฌ์ถ•ํ•˜๊ณ  ์žˆ๋‹ค๋ฉด, ๋‹น์‹ ์€ ํ˜ผ์ž๊ฐ€ ์•„๋‹ˆ๋‹ค.

Next Steps (Real Talk)

  1. Rename Strategy for Xeno

    • โ€œXenoglaux AIโ€๋ฅผ ์‹œ๋ฆฌ์ฆˆ ์ด๋ฆ„์œผ๋กœ ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค.
    • ํ˜ผ๋™์„ ํ”ผํ•˜๊ธฐ ์œ„ํ•ด Xeno-25M, Xeno-40M, Xeno-Lite์™€ ๊ฐ™์€ ๋ชจ๋ธโ€‘๋ณ„ ํƒœ๊ทธ๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
  2. Stop Full Retraining โ€” Go Incremental

    • ์ž‘์€ ์ฒญํฌ(2โ€ฏkโ€“5โ€ฏk ์ƒ˜ํ”Œ) ๋‹จ์œ„๋กœ ํ•™์Šตํ•ฉ๋‹ˆ๋‹ค.
    • ์ฒดํฌํฌ์ธํŠธ๋ฅผ ์ ๊ทน์ ์œผ๋กœ ์ €์žฅํ•ฉ๋‹ˆ๋‹ค.
    • 15์‹œ๊ฐ„ ๋งˆ๋ผํ†ค ๋Œ€์‹  ๋งค์ผ ํ•™์Šต์„ ์žฌ๊ฐœํ•ฉ๋‹ˆ๋‹ค.
    • โ€œ๋“œ๋ฆฝ ํ•™์Šตโ€(drip learning)์„ ์ƒ๊ฐํ•˜๊ณ , ํ™์ˆ˜์ฒ˜๋Ÿผ ๋ชฐ์•„์น˜์ง€ ์•Š์Šต๋‹ˆ๋‹ค.
  3. Exploit What You Have (CPU + Time)

    • ๊ฐ€๋Šฅํ•œ ๊ฒฝ์šฐ ๋‚ฎ์€ ์ •๋ฐ€๋„(fp16/int8)๋ฅผ ์‚ฌ์šฉํ•ฉ๋‹ˆ๋‹ค.
    • ์—ํฌํฌ๋Š” ์ค„์ด๊ณ , ๋ฐ˜๋ณต ํšŸ์ˆ˜๋ฅผ ๋Š˜๋ฆฝ๋‹ˆ๋‹ค.
    • ๋ฐฐ์น˜ ํฌ๊ธฐ๋ฅผ ์ž‘๊ฒŒ ํ•˜๊ณ  gradient accumulation์„ ํ™œ์šฉํ•ฉ๋‹ˆ๋‹ค.
    • ๋А๋ฆฌ๋‹ค๊ณ  ํ•ด์„œ ๋ถˆ๊ฐ€๋Šฅํ•œ ๊ฒƒ์ด ์•„๋‹ˆ๋ผ, ๋‹จ์ง€ ๊ทœ์œจ์ด ํ•„์š”ํ•  ๋ฟ์ž…๋‹ˆ๋‹ค.
  4. Publish the Game AI Idea

    • ์˜จ๋ผ์ธ ํ•™์Šต, ์Šค์Šค๋กœ ์ ์‘ํ•˜๋Š” ์ƒ๋Œ€, ๊ฐœ์ธํ™”๋œ ๋‚œ์ด๋„ ๊ณก์„ .
    • Dev.to์— ๋ณ„๋„ ํฌ์ŠคํŠธ๋กœ ์˜ฌ๋ฆด ๊ฐ€์น˜๊ฐ€ ์žˆ์Šต๋‹ˆ๋‹ค.

๋‚˜๋Š” 15์‚ด์ด๊ณ  GPU๋„, ์‹คํ—˜์‹ค๋„, ์ž๊ธˆ๋„ ์—†์Šต๋‹ˆ๋‹คโ€”์˜ค๋ฒ„ํžˆํŒ…๋˜๋Š” ๋…ธํŠธ๋ถ, ๋Š์ž„์—†๋Š” ์•„์ด๋””์–ด, ๊ทธ๋ฆฌ๊ณ  ํฌ๊ฒŒ ์‹คํŒจํ•˜๋Š” ํ”„๋กœ์ ํŠธ๋งŒ ์žˆ์„ ๋ฟ์ž…๋‹ˆ๋‹ค. ๋‚ด๊ฐ€ ๋ฐฐ์šด ๊ฒƒ์€ AI๋ฅผ ์–ด๋–ป๊ฒŒ ํ›ˆ๋ จํ•˜๋А๋ƒ๊ฐ€ ์•„๋‹ˆ๋ผ, ์ข‹์•„ํ•˜๋˜ ํ”„๋กœ์ ํŠธ๊ฐ€ ์‚ฌ๋ผ์งˆ ๋•Œ๋„ ์–ด๋–ป๊ฒŒ ๋ฒ„ํ‹ฐ๋Š”๊ฐ€ ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์‹คํŒจ๋Š” ์ •์ง€ ์‹ ํ˜ธ๊ฐ€ ์•„๋‹ˆ๋ผ ๋ฐฉํ–ฅ ์ „ํ™˜์ž…๋‹ˆ๋‹ค. ์ž‘์€ ๋ชจ๋ธ๋„ ์‚ด์•„์žˆ๋Š” ๋А๋‚Œ์„ ์ค„ ์ˆ˜ ์žˆ๊ณ , ๋ฏธ์™„์„ฑ ์ž‘์—…๋„ ์—ฌ์ „ํžˆ ์˜๋ฏธ๊ฐ€ ์žˆ์œผ๋ฉฐ, ๋ชจ๋“  ์ œ์•ฝ์ด ์ฐฝ์˜์„ฑ์„ ๊ฐ•์š”ํ•ฉ๋‹ˆ๋‹ค.

GPU๊ฐ€ ์—†๋Š” 15์‚ด์ด ๊ณ„์†ํ•ด์„œ ๋งŒ๋“ค๊ณ , ์‹คํŒจํ•˜๊ณ , ๋ฐฐ์šฐ๊ณ  ์žˆ๋‹ค๋ฉด, ์šฐ๋ฆฌ๊ฐ€ ์‹ค์ œ๋กœ ํ›ˆ๋ จ์‹œํ‚ค๋Š” ์‹œ์Šคํ…œ์€ AI๊ฐ€ ์•„๋‹ˆ๋ผ ์šฐ๋ฆฌ ์ž์‹ ์ผ์ง€๋„ ๋ชจ๋ฆ…๋‹ˆ๋‹ค. ๐Ÿฆ‰โœจ

Back to Blog

๊ด€๋ จ ๊ธ€

๋” ๋ณด๊ธฐ ยป

2025: LLM์˜ ํ•ด

์ฃ„์†กํ•ฉ๋‹ˆ๋‹ค. ๋ฒˆ์—ญํ•˜๋ ค๋Š” ํ…์ŠคํŠธ๋ฅผ ์ง์ ‘ ์ œ๊ณตํ•ด ์ฃผ์‹œ๋ฉด ๋„์™€๋“œ๋ฆฌ๊ฒ ์Šต๋‹ˆ๋‹ค.

[Paper] SpaceTimePilot: ๋™์  ์žฅ๋ฉด์˜ ๊ณต๊ฐ„ ๋ฐ ์‹œ๊ฐ„์— ๊ฑธ์นœ ์ƒ์„ฑ์  ๋ Œ๋”๋ง

์šฐ๋ฆฌ๋Š” SpaceTimePilot์„ ์†Œ๊ฐœํ•ฉ๋‹ˆ๋‹ค. ์ด๋Š” ๊ณต๊ฐ„๊ณผ ์‹œ๊ฐ„์„ ๋ถ„๋ฆฌํ•˜์—ฌ ์ œ์–ด ๊ฐ€๋Šฅํ•œ ์ƒ์„ฑ ๋ Œ๋”๋ง์„ ๊ฐ€๋Šฅํ•˜๊ฒŒ ํ•˜๋Š” ๋น„๋””์˜ค ๋””ํ“จ์ „ ๋ชจ๋ธ์ž…๋‹ˆ๋‹ค. ๋‹จ์ผ ์นด๋ฉ”๋ผ ๋น„๋””์˜ค๊ฐ€ ์ฃผ์–ด์ง€๋ฉด, SpaceTimePilโ€ฆ