๐ฆ ๋ถ์์ง ๋ชจ๋ธ์์ ์ด์์๋ ์์คํ ์ผ๋ก: GPU ์์ด AI๋ฅผ ๊ตฌ์ถํ ๋์ ์ฌ์
Source: Dev.to
์๊ฐ
์ด๊ธฐ์ ์ค์๋ถํฐ ํ์ฌ ์งํ ์ค์ธ ์คํ๊น์ง ์ฌ์ ์ ๊ฐ๋ตํ ์ดํด๋ณด๊ณ , ๊ทธ ๊ณผ์ ์์ ์ป์ ๊ตํ๋ค์ ์๊ฐํฉ๋๋ค.
ํ๋ก์ ํธ #1: Lynqbit โ ๋ด๊ฐ ๊ฐ์ฅ ์ข์ํ๋ ์คํจ
Lynqbit์ ๋์ ์ฒซ ๋ฒ์งธ ์ง์ ํ ์ฌ๋์ด์์ต๋๋ค: 90โฏMโparameter ๋ชจ๋ธ๋ก, ์ผ์ฌ ์ฐจ๊ณ , ์์ ์ด๋ฉฐ, ์ฝ๊ฐ ์ด์ํ์ต๋๋ค.
- ์คํจ ํฌ์ธํธ
- ์์คํ ๊ตฌ์ฑ ๋ฌธ์
- ์ ์ ํ ํ์ต ์ธํ๋ผ ๋ถ์กฑ
- ๋ฐ๋ณต์ ์ง์ํ GPU ์์
๋ ๋ฌ๊ฐ์ ์ง์ค์ ์ธ ์์ ์ด ์ฌ๋ผ์ก๊ณ , ํ๋ก์ ํธ๋ ๋ถ๊ดด๋์์ต๋๋ค. ์์ฒ๊ฐ ๋์์ง๋ง, ์คํจ๊ฐ ๊ฐํนํ์ง๋ง ๋ช ํํ ์ค์น์ด๋ผ๋ ๊ฒ์ ๋ฐฐ์ ์ต๋๋ค.
์ธ์ฌ์ดํธ #1: ํ๋ จ์ ๋๊ธฐ์ง ์๊ณ ํ๋ฅด๊ฒ ํด์ผ ํ๋ค
Lynqbit์ ์ฌ๋ง์ ์ง๋ฌธ์ ๋ถ๋ฌ์ผ์ผ์ผฐ๋ค:
๋ง์ฝ ํ๋ จ์ด ํ๋์ ์ทจ์ฝํ ์์คํ ์ ์์กดํ์ง ์๋๋ค๋ฉด ์ด๋จ๊น์?
๋ฐ์ดํฐ์ ํ์ต์ด ์คํธ๋ฆฌ๋ฐ๋ ์ ์๋ค๋ฉด ์ด๋จ๊น์?
๊ทธ ์์ด๋์ด๊ฐ ๋ด ๋ค์ ์คํ์ ์ด๋์๋ค.
Project #2: Barn Owl AI โ Short Life, Big Lesson
Barn Owl AI explored streamed training:
- Concept: ํด๋ผ์ฐ๋โํธ์คํ ๋ฐ์ดํฐ์ , ์ํ๋ง ๊ธฐ๋ฐ ํ์ต, ์ง์์ ํ์ต.
- Reality: ํด๋ผ์ฐ๋ ๋ฐ์ดํฐ์ ์ด ๋ฉฐ์น ํ์ ์ค๋จ๋์๊ณ , ๋ฒ๊ทธ๋ ์์ ๋์ง ์์์ผ๋ฉฐ ํ๋ก์ ํธ๋ ์คํจํ์ต๋๋ค.
Lesson learned: ์์ค์ ์์์ง๋ง ํต์ฐฐ์ ๊ฑฐ๋ํ์ต๋๋ค.
ํ๋ก์ ํธ #3: Elf Owl AI โ ๋์ ์ฒซ ๋ฒ์งธ ์ง์ ํ ์ฑ๊ณต
Elf Owl AI๋ ์๊ณ ํผ๋์ค๋ฌ์ด, โ์ด์์๋โ ๋ชจ๋ธ์ด์์ต๋๋ค:
- 2500๋ง ํ๋ผ๋ฏธํฐ
- ์ฐฝ์์ ์ด๊ณ ํ๊ฐ์ ์ธ, ์ ํ์ ๋ฌธ๋ฒ๊ณผ ๋ณ๋์ค๋ฌ์ด ์ฑ๊ฒฉ์ ๊ฐ์ง
์ฑ๊ณต ์ฌ๋ก
- ์์ ํ ํ์ต๋๊ณ ์คํ์์คํ๋จ
- ๊ณต๊ฐ์ ์ผ๋ก ์ถ์๋จ (์๋ฒฝํ์ง๋ ์์ง๋ง ์กด์ฌํ์)
์กด์ฌ ์์ฒด๊ฐ ์ค์ํฉ๋๋ค.
Project #4: Xenoglaux AI (Xeno AI) โ The Ongoing Battle
- GitHub:
- Dataset: 75โฏ000๊ฐ ์ด์์ ์์์ + ์คํ์์ค ํญ๋ชฉ, ์คํธ๋ฆฌ๋ฐ ํ์ต์ ์ํด ์ค๊ณ๋จ
- Modular evolution: ์ฌ๋นผ๋ฏธ ์๋ฆฌ์ฆ ํํธโฏ2
Training bottleneck
- GPU์์ ์ฝโฏ15โฏ์๊ฐ (ํ์ฉ ๊ฐ๋ฅ)
- CPU์์๋ ๋๋ฌด ๋๋ฆผ
- ์จ๋ผ์ธ TPU๋ ๊ฐ์ ํ ํ์กฐํจ
ํ์ฌ ์ฅ์ ๋ฌผ์ ๋ชจ๋ธ์ด๋ ๋ฐ์ดํฐ๊ฐ ์๋๋ผ ํ๋์จ์ด ์ ํ์ ๋๋ค.
์ฌ์ด๋ ํ์คํธ: ๋น์ ์ ๋ฐฐ์ฐ๋ ๊ฒ์
Xeno์ ์จ๋ฆํ๋ ์ค, ํ๋ ์ด์ด์๊ฒ์ ํ์ตํ๋ AI ์๋๊ฐ ์๋ ๊ฒ์์ ๋ง๋ค์์ต๋๋ค:
- ๋งค์น 1 โ AI๋ ๋ฌธ์ ๊ทธ๋๋ก ๋ธ๋ก์ผ๋ก ์์ํฉ๋๋ค.
- ๋ฐ์ดํฐ ์์ง โ ํ๋ ์ด์ด์ ์์ง์, ์์น, ๊ฒฐ์ ์ด JSON ํํ๋ก ์ ์ฅ๋ฉ๋๋ค.
- ์ฌํ์ต ๋ฃจํ โ ๊ฐ ๋งค์น๊ฐ ๋๋ ๋ค AI๋ ๋ง์ง๋ง ์ฒดํฌํฌ์ธํธ๋ฅผ ๋ถ๋ฌ์ ์๋ก์ด ๋ฐ์ดํฐ๋ก ์ฌํ์ตํ๊ณ , ์ด๋ฅผ ๋ฐ๋ณตํฉ๋๋ค.
๊ฒฐ๊ณผ (๋น๊ณต๊ฐ ํ ์คํธ)
- 20โ30 ๋งค์น โ ๊ด์ฐฎ์ ํ๋ ์ด์ด ์์ค
- 400โ500 ๋งค์น โ ์ด๊ธธ ์ ์์
์ด๊ฒ์ ์คํฌ๋ฆฝํธ๋ ํ๋์ด ์๋๋ผ โํ๋๋ ์ง๋ฅโ์ ๋๋ค.
์ง๊ธ๊น์ง ๊นจ๋ฌ์ ์
- ์คํจ๋ ๋ญ๋น๋ ์์ ์ด ์๋๋ผ ์์ถ๋ ์ง์์ด๋ค.
- ์์ ๋ชจ๋ธ๋ ์ฌ์ ํ ์ด์์๋ ๋๋์ ์ค ์ ์๋ค.
- ์คํธ๋ฆฌ๋ฐ + ์ ์ง์ ํ์ต์ ๊ณผ์ํ๊ฐ๋๊ณ ์๋ค.
- ํ๋์จ์ด๊ฐ ์ฐฝ์์ฑ์ ์ ํํ๋ ์ ๋๊ฐ ์์ด๋์ด๋ณด๋ค ํฌ๋ค.
์ ํ๋ ์์์ผ๋ก ๊ตฌ์ถํ๊ณ ์๋ค๋ฉด, ๋น์ ์ ํผ์๊ฐ ์๋๋ค.
Next Steps (Real Talk)
-
Rename Strategy for Xeno
- โXenoglaux AIโ๋ฅผ ์๋ฆฌ์ฆ ์ด๋ฆ์ผ๋ก ์ ์งํฉ๋๋ค.
- ํผ๋์ ํผํ๊ธฐ ์ํด
Xeno-25M,Xeno-40M,Xeno-Lite์ ๊ฐ์ ๋ชจ๋ธโ๋ณ ํ๊ทธ๋ฅผ ์ฌ์ฉํฉ๋๋ค.
-
Stop Full Retraining โ Go Incremental
- ์์ ์ฒญํฌ(2โฏkโ5โฏk ์ํ) ๋จ์๋ก ํ์ตํฉ๋๋ค.
- ์ฒดํฌํฌ์ธํธ๋ฅผ ์ ๊ทน์ ์ผ๋ก ์ ์ฅํฉ๋๋ค.
- 15์๊ฐ ๋ง๋ผํค ๋์ ๋งค์ผ ํ์ต์ ์ฌ๊ฐํฉ๋๋ค.
- โ๋๋ฆฝ ํ์ตโ(drip learning)์ ์๊ฐํ๊ณ , ํ์์ฒ๋ผ ๋ชฐ์์น์ง ์์ต๋๋ค.
-
Exploit What You Have (CPU + Time)
- ๊ฐ๋ฅํ ๊ฒฝ์ฐ ๋ฎ์ ์ ๋ฐ๋(fp16/int8)๋ฅผ ์ฌ์ฉํฉ๋๋ค.
- ์ํฌํฌ๋ ์ค์ด๊ณ , ๋ฐ๋ณต ํ์๋ฅผ ๋๋ฆฝ๋๋ค.
- ๋ฐฐ์น ํฌ๊ธฐ๋ฅผ ์๊ฒ ํ๊ณ gradient accumulation์ ํ์ฉํฉ๋๋ค.
- ๋๋ฆฌ๋ค๊ณ ํด์ ๋ถ๊ฐ๋ฅํ ๊ฒ์ด ์๋๋ผ, ๋จ์ง ๊ท์จ์ด ํ์ํ ๋ฟ์ ๋๋ค.
-
Publish the Game AI Idea
- ์จ๋ผ์ธ ํ์ต, ์ค์ค๋ก ์ ์ํ๋ ์๋, ๊ฐ์ธํ๋ ๋์ด๋ ๊ณก์ .
- Dev.to์ ๋ณ๋ ํฌ์คํธ๋ก ์ฌ๋ฆด ๊ฐ์น๊ฐ ์์ต๋๋ค.
๋๋ 15์ด์ด๊ณ GPU๋, ์คํ์ค๋, ์๊ธ๋ ์์ต๋๋คโ์ค๋ฒํํ ๋๋ ๋ ธํธ๋ถ, ๋์์๋ ์์ด๋์ด, ๊ทธ๋ฆฌ๊ณ ํฌ๊ฒ ์คํจํ๋ ํ๋ก์ ํธ๋ง ์์ ๋ฟ์ ๋๋ค. ๋ด๊ฐ ๋ฐฐ์ด ๊ฒ์ AI๋ฅผ ์ด๋ป๊ฒ ํ๋ จํ๋๋๊ฐ ์๋๋ผ, ์ข์ํ๋ ํ๋ก์ ํธ๊ฐ ์ฌ๋ผ์ง ๋๋ ์ด๋ป๊ฒ ๋ฒํฐ๋๊ฐ ํ๋ ๊ฒ์ ๋๋ค. ์คํจ๋ ์ ์ง ์ ํธ๊ฐ ์๋๋ผ ๋ฐฉํฅ ์ ํ์ ๋๋ค. ์์ ๋ชจ๋ธ๋ ์ด์์๋ ๋๋์ ์ค ์ ์๊ณ , ๋ฏธ์์ฑ ์์ ๋ ์ฌ์ ํ ์๋ฏธ๊ฐ ์์ผ๋ฉฐ, ๋ชจ๋ ์ ์ฝ์ด ์ฐฝ์์ฑ์ ๊ฐ์ํฉ๋๋ค.
GPU๊ฐ ์๋ 15์ด์ด ๊ณ์ํด์ ๋ง๋ค๊ณ , ์คํจํ๊ณ , ๋ฐฐ์ฐ๊ณ ์๋ค๋ฉด, ์ฐ๋ฆฌ๊ฐ ์ค์ ๋ก ํ๋ จ์ํค๋ ์์คํ ์ AI๊ฐ ์๋๋ผ ์ฐ๋ฆฌ ์์ ์ผ์ง๋ ๋ชจ๋ฆ ๋๋ค. ๐ฆโจ