๐ ๊ฐ๋ฐ์๋ค์ด AI ๋ฒ์ฆ์๋๋ฅผ ์ดํดํ๋ ์ฒ์ ๋ฉ์ถ ์ ์๋ ๋ฐฉ๋ฒ
Source: Dev.to
โIf you canโt explain it simply, you donโt understand it well enough.โ โ Albert Einstein
๋น์ ๋ ๋๊ตฐ๊ฐ๊ฐ ์์ด์ ์ AI ์ํฌํ๋ก์ฐ์ RAG ํ์ดํ๋ผ์ธ, ๋ฒกํฐ ์๋ฒ ๋ฉ์ ๋ํด ์๊ธฐํ๊ธฐ ์์ํ๊ณ ๋ชจ๋๊ฐ ๋ง์น ์์ ํ ์ดํดํ ๋ฏ ๊ณ ๊ฐ๋ฅผ ๋๋์ด๋ ์ํฉ์ ๊ฒฝํํด ๋ณธ ์ ์๋์? ์ ๋ ๊ทธ๋ ๊ฐ๋ฐ์์์ด์โ์ดํดํ์ง ๋ชปํ๋ฉด์๋ ์ดํดํ๋ ์ฒ ํ์ฃ .
๋ช ๋ฌ ์ , ์ ๋ ํ๊ณ์ ์ ๋ค๋ค๋์ต๋๋ค. ๋ชจ๋ ๊ฐ๋ฐ์ ์ค๋ ๋์ ๊ธฐ์ ํ ํฌ๊ฐ ์ค์ง์ ์ธ ๋ช ํ์ฑ ์์ด ๋ฒ์ฆ์๋๋ง ๊ฐ๋ํ๊ฑฐ๋ ์. ๊ทธ๋์ ๋ ์ด์ ๊ฐ์ฅํ์ง ์๊ธฐ๋ก ํ๊ณ , ์ง์ ๋ฐฐ์ฐ๊ธฐ๋ก ๊ฒฐ์ฌํ์ต๋๋ค. ๋ฐ์ : ๋๋ถ๋ถ์ ์ฌ๋๋ ๋ค ๊ฐ์ฅํ๊ณ ์์์ต๋๋ค.
The Research Paper Rabbit Hole
์ฒซ ๋ฒ์งธ ์๋? IBM ์ฐ๊ตฌ ๋ ผ๋ฌธ์ ํ๊ณ ๋ค์์ต๋๋ค. ๋ด์ฉ์ ์ฒ ์ ํ๊ณ ์ ์กฐ์ฌ๋์ง๋ง, ๋์์ ๊ต์ฅํ ๋นฝ๋นฝํ์ด์โํ ํธ๋ง ์ฝ์ด๋ ๋จธ๋ฆฌ๊ฐ ํฐ์ง ์ง๊ฒฝ์ด์์ฃ .
๋ค์์ YouTube. ํ๋ฅญํ ์ฝํ ์ธ ๊ฐ ๋ง์ง๋ง, ํธ๋์คํฌ๋จธ์ ๊ดํ ์์ ํ๋, ์๋ฒ ๋ฉ์ ๊ดํ ์์ ํ๋, ๊ทธ๋ฆฌ๊ณ โ์ดํ ์ ๋ฉ์ปค๋์ฆโ์ด๋ผ๋ ๊ฐ๋ฒผ์ด ์ธ๊ธ์ ๋ฃ๊ณ ๋๋, ์ด ๋ชจ๋ ๊ฒ์ด ์ด๋ป๊ฒ ์ฐ๊ฒฐ๋๋์ง ๊ถ๊ธํด์ก์ต๋๋ค.
๊ณ์ ์๊ฐํ์ฃ : โ์ ๋ฐ ๋๊ตฐ๊ฐ ํ ๋ฒ์ ๋ณด๊ธฐ ์ข๊ฒ ์ ๋ฆฌ๋ ์ง๋ ํ๋๋ง ์ค์. ๋ชจ๋ ๊ฑธ ํ ๊ณณ์, ์ค์ ๋ก ์ดํด๊ฐ ๋๋ ํํ๋ก์?โ
๊ทธ๋์โฆ ์ง์ ๋ง๋ค์์ต๋๋ค.
Key Takeaways
- ๋๋ฌด ๋นฝ๋นฝํ๊ฑฐ๋ โ์ ๋ฌธ๊ฐ ์ ์ฉโ์ด๋ผ๊ณ ๋๊ปด์ง๋ AI ์ฉ์ด๋ค์ ํ์ดํ๊ฒ ํ์ด๋ธ ๋ณด๊ธฐ.
- ๊ธฐ๋ณธ ๊ฐ๋ ๋ค์ด ์ด๋ป๊ฒ ์ฐ๊ฒฐ๋๋์ง โ ๋ชจ๋ธ, ํ๋กฌํํธ, ์์ ์ฑ, ๊ทธ๋ฆฌ๊ณ AI ์คํ์ ์งํฑํ๋ ๋ ์ด์ด๋ค.
- ํ๋กฌํํธ๊ฐ ์ ์ค์ํ์ง, ์ ๊ฐ๋ ์ํค๋์ง, ๊ทธ๋ฆฌ๊ณ ์ด๋ฅผ ์ด๋ป๊ฒ ์ฌ๋ฐ๋ฅด๊ฒ ์ ์งํ ์ ์๋์ง.
- ๊ธฐ๊ณ๊ฐ ์ด๋ป๊ฒ ํ์ตํ๊ณ , ์ ๋ณด๋ฅผ ๊ฒ์ํ๋ฉฐ, ๋ ๋์ ๋ต๋ณ์ ๋ง๋ค์ด ๋ด๋์ง.
- ๋จ์ ์ฑํ ์์คํ ์์ ๋๊ตฌ, ์์ , ๊ทธ๋ฆฌ๊ณ ์ฌ๋ฌ๋ถ์ ๋์ ํด ํ๋ํ ์ ์๋ ์์ ํ AI ๋์ฐ๋ฏธ๊น์ง์ ํ๋ฆ.
- AI ์ค๋ ๋, ํฌ์คํธ, ๋ ผ๋ฌธ, ์์ ๋ฑ์ ์ฝ์ ๋ ๊ธธ์ ์๊ฑฐ๋ ์ง์น์ง ์๋ ๋ฐฉ๋ฒ.
์ข ์ด์ ํ์ ์ค๋นํ๊ณ , ๋ฉ๋ชจ๋ฅผ ํ๋ฉด์ ์์ ์ ์๋์ ๋ง๊ฒ ํก์ํ์ธ์. ์๋๋ฅผ ํ์ ์์ต๋๋ค.
Before We Start
์์ ์ด๋ณด๋ผ๋ฉด, ์๋ ๊ฐ๋ ๋ค์ ๋ค์ด๋ณธ ์ ์ด ์์ ๊ฒ๋๋ค:
Core Concepts
- Neural Networks โ ๋๋ฅผ ๋ชจ๋ฐฉํ, ์ํธ ์ฐ๊ฒฐ๋ ๋ ธ๋ ๊ตฌ์กฐ๋ก ์ ๋ณด๋ฅผ ์ฒ๋ฆฌํฉ๋๋ค.
- Deep Learning โ ๋ง์ ์ ๊ฒฝ๋ง ๋ ์ด์ด๋ฅผ ์์ ๋๊ท๋ชจ ๋ฐ์ดํฐ์ ์์ ๋ณต์กํ ํจํด์ ํ์ตํฉ๋๋ค.
- Natural Language Processing (NLP) โ ์ปดํจํฐ๊ฐ ์ธ๊ฐ ์ธ์ด๋ฅผ ์ดํดํ๊ณ , ํด์ํ๋ฉฐ, ์์ฑํ๋๋ก ๊ฐ๋ฅด์นฉ๋๋ค.
- Machine Learning โ ์ปดํจํฐ๊ฐ ๋ช ์์ ์ธ ํ๋ก๊ทธ๋๋ฐ ์์ด ๋ฐ์ดํฐ์์ ํจํด์ ํ์ตํ๋ ๋์ ๋ถ์ผ์ ๋๋ค.
- Training Data โ AI ๋ชจ๋ธ์๊ฒ ํจํด๊ณผ ๊ด๊ณ๋ฅผ ๊ฐ๋ฅด์น๋ ๋ฐ ์ฌ์ฉ๋๋ ์์๋ค์ ๋ชจ์.
- Model โ ์์ธก์ ํ๊ฑฐ๋ ์ถ๋ ฅ์ ์์ฑํ ์ ์๋ ํ์ต๋ AI ์์คํ .
- Algorithm โ ๋ชจ๋ธ์ด ๋ฐ์ดํฐ๋ก๋ถํฐ ํ์ตํ๋๋ก ํ๋ ์ํ์ ๊ท์น.
- Pattern Recognition โ ๋ฐ์ดํฐ ์์์ ๋ฐ๋ณต๋๋ ๊ตฌ์กฐ, ๊ด๊ณ, ํธ๋ ๋๋ฅผ ์๋ณํ๋ AI ๋ฅ๋ ฅ.
- Prediction โ ํ์ต๋ ๋ชจ๋ธ์ด ํ์ต๋ ํจํด์ ํ์ฉํด ๋ค์์ ์ฌ ๊ฒ์ ์ถ์ธกํด ์ถ๋ ฅํ๋ ๊ณผ์ .
- Inference โ ํ๋ จ๋ ๋ชจ๋ธ์ ์ฌ์ฉํด ์๋ก์ด, ๋ณด์ง ๋ชปํ ๋ฐ์ดํฐ์ ๋ํด ์ถ๋ ฅ์ด๋ ๊ฒฐ์ ์ ๋ด๋ฆฌ๋ ๊ฒ.
The FourโPhase Journey
The FourโPhase Learning Framework
์ฉ์ด์ ํ๋ง๋ฆฌ๊ธฐ๋ณด๋ค, AI ๊ฐ๋ ์ด ์ค์ ๋ก ์ด๋ป๊ฒ ์ฐ๊ฒฐ๋๋์ง ๋ณด์ฌ๋๋ฆฝ๋๋ค.
๐ฏ Phase 1: The Foundation โ How AI Learns
๋ํ ์ธ์ด ๋ชจ๋ธ(LLM)์ ๋จผ์ ํ๋ จ์ ํตํด ํ์ตํด์ผ ํ๋ฉฐ, ์ด๋ ์ธ ๊ฐ์ง ๊ธฐ๋ณธ ๋ฐฉ์์ผ๋ก ์ด๋ฃจ์ด์ง๋๋ค:
- Supervised learning โ ๋ผ๋ฒจ์ด ๋ถ์ ์์๋ฅผ ํตํด ํ์ต.
- Selfโsupervised learning โ ๋ผ๋ฒจ์ด ์๋ ๋ฐ์ดํฐ์์ ๋๋ฝ๋ ๋ถ๋ถ์ ์์ธกํ๋ฉฐ ํ์ต(ํ๋ LLM์ด ์ฃผ๋ก ์ฌ์ฉํ๋ ๋ฐฉ์).
- Reinforcement learning โ ํผ๋๋ฐฑ์ ํตํ ์ํ์ฐฉ์ค ํ์ต.
The Training Pipeline
ํ๋ จ ์ค ๋ชจ๋ธ์ ๋ฐฉ๋ํ ํ ์คํธ๋ฅผ ๋ค์๊ณผ ๊ฐ์ด ์ฒ๋ฆฌํฉ๋๋ค:
- ํ ์คํธ๋ฅผ ํ ํฐ์ผ๋ก ๋ถํ .
- ํ ํฐ์ ์๋ฒ ๋ฉ์ผ๋ก ๋ณํ.
- ์ดํ ์ ๋ฉ์ปค๋์ฆ์ ์ฌ์ฉํด ๊ฐ์ฅ ์ค์ํ ๋ถ๋ถ์ ํ๋จ.
- ๋ณต์กํ ๊ด๊ณ๋ฅผ ํฌ์ฐฉํ๋ ํธ๋์คํฌ๋จธ ๋ ์ด์ด๋ฅผ ํตํด ํจํด์ ๊ตฌ์ถ.
๋ชจ๋ธ์ ์ค์ ์๋น์ค์ ํฌ์ ํ๊ธฐ ์ํด์๋ ๋ค์์ ์ ์ฉํฉ๋๋ค:
- Distillation โ ํฐ ๋ชจ๋ธ์ ๋ ์๊ณ ๋น ๋ฅธ ๋ชจ๋ธ๋ก ์์ถ.
- Quantization โ ์ซ์ ์ ๋ฐ๋๋ฅผ ๋ฎ์ถฐ(์: 32โbit์์ 8โbit ๋๋ 4โbit๋ก) ์ ํ๋ ํ๋์จ์ด์์๋ ๋น ๋ฅธ ์ถ๋ก ๊ฐ๋ฅ.
๐ Phase 2: Knowledge Retrieval โ Bridging Training and RealโTime Access
ํ๋ จ์ด ๋๋ ๋ค, ๋ชจ๋ธ์ ์ถ๋ก ์ ํจ์จ์ ์ผ๋ก ์ ๋ณด๋ฅผ ์ ๊ทผํ ๋ฐฉ๋ฒ์ด ํ์ํฉ๋๋ค. ์ฌ๊ธฐ์ ์๋งจํฑ ๊ฒ์๊ณผ ๋ฒกํฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค๊ฐ ํต์ฌ์ด ๋ฉ๋๋ค.
How Semantic Search Works
์ ํต์ ์ธ ํค์๋ ๋งค์นญ๊ณผ ๋ฌ๋ฆฌ, ์๋งจํฑ ๊ฒ์์ ์๋ฏธ๋ฅผ ์ดํดํฉ๋๋ค:
- โ์ค๋งํธํฐโ์ ๊ฒ์ํ๋ฉด โํด๋ํฐโ, โ๋ชจ๋ฐ์ผ ๋๋ฐ์ด์คโ๋ ํจ๊ป ์ฐพ์๋ ๋๋ค.
- ๊ด๋ จ ๊ฐ๋ ๋ค์ ๋ฒกํฐ ๊ณต๊ฐ์์ ์๋ก ๊ฐ๊น๊ฒ ์์นํฉ๋๋ค.
Vector Databases
๋ฒกํฐ ๋ฐ์ดํฐ๋ฒ ์ด์ค๋ ๋ฐ์ดํฐ๋ฅผ ๊ณ ์ฐจ์ ์์น ๋ฐฐ์ด ํํ๋ก ์ ์ฅํด, ์ค์๊ฐ AI ์ ํ๋ฆฌ์ผ์ด์ ์ ํ์์ ์ธ ์ด๊ณ ์ ์ ์ฌ๋ ๊ฒ์์ ๊ฐ๋ฅํ๊ฒ ํฉ๋๋ค. ์ด ๊ฒ์ ๊ธฐ๋ฅ์ ๋ชจ๋ธ์ด ํ๋ จ ์ค ๋ฐฐ์ด ์ง์๊ณผ ์ง๋ฌธ์ ๋ตํ ๋ ์ ๊ทผํ ์ ์๋ ์ ๋ณด๋ฅผ ์ฐ๊ฒฐํด ์ค๋๋ค.
๐ฌ Phase 3: User Interaction โ Prompts, Safety, and Inference
ํ๋กฌํํธ๋ AI์ ์ํตํ๋ ์ธํฐํ์ด์ค์ ๋๋ค. ์ฌ์ฉ์๊ฐ ํ๋กฌํํธ๋ฅผ ์ ์ถํ๋ฉด ๋ชจ๋ธ์ ๋ค์ ๊ณผ์ ์ ๊ฑฐ์นฉ๋๋ค:
- ์ ๋ ฅ์ ํ ํฐํ.
- ํ ํฐ์ ์๋ฒ ๋ฉ์ผ๋ก ๋ณํ.
- ์ถ๋ก ์ ํตํด ํ ๋ฒ์ ํ๋์ฉ ํ ํฐ์ ์์ฑ.
- ๊ฐ๋ฅํ ๋ค์ ํ ํฐ๋ค์ ํ๋ฅ ์ ๊ณ์ฐ.
- ๊ฐ์ฅ ๊ฐ๋ฅ์ฑ์ด ๋์ ํ ํฐ์ ์ถ๋ ฅ.
Prompt Engineering Techniques
- Zeroโshot โ ์์ ์์ด ๋ฐ๋ก ์์ฒญ.
- Fewโshot โ ๋ช ๊ฐ์ ์ํ ์ถ๋ ฅ์ ์ ๊ณต.
- Chainโofโthought โ ๋จ๊ณ๋ณ ์ฌ๊ณ ๊ณผ์ ์ ์ ์.
Safety Considerations
ํ๋กฌํํธ์๋ ์ํ์ด ๋ฐ๋ฆ ๋๋ค:
- Hallucinations โ ํ๋ จ ๋ฐ์ดํฐ์ ๊ทผ๊ฑฐํ์ง ์์ ํ๊ตฌ์ ์๋ต.
- Prompt injection โ ์ฌ์ฉ์ ์ ๋ ฅ์ ์จ๊ฒจ์ง ์ ์์ ์ธ ๋ช ๋ น.
๊ทธ๋์ guardrailsโ๋ฐ์ดํฐ, ๋ชจ๋ธ, ์ ํ๋ฆฌ์ผ์ด์ , ์ํฌํ๋ก ์ ๋ฐ์ ๊ฑธ์ณ ์๋ํ๋ ์์ ์ฅ์นโ๊ฐ AI ์์คํ ์ ์์ ํ๊ณ ์ ๋ขฐํ ์ ์๊ฒ ์ ์งํ๋ ๋ฐ ํ์์ ์ ๋๋ค.


