๐ Local LLM Ops 2025: ๊ฐ๋ฐ์๋ฅผ ์ํ ํฌ์ผ ์ฌ์ด์ฆ ์ ๊ฒฝ๋ง ์คํ ๊ฐ์ด๋
Source: Dev.to
Overview

2025๋ , ๊ฐ์ ์ฉ PC์์ ๋ก์ปฌ ์ ๊ฒฝ๋ง์ ์คํํ๋ ๊ฒ์ด ์ด์ ๋ ์ ํธ๊ฐ๋ค์ ์ทจ๋ฏธ๋ฅผ ๋์ด ์ค์ ์ ๋ฌด ๋๊ตฌ๊ฐ ๋์์ต๋๋ค. โ๋์งํธ ํด๋ก โ์ ๋ง๋ค๋ , ํฐ๋ฏธ๋์์ ์ผ์ ์์ ์ ์๋ํํ๋ , ๋ณด์ AIโ์ง์ VPN ์๋น์ค๋ฅผ ๋ฐฐํฌํ๋ , ์ด ๊ฐ์๊ฐ ์ํํธ์จ์ด ํ์์ ๋์์ด ๋ ๊ฒ์ ๋๋ค.
Part 1: โEnginesโ (Backend)
๋ชจ๋ธ ๊ฐ์ค์น๋ฅผ GPU์ ๋ก๋ํ๊ณ API๋ฅผ ์ ๊ณตํ๋ ํต์ฌ ํ๋ก๊ทธ๋จ๋ค.
- KoboldCPP: GGUF (Llama/Loki) โ 8โฏGB VRAM์ ๋ํ ๊ธ๋ณธ์ ํ์ค. ๋งค์ฐ ๊ฐ๋ณ๊ณ SillyTavern๊ณผ ์๋ฒฝํ๊ฒ ์๋ํฉ๋๋ค.
- Oobabooga (WebUI) โ ์ ์ฐํ ์คํ ํ๊ฒฝ. ๋ชจ๋ ๊ฒ์ ์ง์: LoRA, EXL2, AWQ. ๊ฐ๋ ฅํ ๋ฐ์ดํฐ๋ฒ ์ด์ค์ DarkPlanet ์คํ์ผ์ โ๋ธ๋ ๋โํด์ผ ํ ๋ ์ด์์ ์ ๋๋ค.
- Ollama โ ์ฝ์ ๊ธฐ๋ฐ ๋ฏธ๋๋ฉ๋ฆฌ์ฆ. ํ ์ค ๋ช ๋ น์ผ๋ก ์คํ. ๊ฐ๋จํ ๋ก์ปฌ API ์๋ํฌ์ธํธ์ ๊ฐ์ฅ ์ ํฉํฉ๋๋ค.
- LocalAI (Docker) โ OpenAI API์ ์์ ํธํ. ์์ฒด ์๋ฒ์ ๋ฐฐํฌํ๊ธฐ์ ์ด์์ ์ ๋๋ค.
Part 2: โFaceโ and Personality (Frontend)
ํต์ ๊ณผ โํด๋ก โ ์ค์ ์ด ์ด๋ฃจ์ด์ง๋ ์ธํฐํ์ด์ค.
SillyTavern โ โDigital Twinโ ํ๋ธ
- ๋จ์ ์ฑํ ์ด ์๋๋ผ ๋กคํ๋ ์ ์์ง์ ๋๋ค.
- World Info (Lorebook) โ ์ง์ ๋ฒ ์ด์ค(์ ํ๋ฒํธ, ์ด๋ฉ์ผ, ํ์ฌ ์ค๋ช ๋ฑ)๋ฅผ ์ ์ฅํฉ๋๋ค. ๋ชจ๋ธ์ ์์ฒญ ์์๋ง ์ด ๋ฐ์ดํฐ๋ฅผ ๊ฒ์ํด ์ปจํ ์คํธ๋ฅผ ๊น๋ํ๊ฒ ์ ์งํฉ๋๋ค.
- Character Cards โ โLag Cloneโ ์นด๋๋ฅผ ์์ฑํฉ๋๋ค. ์์ ์์คํ ํ๋กฌํํธ: โ๋น์ ์ IT ๋ณด์ ์ ๋ฌธ๊ฐ์ด์ ๋ฏธ๋์ด ์์ ์์ด๋ฉฐ, ๊ฒ์ด ์์ด ์์งํ๊ฒ ๋งํฉ๋๋ค.โ
- Group chats โ ๋ณํธ์ฌ ๋ชจ๋ธ๊ณผ ํ๋ก๊ทธ๋๋จธ ๋ชจ๋ธ์ ํฌํจํ โ๋ฏธํ โ์ ์ค์ ํฉ๋๋ค.
LibreChat / AnythingLLM
- LibreChat โ ๋ก์ปฌ ๋ชจ๋ธ ๋ฐ API(OpenRouter/Groq)์ ์ฐ๊ฒฐํ ์ ์๋ ChatGPT ํด๋ก ์ด ํ์ํ ๋.
- AnythingLLM โ RAG(์ง์โ๋ฒ ์ด์ค) ์์คํ ๊ตฌ์ถ์ ์ต์ . ๋ฌ์์ ๋ฒ๋ฅ PDF๋ VPN ๋ฌธ์๋ฅผ ๋ฃ์ผ๋ฉด ์ฌ์ค์ ๊ธฐ๋ฐํด ๋ต๋ณํฉ๋๋ค.
Part 3: AI in Action (Agentic Tools)
์ฑํ ๋ง์ผ๋ก๋ ๋ถ์กฑํ๊ณ ์ ๊ฒฝ๋ง์ด โ๋ง์ฐ์ค๋ฅผ ์์ง์ฌ์ผโ ํ ๋.
- Open Interpreter โ ๊ฐ๋ฐ์๋ฅผ ์ํ ๊ฐ๋ ฅ ๊ธฐ๋ฅ. ํฐ๋ฏธ๋์ ํตํด ์๋: โGPU ๋ถํ๋ฅผ ๋ถ์ํ๊ณ ๊ทธ๋ํ๋ฅผ ๊ทธ๋ ค์คโ๋ผ๊ณ ๋งํ๋ฉด ์์คํ ์ด ์ง์ Python ์ฝ๋๋ฅผ ์์ฑยท์คํํฉ๋๋ค.
- Continue.dev โ ๋ก์ปฌ Loki ๋๋ Vikhr์ ์ฐ๊ฒฐํด ์ฝ๋ ์์ฑ์ด ๊ฐ๋ฅํ VSโฏCode ํ๋ฌ๊ทธ์ธ. ๋ ์ ์๊ณ ๋ฆฌ์ฆ์ด Microsoft ์๋ฒ์ ๋ ๋์ง ์๊ฒ ํฉ๋๋ค.
Final checklist: what to look for?
์ด๋ฆ์ด๋ ๋งํฌ๋ฅผ ์์ด๋ฒ๋ ธ๋ค๋ฉด GitHub์ Hugging Face์์ ๋ค์ ํ๊ทธ๋ฅผ ๊ฒ์ํ์ธ์:
- Model formats: GGUF (universal), EXL2 (NVIDIA์ ๋น ๋ฆ), AWQ (์์ถ).
- Where to find models: Hugging Face (์ ์ Bartowski, mradermacher ๋๋ abliterated ํ๊ทธ ๊ฒ์).
- Key repositories:
SillyTavern/SillyTavernLostRuins/koboldcppKillianLucas/open-interpreter
Tip for 2025: ๋ก์ปฌ 8B (Loki/Vikhr) ๋ชจ๋ธ์ด โ๋ฉ์ฒญํด ๋ณด์ด๋ฉดโ, Llamaโ3โ70BโAbliterated API ํค๋ฅผ ํตํด ์ฐ๊ฒฐํด ๋ณด์ธ์. ๊ฒ์ด ์์ด ์์ ๋ก์ด ๋ฐ์ธ๊ณผ ํจ๊ป GPTโ4 ์์ค์ ์ง๋ฅ์ ์ป์ ์ ์์ต๋๋ค.
#LocalLLM #SillyTavern #Oobabooga #KoboldCPP #OpenInterpreter #SelfHostedAI #AIops #MachineLearning #Python #GPU #CUDA #LLMops #PrivacyFirst #DigitalTwin #UncensoredAI #ITSecurity #VPN #CloudComputing #Automation