텔레그램 연동 – 0달러 개인 자율 AI 어시스턴트 – 파트 5
출처: Dev.to
소개
Zero Dollar AI Assistant 시리즈의 Part 5 — 텔레그램을 통한 개인 AI 비서, 항상 켜져 있음. Part 1에서는 아키텍처를, Part 2에서는 Oracle Cloud 설정을, Part 3에서는 Ollama와 모델 선택을, Part 4에서는 Linux에 OpenClaw를 설치하는 과정을 다룹니다.
시리즈를 따라오셨다면 다음을 갖추고 계실 겁니다:
- Oracle ARM 서버가 24 시간 내내 비용 없이 운영 중 – Part 2
- Ollama와 로컬 모델
llama3.2:3b, 그리고 무료 백업 모델 Gemini 2.5 Flash – Part 3 - OpenClaw 게이트웨이가 systemd 서비스로 실행 중이며, 텔레그램 봇이 설정돼 대기 중 – Part 4
이번 마지막 글에서는 마지막 단계, 즉 텔레그램 계정과 페어링하고, 엔드‑투‑엔드 흐름을 테스트하며, 실제로 만든 것이 무엇인지 이해하고, 일상 사용에 대한 기대치를 설정하는 방법을 다룹니다.
OpenClaw 페어링 시스템
OpenClaw는 누가 에이전트와 대화할 수 있는지를 제어하기 위해 페어링 방식을 사용합니다. 봇 토큰은 봇이 존재하는 순간 사실상 공개되기 때문에, 페어링을 통해 승인된 계정만 응답을 받게 됩니다.
페어링 흐름 시작하기
- 휴대폰에서 텔레그램을 엽니다.
- 봇 사용자명을 검색합니다 (예:
@myassistant_bot). - Start 버튼을 탭합니다.
메시지를 보내세요 — /start도 가능합니다.
봇이 ID가 포함된 페어링 안내 메시지를 보냅니다. 서버에서 다음 명령을 실행합니다:
openclaw pairing approve telegram <ID>
다시 메시지를 보내면 이번엔 에이전트가 응답합니다.
Hello World!
메시지를 보냈는데 응답이 없을 경우
텔레그램 폴링이 활성화돼 있는지 확인합니다:
journalctl --user -u openclaw-gateway.service -n 30 --no-pager | grep -i "telegram\|polling\|channel"
로그에 [telegram] [default] starting provider 가 보이는지 확인합니다. 없으면 봇 토큰이 읽히지 않은 것이므로, 설정에 토큰이 들어있는지 확인합니다:
openclaw config get channels.telegram.botToken
실제 사용에 앞서 모든 레이어가 정상 동작하는지 반드시 검증하세요.
테스트 시나리오
| 테스트 | 내용 | 기대 결과 |
|---|---|---|
| Test 1 – 로컬 모델 응답 | 텔레그램에 Just reply! hello! 전송 | 로컬 Llama 모델이 30‑60 초 내에 응답 |
| Test 2 – Gemini 백업 작동 | Ollama 타임아웃을 5초로 짧게 설정 후 재시작openclaw config set models.providers.ollama.timeoutSeconds 5openclaw gateway restart메시지 전송 | Gemini가 2‑3 초 안에 응답 다시 타임아웃을 120초로 복구 후 재시작 |
| Test 3 – 메모리 지속 | 세션 1: My name is [your name]. Remember this. 전송 후 텔레그램 종료세션 2: 새 채팅에서 What's my name? 전송 | 에이전트가 이전 세션에서 기억한 이름을 회상 |
이 스택이 무엇이고, 무엇이 아닌가
무엇인가:
- 사용자가 직접 제어하는 인프라 위에서 항상 켜져 있는 지속적인 AI 에이전트
- 일관된 정체성을 가지고 대화 사이에 메모리를 유지함
- 웹 검색, 파일 작업, 향후 통합 등 행동을 수행할 수 있음
- 텔레그램을 통해 24 시간 언제든지 스마트폰만으로 접근 가능 (앱을 열거나 세션을 시작할 필요 없음)
무엇이 아닌가:
- 무거운 작업을 위한 Claude.ai·ChatGPT 대체품
- 3 B 로컬 모델은 복잡한 추론, 장문 분석, 미묘한 글쓰기 등에서 한계가 있음 (최신 대형 모델이 현저히 우수)
- Gemini 2.5 Flash 백업은 무료 티어에서 호출 제한이 있으며, 가장 강력한 모델은 아니다
즉, 일상적인 작업을 돕는 유능한 개인 비서로 생각하고, 고도 연구용 도구로 착각하지 마세요.
일일 사용 시 기대치
| 작업 | 사용 모델 | 응답 시간 | 품질 |
|---|---|---|---|
| 빠른 Q&A | Llama 3.2:3b | 20‑40 초 | 좋음 |
| 짧은 초안 | Llama 3.2:3b | 40‑90 초 | 좋음 |
| 웹 검색 질의 | Gemini fallback + Tavily | 5‑10 초 | 매우 좋음 |
| 복합 추론 | Gemini fallback | 3‑5 초 | 매우 좋음 |
| 장문 문서 | Gemini fallback | 5‑10 초 | 매우 좋음 |
| 코드 리뷰 | Gemini fallback | 3‑8 초 | 매우 좋음 |
마음가짐 전환: 실시간 응답을 기대하지 마세요. 메시지를 보내고, 휴대폰을 내려놓은 뒤 답변을 기다리면 됩니다. 비동기식 커뮤니케이션이라는 점을 인식하면 느리게 느껴지던 응답 시간도 자연스러워집니다.
비용 정산 (Zero Dollar)
| 구성 요소 | 비용 |
|---|---|
| Oracle ARM 인스턴스 (4 OCPU / 24 GB) | $0 — Always Free |
| Oracle 부트 볼륨 (100 GB) | $0 — 200 GB 한도 내 Always Free |
| Ollama + Llama 3.2:3b | $0 — 오픈소스, 로컬 실행 |
| Gemini 2.5 Flash (무료 티어) | $0 — 일일 1,000 요청 |
| Tavily 검색 (무료 티어) | $0 — 월 1,000 검색 |
| OpenClaw | $0 — 오픈소스 |
| 총합 | $0/월 |
유일하게 비용이 발생할 수 있는 경우는 Claude 접근을 위해 Anthropic API 키를 추가하고, Part 4에서 설명한 백그라운드 시작 컨텍스트를 비활성화하지 않은 경우뿐입니다. Ollama를 기본으로, Gemini를 백업으로 사용한다면 예상치 못한 청구 위험은 없습니다.
확장 아이디어
- 맞춤 서브에이전트: 코드 리뷰어, 연구 보조, 글쓰기 편집기 등 특화된 에이전트를 만들 수 있습니다. 각 에이전트는 자체 시스템 프롬프트와 도구 접근 권한을 가집니다. 기본 설정이 안정화되면 가장 큰 효과를 볼 수 있는 영역입니다.
- GitHub 연동
이를 통해 텔레그램에서 이슈 조회, PR 리뷰, 레포지토리 요약 등을 수행할 수 있습니다.sudo apt install gh -y gh auth login openclaw skills install github - 스케줄링 및 알림: cron‑스타일 작업을 정의해 매일 브리핑을 보내거나, 정기 작업을 알리거나, 뉴스 요약을 자동 전송하도록 할 수 있습니다.
- 로컬 모델 업그레이드:
llama3.1:8b로 교체하면 품질이 향상되지만 복잡한 질의에 대한 응답 속도가 느려집니다. 다행히 Gemini가 타임아웃을 잡아주어 경험이 급격히 나빠지지는 않습니다.
마무리
이 시리즈는 “AI 비서에 비용을 지불해야 할까?”라는 단순한 질문에서 시작했습니다. 2026년 현재 정답은 아니오(단, 몇 가지 전제조건 존재)입니다. 제로‑코스트 스택은 실제로 동작합니다. 모든 작업에 대해 유료 최첨단 모델만큼 빠르거나 강력하지는 않지만, 항상 켜져 있는 개인 비서로서 메시징 앱 안에 존재하고, 사용자를 기억하며,