Show HN: sllm – GPU 노드를 다른 개발자와 공유, 무제한 토큰
Source: Hacker News
Overview
DeepSeek V3 (685B)를 실행하려면 H100 GPU 8대가 필요하며, 월 $14 k 정도의 비용이 듭니다. 대부분의 개발자는 초당 15–25 토큰만 필요합니다. sllm을 사용하면 전용 노드를 공유하는 개발자 그룹에 참여할 수 있습니다. 카드를 사용해 자리를 예약하고, 그룹이 가득 찰 때까지 비용이 청구되지 않습니다.
Pricing
- 작은 모델은 월 $5부터 시작합니다.
- 그룹이 정원을 채울 때까지는 비용이 부과되지 않습니다.
Privacy
LLM은 완전히 프라이빗합니다 – 트래픽이 기록되지 않습니다.
API Compatibility
- API는 OpenAI와 호환됩니다 (구동 엔진은 vLLM).
- 기존 OpenAI 클라이언트에서 기본 URL만 교체하면 바로 사용할 수 있습니다.
Available Models
현재 몇 가지 모델을 제공하고 있으며, 자세한 내용은 서비스 사이트에서 확인할 수 있습니다.
Comments
Hacker News 토론 – 23점, 댓글 10개.