1일 전 · ai Speculative Sampling을 이용한 대규모 언어 모델 디코딩 가속화 대형 언어 모델로부터 답변을 거의 두 배 빠르게 받는다고 상상해 보세요. 연구자들은 몇 단어를 미리 쓰는 작은, 빠른 헬퍼를 사용하고, 그 다음에 큰 모델을 활용합니다.