[Paper] 언어 모호성 하의 품질 추정을 위한 Sigmoid Head
Language model (LM) probability은 신뢰할 수 있는 품질 추정기가 아니다, 왜냐하면 자연어는 애매모호하기 때문이다. 여러 출력 옵션이 모두 유효할 때, 모델의 probability…
Language model (LM) probability은 신뢰할 수 있는 품질 추정기가 아니다, 왜냐하면 자연어는 애매모호하기 때문이다. 여러 출력 옵션이 모두 유효할 때, 모델의 probability…
대규모 언어 모델(Large Language Models, LLMs)은 높은 성능(예: 정확도) 덕분에 많은 자연어 작업을 해결하는 주요 AI 모델로 부상하고 있습니다…
Generative Reward Models (GRMs)는 interpretability, inference-time scalability 및 ... 때문에 reward modeling에서 상당한 연구 관심을 끌고 있습니다.
현대 언어 모델의 시퀀스 모델링 레이어는 일반적으로 저장 용량과 계산 효율성 사이의 트레이드오프에 직면합니다. Softmax attention은 …
Spiking Neural Networks (SNNs)는 시공간 데이터에서 작동하는 동적 시스템이지만, 학습 가능한 매개변수는 종종 시냅스 가중치에만 제한됩니다, ...
Large Protein Language Models는 generative protein design에 강력한 잠재력을 보여왔지만, 종종 structural hallucinations를 일으켜 seque…를 생성합니다.
대규모 언어 모델(LLMs)을 모바일 및 엣지 컴퓨팅 환경에 배포하는 것은 제한된 디바이스 자원, 부족한 무선 대역폭, 그리고 f...
대형 언어 모델(LLMs)은 종종 맥락적 환각을 일으키며, 생성된 내용이 명시적으로 제시된 정보와 모순되거나 무시되는 경우가 있습니다.
인공지능을 소프트웨어 엔지니어링(SE)에 통합하려면 SE 작업에 적합한 모델을 선별한 컬렉션이 필요합니다. 수백만 개의 모델이 ...
실시간 로그 분석은 현대 인프라의 가시성을 위한 초석입니다. 그러나 기존 온라인 파서는 동적 환경에 대해 아키텍처적으로 부적합합니다.
Intelligent Connected Vehicles (ICVs)는 현대 교통 시스템의 핵심 구성 요소이며, 그 보안은 사용자 안전과 직접적으로 관련되어 있기 때문에 매우 중요합니다.
전통적인 고객 지원 시스템, 예를 들어 Interactive Voice Response (IVR)와 같은 시스템은 경직된 스크립트에 의존하고 복잡한, po...