[Paper] 자신감의 착각? Neighborhood Consistency를 통한 LLM 진실성 진단
대규모 언어 모델(Large Language Models, LLMs)이 실제 환경에 점점 더 많이 배포됨에 따라, 정확성만으로는 충분하지 않습니다. 신뢰할 수 있는 배포를 위해서는 tr...을 유지해야 합니다.
대규모 언어 모델(Large Language Models, LLMs)이 실제 환경에 점점 더 많이 배포됨에 따라, 정확성만으로는 충분하지 않습니다. 신뢰할 수 있는 배포를 위해서는 tr...을 유지해야 합니다.
대형 언어 모델(LLM) 라우팅은 다양한 작업에 대해 서로 다른 LLM의 특화된 강점을 활용하는 것을 목표로 합니다. 그러나 기존 접근 방식은 일반적으로 …에 초점을 맞춥니다.
Preference tuning은 pretrained language models를 인간의 quality, helpfulness, 또는 safety에 대한 judgments에 맞추어 explicit preference signals를 최적화함으로써 정렬합니다.
최근 deepfake 탐지 방법들은 조작 아티팩트를 드러내기 위해 frequency domain 표현을 점점 더 탐구하고 있으며, 이는 텍스트에서 감지하기 어려운...
Semi-supervised medical image segmentation은 라벨이 제한된 데이터 상황을 해결하기 위한 효과적인 방법입니다. 기존 방법들은 주로 프레임워크에 의존합니다.
우리는 임의의 자세를 가진 인간을 애니메이션이 가능한 다중 레이어 3D 인간 아바타로 분해하여 몸과 의복을 분리하는 새로운 프레임워크를 제안한다. 기존…
탈중앙화 금융(DeFi) 스테이킹은 DeFi 생태계 내에서 가장 두드러진 애플리케이션 중 하나이며, DeFi 프로젝트가 사용자가 토큰을 ...
희소 선형 시스템에 대한 iterative solvers의 높은 계산 비용을 관리하는 것은 scientific computing에서 알려진 도전 과제입니다. 게다가, 과학적 응용…
대규모 언어 모델을 기반으로 하는 Software engineering (SE) agents가 실무에서 점점 더 많이 채택되고 있지만, 이들은 종종 상당한 금전적 비용을 발생시킵니다. 우리는 소개…
취약점은 소프트웨어 시스템을 심각하게 위협하며, 보안 패치를 시기 적절하게 적용하는 것이 공격을 완화하는 데 필수적입니다. 그러나 소프트웨어 벤더는 ...
우리는 AutoMonitor-Bench를 소개합니다. 이는 다양한 작업에 걸쳐 LLM 기반 오작동 모니터의 신뢰성을 체계적으로 평가하도록 설계된 최초의 벤치마크입니다…
현대 소프트웨어 시스템의 복잡성이 증가함에 따라 그 행동을 이해하는 것이 점점 더 어려워지고 있으며, 이는 설명 가능성에 대한 필요성을 촉진하고 있다.