[Paper] Contextual Image Attack: 시각적 컨텍스트가 멀티모달 안전 취약점을 노출하는 방법
멀티모달 대형 언어 모델(MLLMs)은 놀라운 능력을 보여주지만, 그들의 안전 정렬은 탈옥 공격에 취약합니다. 기존 공격 방법...
멀티모달 대형 언어 모델(MLLMs)은 놀라운 능력을 보여주지만, 그들의 안전 정렬은 탈옥 공격에 취약합니다. 기존 공격 방법...
Neural Processing Units (NPUs)가 엣지 AI에 대해 높은 이론적 효율성을 제공하는 반면, GPU에 맞게 설계된 최첨단 Vision--Language Models (VLMs)는 종종 falt...
최근 추론 기술의 발전은 대형 언어 모델(LLMs)의 성능을 크게 향상시켰으며, 이들의 능력에 대한 기대를 높이고 있습니다.
Diffusion large language models (dLLMs)은 autoregressive 모델에 대한 유망한 대안을 제공하지만, 그 실용성은 느린 반복적인 과정 때문에 크게 제한됩니다.
Test-time policy optimization은 대규모 언어 모델(LLMs)이 자체 생성 롤아웃으로부터의 피드백을 활용하여 분포 변화에 적응하도록 합니다. 그러나,…
Majority voting은 parallel reasoning traces를 집계함으로써 close-ended question answering에 효과적인 것으로 입증되었습니다. 그러나 이는 open...
저자원 언어에서의 Hate speech recognition은 데이터셋 부족, orthographic heterogeneity, linguistic variety 등으로 인해 여전히 어려운 문제입니다. ...
음성 대화형 에이전트는 voice-native LLMs 쪽으로 수렴하고 있습니다. 이 튜토리얼은 cascaded ASR/NLU에서 end-to-end, retrieval-and vision …까지의 경로를 정리합니다.
attention-based transformers를 활용한 general-purpose AI 시스템의 최근 발전은 neocortex와 cerebellum이 …에도 불구하고 어떻게 작동하는지에 대한 잠재적인 창을 제공한다.
소셜 미디어에서의 악성 발언은 지속적이고 진화하는 과제로, 새로운 은어와 은폐된 용어가 지속적으로 등장하면서 ...
대형 언어 모델이 점점 커짐에 따라, NVFP4와 같은 저정밀 수치 형식이 속도와 메모리 이점 때문에 점점 더 인기를 얻고 있습니다 ...
Test-time scaling (TTS) — 추론 중에 컴퓨팅을 동적으로 할당하는 것 — 은 대형 언어 모델(LLMs)에서 추론 능력을 향상시키는 유망한 방향이다.