[Paper] LIBERTy: 인과 프레임워크를 이용한 LLM의 Concept-Based Explanations 벤치마킹과 Structural Counterfactuals
Concept-based explanations는 고수준 개념(예: gender 또는 experience)이 모델 행동에 미치는 영향을 정량화하며, 이는 decision-makers에게 매우 중요합니다.
Concept-based explanations는 고수준 개념(예: gender 또는 experience)이 모델 행동에 미치는 영향을 정량화하며, 이는 decision-makers에게 매우 중요합니다.
우리 연구는 생성 AI(GenAI)가 건축 개념 설계 과제에서 성과, 창의적 자기 효능감, 그리고 인지 부하에 어떻게 영향을 미치는지 조사합니다. 30…
복잡한 동역학 시스템을 다양한 조건 하에서 모델링하는 것은 계산적으로 비용이 많이 들며, 종종 고충실도 시뮬레이션을 실행 불가능하게 만든다. Although reduce...
블록 기반 프로그래밍 환경(BBPEs)인 Scratch와 Code.org는 현재 K-12 컴퓨터 과학 수업에서 널리 사용되고 있지만, 여전히 대부분 접근성이 제한된 상태입니다.
Scaling laws는 현대 AI 혁명에서 중요한 역할을 해왔으며, 실무자들에게 model performance가 증가함에 따라 어떻게 향상될지 예측할 수 있는 힘을 제공합니다.
Large language model (LLM) 컨텍스트는 일반적으로 retrieval-augmented generation (RAG)을 사용하여 구성되며, 이는 top‑k passage를 순위 매기고 선택하는 과정을 포함합니다.
Hierarchical reasoning model(HRM)은 다양한 추론 작업에서 뛰어난 성능을 달성하며, 대형 언어 모델 기반 추론을 크게 능가합니다.
이 작업은 분산 저장 시스템에서 quantum resources의 사용을 조사한다. (n,k,d) 분산 저장 시스템을 고려할 때, 파일이 저장되는 ...
대규모 언어 모델(Large Language Models, LLMs)의 학습 및 서비스는 데이터를 여러 가속기(accelerators)에 분할해야 하며, 이때 집합 연산(collective operations)이 자주 병목(bottleneck)이 된다.
주장적인 텍스트에서 설득을 감지하는 것은 인간 커뮤니케이션을 이해하는 데 중요한 함의를 가진 도전적인 과제입니다. 이 연구는 r...
대형 언어 모델(LLMs)은 진화적 탐색을 위한 강력한 연산자로 부상했지만, 효율적인 탐색 스캐폴드 설계는 여전히 즉흥적이다. While prom...
우리는 여러 속성을 가진 LTLf 합성을 연구하며, 모든 속성을 만족시키는 것이 불가능할 수 있습니다. 속성의 부분집합을 열거하는 대신, 우리는 …을 계산합니다.
최근 video models의 발전은 특히 long video understanding에서 엄청난 진전을 보여주었습니다. 그러나 현재 benchmarks는 주로 ...
대형 언어 모델(LLMs)은 출력에 대한 자신감을 언어화함으로써 사용자가 느끼는 신뢰를 높일 수 있습니다. 그러나 기존 연구에 따르면 LLM은 종종 o...
본 논문에서는 3D 인간 동작과 2D 인간 비디오의 생성이 본질적으로 결합되어 있음을 발견한다. 3D 동작은 설득력 있는 …
오늘날 가장 강력한 비디오-언어 모델(VLM)은 여전히 독점적이다. 가장 강력한 오픈-웨이트 모델은 독점 VLM에서 생성된 합성 데이터에 의존하거나, effecti...
Adaptive video streaming은 지난 몇 년간 비디오 스트리밍을 개선하는 데 기여했습니다. 비트레이트, 비디오 품질 등과 같은 코딩 성능 목표 사이의 균형을...
Talking head generation은 가상 현실(VR)에서, 특히 다중 턴 대화를 포함하는 사회적 시나리오에서 점점 더 중요해지고 있습니다. 기존 접근 방식은…
다중 에이전트 다중 팔 밴딧(MA-MAB) 맥락에서 공정성은 종종 결과로 환원됩니다: 복지를 극대화하고, 불평등을 감소시키며, 혹은 효용을 균형 있게 만드는 것 등.
시각 관찰로부터 물리적 행동을 추론하는 것은 물리적 세계에서 machine intelligence를 발전시키기 위한 기본적인 능력이다. 이를 달성하려면...
대형 언어 모델(LLMs)은 놀라운 능력을 달성했지만, 안전 가드레일을 우회하도록 설계된 적대적 “jailbreak” 공격에 여전히 취약합니다.
리소스가 제한된 엣지 디바이스에 Python 기반 AI 에이전트를 배포하는 것은 런타임 최적화 과제를 제시한다: I/O 지연을 가리기 위해 높은 thread count가 필요하다.
조건부 언어 모델에 대한 내재적 평가 지표인 perplexity나 bits-per-character와 같은 지표는 단일 언어 및 다국어 설정 모두에서 널리 사용됩니다....
LLM에서 선택적인 지식 삭제는 GDPR 준수와 모델 안전성에 필수적이지만, 현재의 unlearning 방법은 행동 억제를 실제...