[Paper] Position: General Alignment이 한계에 도달했으며, Edge Alignment을 진지하게 다루어야 함
Large language models은 복잡한 사회‑기술 시스템에 배치되고 있으며, 이는 현재 alignment 실천의 한계를 드러냅니다. 우리는 …
Large language models은 복잡한 사회‑기술 시스템에 배치되고 있으며, 이는 현재 alignment 실천의 한계를 드러냅니다. 우리는 …
대형 언어 모델(LLMs)은 수학 및 코딩과 같은 다양한 분야에서 추론 작업에 큰 진전을 이루었습니다. 그러나 그들의 성능...
다양한 문서를 포괄적으로 검색하는 것은 다양한 정답이 가능한 질의에 대응하기 위해 필수적입니다. 우리는 retrieve-verify-retrieve (RVR)를 소개합니다.
이 연구는 대규모 언어 모델(LLM) 압축을 위해 분산을 유지한 특이값 벡터를 결합한 앙상블 기법인 SPQ(SVD‑Pruning‑Quantization)를 제시한다.
이 논문은 U(d)의 닫힌 부분군 위에 숨겨진 상태를 갖는 시퀀스 모델에 대한 직접적인 프레임워크를 제시한다. 우리는 최소한의 공리적 설정을 사용하고 재귀적인…
현실 세계의 지식 표현은 종종 주관적이고 연속적인 attributes—예를 들어 political positions—를 포착해야 하며, 이는 pairwise values와 충돌한다.
인도와 같이 법원이 방대한 사건 적체를 겪고 있는 관할구역에서는 Artificial Intelligence가 법적 판단 예측에 혁신적인 잠재력을 제공합니다.
트랜스포머 기반 언어 모델이 눈에 띄는 실용적 성공을 거두었음에도 불구하고, 최근 연구에서는 이들의 상태 추적 수행 능력에 대한 우려를 제기하고 있다. In...
우리는 제1언어 어휘 교육을 위해 자동으로 유익한 맥락 예시(qu{contexts})를 식별하는 현대 딥러닝 시스템을 설명한다.
NLP에서의 Psychological corpora는 인간의 심리, 감정 및 정신 건강을 분석하는 데 사용되는 텍스트 모음입니다. 이러한 텍스트는 연구자들이 심리…
대형 언어 모델은 특히 Lean에서 인터랙티브 정리 증명에 있어 눈에 띄는 성과를 거두었습니다. 그러나 LLM 기반 증명 자동화에 대한 대부분의 벤치마크는…
Diffusion Language Models (DLMs)는 반복적인 디노이징으로 인해 높은 추론 비용이 발생하여 효율적인 프루닝을 필요로 합니다. 기존 프루닝 휴리스틱은 주로 …