[Paper] Multilingual Large Language Models는 모든 자연어를 동등하게 이해하지 못한다
대형 언어 모델(LLMs)은 인간이 정보를 접근하는 방식에 중요한 역할을 합니다. 핵심 사용은 서면 요청을 이해하는 데 의존하지만, 우리의 이해…
4528 posts from this source
대형 언어 모델(LLMs)은 인간이 정보를 접근하는 방식에 중요한 역할을 합니다. 핵심 사용은 서면 요청을 이해하는 데 의존하지만, 우리의 이해…
본 연구에서는 대형 언어 모델(LLM)의 출력을 유한 알파벳에서 추출된 무한한 기호 시퀀스를 생성하는 정보원으로 간주합니다.
Large language models은 복잡한 사회‑기술 시스템에 배치되고 있으며, 이는 현재 alignment 실천의 한계를 드러냅니다. 우리는 …
LLM 기반 애플리케이션은 대형 언어 모델을 복잡한 작업 실행을 위한 핵심 추론 구성 요소로 활용함으로써 소프트웨어 생태계를 빠르게 재구성하고 있습니다. Th...
LLM 기반 다중 에이전트 시스템(MAS)이 복잡한 작업에 점점 더 많이 배치됨에 따라, 그 신뢰성을 보장하는 것이 시급한 과제가 되었습니다. MAS가 ...
우리는 선형 Echo State Networks (ESNs)를 위한 대각화 기반 최적화를 도입하여, 저장소 상태 업데이트의 단계별 계산 복잡성을 감소시킵니다.
운영 기술이 정보 기술과 점점 통합됨에 따라, 침입 탐지 시스템에 대한 필요성이 더욱 중요해지고 있습니다. 이 논문은 ...
Git은 협업 소프트웨어 개발에 널리 사용되지만, 초보자에게는 어려울 수 있습니다. 대부분의 학습 도구가 개별 워크플로에 초점을 맞추는 반면, Git...
Gaussian processes (GPs)는 널리 사용되는 회귀 도구이지만, 정확한 솔버의 세제곱 복잡도 때문에 확장성이 제한됩니다. 이 문제를 해결하기 위해, 우리는 …
훈련 비디오를 수동적으로 시청하면 피상적인 학습이 발생합니다. 게이미피케이션을 추가하면 참여도를 높일 수 있습니다. 우리는 소프트웨어 엔지니어링 학생들과 …
대규모 언어 모델을 안전‑중요 시스템 엔지니어링에 도입하는 것은 신뢰성, 추적 가능성, 그리고 확립된 검증과의 정렬에 의해 제약받는다.
전통적인 데이터베이스 퍼징 기법은 주로 구문적 정확성과 일반적인 SQL 구조에 초점을 맞추고, DBMS의 중요한 하지만 잘 알려지지 않은 기능들, 예를 들어…
오픈소스 소프트웨어(OSS) 커뮤니티는 역사적으로 코드, 문서, 그리고 개발자 상호작용의 주요 언어로 영어가 지배해 왔습니다....
자율 코딩 에이전트는 GitHub에 풀 리퀘스트를 제출함으로써 소프트웨어 개발에 점점 더 많이 기여하고 있지만, 이러한 기여가 어떻게...
iCloud Drive는 파일 시스템 인터페이스를 제공하지만, 클라우드 동기화 의미론을 구현하여 POSIX와 근본적으로 다른 방식을 취합니다. 이러한 차이는 ...
표현 유사성 메트릭은 일반적으로 모든 유닛을 매칭하도록 강제하여, 신경 표현에서 흔히 나타나는 노이즈와 이상치에 취약하게 만든다. 우리는 …
personal health data를 관리하는 것은 오늘날 파편화되고 기관 중심적인 healthcare ecosystem에서 큰 도전 과제입니다. 개인은 종종 의미 있는 통제권을 갖지 못합니다.
이 브리프는 runtime-adaptive, performance-enhanced vector engine을 제시하며, edge AI acceleration을 위한 low-resource, iterative CORDIC-based MAC unit을 특징으로 합니다.
강화 학습 파인튜닝은 이미지 및 분자 분야에서 원하는 특성으로 생성 확산 모델을 유도하는 데 효과적인 것으로 입증되었습니다. Graph...
디지털 협업 시스템은 복제된 데이터에 대한 비동기 작업을 지원하며, 동시 작업을 명확하게 통합할 수 없을 때 충돌이 발생합니다.
현대 AI 시스템의 놀라운 성능은 전례 없는 규모의 데이터, computation, energy에 의해 촉진되었습니다—필요한 자원을 훨씬 초과합니다.
Transformer 모델은 좌표 의존적 표현과 연속 대칭에서 발생하는 상당한 내부 중복성을 모델 공간 및 …에서 가지고 있다.
스트리밍 비디오 이해는 모델이 연속적인 비디오 스트림에서 정보를 견고하게 인코딩하고, 저장하며, 검색하여 정확한 비디오 퀘스트를 지원하도록 요구한다.
embodied agents가 VR, telepresence, 그리고 digital human 애플리케이션의 중심이 됨에 따라, 그들의 움직임은 speech-aligned gestures를 넘어야 합니다: agents는 turn t...
대형 언어 모델(LLMs)은 수학 및 코딩과 같은 다양한 분야에서 추론 작업에 큰 진전을 이루었습니다. 그러나 그들의 성능...
Autonomous (noise-agnostic) 생성 모델인 Equilibrium Matching과 blind diffusion은 단일, 시간 불변...
Integral Field Spectroscopy (IFS) 설문조사는 공간 및 분광 차원 모두에서 학습할 수 있는 독특한 새로운 환경을 제공하며, pre… 를 밝히는 데 도움이 될 수 있습니다.
다양한 문서를 포괄적으로 검색하는 것은 다양한 정답이 가능한 질의에 대응하기 위해 필수적입니다. 우리는 retrieve-verify-retrieve (RVR)를 소개합니다.
이 연구는 대규모 언어 모델(LLM) 압축을 위해 분산을 유지한 특이값 벡터를 결합한 앙상블 기법인 SPQ(SVD‑Pruning‑Quantization)를 제시한다.
이 논문은 U(d)의 닫힌 부분군 위에 숨겨진 상태를 갖는 시퀀스 모델에 대한 직접적인 프레임워크를 제시한다. 우리는 최소한의 공리적 설정을 사용하고 재귀적인…
그래프 신경망(GNN)의 표현력은 종종 Weisfeiler-Leman(WL) 알고리즘 및 first-order logic의 조각들과의 대응을 통해 분석됩니다.
딥러닝이 컴퓨터 비전에서 성공을 거두었음에도 불구하고, 학습 중에 거의 보지 못한 그룹 대칭 변환을 겪은 객체를 인식하는 데 어려움이 지속됩니다. 기존 방법들은 데이터 증강에 의존하는데, 이는 계산 비용이 많이 들고 범위가 제한적이며, 혹은 견고함이 부족한 수작업 특징에 의존합니다. 본 연구에서는 보다 넓은 범위의 변환에 대한 불변성을 달성하기 위해 그룹-에퀴베리언트 컨볼루션과 어텐션 메커니즘을 통합한 새로운 아키텍처를 제안합니다. 우리의 모델은 제어된 변환을 가진 합성 데이터셋으로 학습되고 실제 벤치마크에서 평가되어, 최신 최첨단 베이스라인 대비 top-1 accuracy에서 12% 향상을 보여줍니다.
주 엔진 출력의 정확한 예측은 선박 성능 최적화, 연료 효율성 및 배출 규제 준수에 필수적이다. Convention...
우리는 PRISM-FCP(Partial shaRing and robust calIbration with Statistical Margins for Federated Conformal Prediction)를 제안한다. 이는 Byzantine-resilient federated confo…
Object detectors는 정상적인 영상 조건에서 강력한 성능을 달성하지만, 블러, 노이즈, 압축, 악천후 등에 노출되면 조용히 실패할 수 있습니다.
Pure Pursuit(PP)는 효율성과 기하학적 명확성 때문에 실시간 경로 추적을 위해 자율 레이싱에서 널리 사용되지만, 성능은 매우 민감…
인터랙티브 퍼셉션(IP)은 로봇이 작업 공간에서 숨겨진 정보를 추출하고 물체와 물리적으로 상호작용함으로써 조작 계획을 실행할 수 있게 합니다…
인공지능(AI) 시스템의 품질 평가는 그 본질적으로 확률적인 특성 때문에 근본적인 과제이다. ISO/IE와 같은 표준이 이러한 문제를 다룬다.
정성적 데이터 분석은 노동 집약적이지만, 상업용 Large Language Models (LLMs)와 관련된 프라이버시 위험 때문에 민감한 상황에서의 사용이 종종 제한된다.
현실 세계의 지식 표현은 종종 주관적이고 연속적인 attributes—예를 들어 political positions—를 포착해야 하며, 이는 pairwise values와 충돌한다.
우리는 quantum feature extraction 방법을 적용하여 우주 응용 분야의 다중 클래스 이미지 분류를 향상시키는 사례를 보여줍니다. By harnessing the dyna...
인도와 같이 법원이 방대한 사건 적체를 겪고 있는 관할구역에서는 Artificial Intelligence가 법적 판단 예측에 혁신적인 잠재력을 제공합니다.
트랜스포머 기반 언어 모델이 눈에 띄는 실용적 성공을 거두었음에도 불구하고, 최근 연구에서는 이들의 상태 추적 수행 능력에 대한 우려를 제기하고 있다. In...
우리는 제1언어 어휘 교육을 위해 자동으로 유익한 맥락 예시(qu{contexts})를 식별하는 현대 딥러닝 시스템을 설명한다.
NLP에서의 Psychological corpora는 인간의 심리, 감정 및 정신 건강을 분석하는 데 사용되는 텍스트 모음입니다. 이러한 텍스트는 연구자들이 심리…
우리는 가상 현실(VR) 게임의 플레이테스팅을 위한 최초의 motion generation system을 제시합니다. 우리의 플레이어 모델은 VR 헤드셋과 handheld controller의 움직임을 생성합니다.
대형 언어 모델은 특히 Lean에서 인터랙티브 정리 증명에 있어 눈에 띄는 성과를 거두었습니다. 그러나 LLM 기반 증명 자동화에 대한 대부분의 벤치마크는…
LLM의 코딩 능력이 급속히 향상됨에 따라, LLM 기반 자동 소프트웨어 개발의 병목 현상이 올바른 코드를 생성하는 것에서 … 로 이동하고 있다.