[Paper] 데이터 속의 잠재 효과: Log-Linearity를 통한 일반 메커니즘
현대의 대규모 언어 모델(LLMs) 훈련은 특정 행동을 유도하도록 설계된 알고리즘과 데이터셋의 실질적인 뷔페가 되었으며, 이를 통해 …
3058 posts from this source
현대의 대규모 언어 모델(LLMs) 훈련은 특정 행동을 유도하도록 설계된 알고리즘과 데이터셋의 실질적인 뷔페가 되었으며, 이를 통해 …
현재 자동 회귀 Vision Language Models (VLMs)은 일반적으로 이미지를 표현하기 위해 많은 수의 visual tokens에 의존하므로, 더 많은 compute가 필요하게 된다.
머신러닝 원자간 포텐셜(MLIPs)은 때때로 양자 퍼텐셜 에너지 표면(PES)의 물리적 부드러움을 재현하지 못해, …
헤드라인을 생성하는 것부터 뉴스 조작에 이르기까지, Large Language Models (LLMs)은 일반적으로 최종 출력물을 기준으로 평가되며, 안전성 가정 하에 ...
대형 언어 모델은 종종 폐쇄형 질문 응답(closed-book question answering)에서 자신의 지식 한계를 인식하는 데 어려움을 겪으며, 그 결과 자신감 있는 환각(hallucinations)을 발생시킵니다. While decompose...
Linear attention은 계산 효율적이면서도 표현력이 풍부한 softmax attention의 대안입니다. 그러나 최근 실증 결과는 state o…
포즈와 모션 프라이어는 휴머노이드 로봇공학에서 중요한 역할을 합니다. 이러한 프라이어는 인간 모션 복구(HMR) 분야에서 널리 연구되어 왔으며…
양자 화학은 화학, 재료 과학, 계산 생물학 등 분야를 위한 기본적인 촉진 도구입니다. 그 힘에도 불구하고, ...
우리는 El Agente Estructural을 소개한다. 이는 multimodal, natural-language-driven geometry-generation 및 manipulation agent로, autonomous chemistry와 molecular modelling에 사용된다.
추론 언어 모델은 긴 사고 사슬을 생성하며, 추상적인 문제에서 비추론 언어 모델보다 크게 능가합니다. 그러나, the inter...
3D 스캐닝 기술의 발전으로 포인트 클라우드는 3D 공간 데이터를 표현하는 데 기본이 되었으며, 그 적용 범위는 다양하게…
우리의 신경망에 대한 이론적 이해는 그들의 실증적 성공에 뒤처지고 있습니다. 중요한 설명되지 않은 현상 중 하나는 왜 그리고 어떻게, ...
Software Engineering (SE)은 AI 자동화(코드 생산 비용 감소)와 하드웨어‑에너지 제약(실패 co…을 증폭)이라는 동시에 압력을 받고 있다.
Statically-annotated types는 개발자들이 다양한 프로그래밍 작업을 수행하는 데 도움이 되는 것으로 나타났으며, static type checking이 없을 때에도 이 혜택은 유지됩니다...
인간 손톱 질환은 모든 연령대에서 점차 관찰되며, 특히 노인들 사이에서 흔히 심각해질 때까지 무시되는 경우가 많습니다. 조기 발견…
정기적인 대장내시경 검진 중 전암성 폴립의 정확한 위험 계층화는 대장암(CR…) 발생 위험을 낮추는 데 필수적이다.
대형 언어 모델(LLMs)의 급속한 성장은 단일 GPU 하드웨어의 발전 속도를 앞질러, 모델 규모가 메모리 용량에 점점 더 제한받게 만들고 있습니다.
진정한 self-evolution은 에이전트가 lifelong learners로서 새로운 경험을 내재화하여 미래 문제를 해결하도록 요구한다. 그러나 이를 엄밀하게 측정하는 것은 ...
Omni-modal Large Language Models (Omni-LLMs)는 오디오‑비디오 이해 작업에서 강력한 능력을 입증했습니다. 그러나 이들은 긴 멀티모달…
컨트롤러 — 하드웨어 동작을 관리하는 software module — 은 일반적인 로봇 시스템의 핵심 구성 요소입니다. control theory는 safety guarantees를 제공하지만 s...
대화형 음성에 대한 자동 음성 인식(ASR)은 대규모이며 잘 주석된 다중 화자 diarization 데이터의 제한된 가용성 때문에 여전히 도전적입니다.
이 연구는 다목적 최적화 문제(MOOPs)를 위한 메타휴리스틱 개발과 관련된 두 가지 중요한 과제, 즉 지수적 성장…
대형 언어 모델의 도입은 소프트웨어 개발 모델의 대대적인 재구성 및 재고를 촉발했습니다. 이어지는 소프트웨어 엔지니어링의 반응은...
Spatial accelerators는 compute‑memory integrated units의 배열로 구성되어, low latency로 inference workloads를 배포하기 위한 매력적인 플랫폼을 제공합니다.