[Paper] 최적화와 동역학을 통합하여 순차 계산을 병렬화하기: 순차 병목 현상을 깨는 병렬 Newton 방법 가이드
대규모 병렬 하드웨어(GPU)와 긴 시퀀스 데이터는 대규모 머신러닝에 병렬 알고리즘을 필수적으로 만들었습니다. 그러나 동적 시스템, 예를 들어 재…
4519 posts from this source
대규모 병렬 하드웨어(GPU)와 긴 시퀀스 데이터는 대규모 머신러닝에 병렬 알고리즘을 필수적으로 만들었습니다. 그러나 동적 시스템, 예를 들어 재…
트랜스포머 포지셔널 인코딩을 메쉬와 그래프 구조 데이터에 적용하는 것은 상당한 계산적 도전을 제시한다: 정확한 스펙트럴 메서드는 세제곱 복잡도를 요구한다.
‘LLM-as-a-judge’ 패러다임은 개방형 생성(open-ended generation)을 평가하는 표준 방법이 되었다. 쌍별 비교(pairwise comparison)의 2차 규모 확장 비용을 해결하기 위해…
Federated Learning (FL)은 의료, 금융, IoT와 같은 분야에서 점점 더 많이 적용되고 있으며, 사용자 프라이버시를 보호하면서 협업 모델 학습을 가능하게 합니다.
보정되지 않은 단일 카메라 비디오에서 스트리밍 재구성은 고정밀 자세 추정과 계산 효율성을 동시에 요구하기 때문에 여전히 어려운 과제입니다.
Large language models는 점점 더 autonomous agents로 배치되어, 장기적인 상호작용을 통해 계획하고 행동하며, 실수로부터 회복해야 합니다.
Stochastic resetting은 동적 과정이 간헐적으로 고정된 reference state로 되돌아가는 현상으로, first- … 최적화에 강력한 메커니즘으로 부상하고 있다.
Vision transformers (ViTs) — 특히 DINOv2와 같은 feature foundation models —는 많은 다운스트림 작업에 유용한 풍부한 표현을 학습합니다. 그러나 architectu...
Automated presentation generation은 일관된 콘텐츠 생성, 시각 디자인, 청중 인식 커뮤니케이션을 요구하는 도전적인 과제로 남아 있습니다. 이 연구는 …
잘못된 라벨이라는 의미의 라벨 노이즈는 많은 실제 데이터 세트에 존재하며, 딥러닝 모델의 일반화 능력을 크게 제한하는 것으로 알려져 있습니다.
문화는 추론, 가치, 우선순위 설정 및 전략적 의사결정에 영향을 미치지만, 대형 언어 모델(LLMs)은 종종 문화적 편향을 보여서 ...와 일치하지 않는다.
몰입형 확장 현실 (XR) 애플리케이션은 latency‑critical 워크로드를 도입하며, 엄격한 real‑time 응답성을 만족해야 하고, 에너지 …
대규모 언어 모델(LLMs)은 종종 환각을 일으켜 지식 집약적 애플리케이션에서 신뢰성을 제한합니다. 검색 기반 생성(RAG) 및 …
CPU와 GPU 기술의 통합은 현대 AI 및 그래픽 워크로드를 위한 핵심 촉진 요소이며, 제어 지향 처리와 대규모 병렬 컴퓨...
협업 필터링(CF) 추천은 그래프 신경망(GNNs)과 그래프 대비 학습(GCL)을 통합함으로써 크게 발전했습니다. Ho...
우리는 mathbb{R}^d에서 항등 공분산을 갖는 Gaussian 분포에 대한 평균 추정을, realizable ε-contamination model이라고 불리는 결측 데이터 스키마 하에서 연구한다.
초보 프로그래머는 모호한 naming, 깊은 nesting, 그리고 poor structural organization 때문에 코드를 이해하는 데 어려움을 겪는 경우가 많습니다. 설명이 부분적인 s...
최근 코드 대형 언어 모델은 일반 프로그래밍 작업에서 눈에 띄는 진전을 이루었습니다. 그럼에도 불구하고, 이들의 성능은 특정 분야에서 크게 저하됩니다.
견고한 task-oriented spoken dialogue agents는 사람들이 음성을 통해 상호작용하는 다양한 방식을 모두 경험해야 합니다. spoken user simulators를 구축하는 것은 …
Gradient inversion attacks는 공유된 gradient로부터 개인 훈련 텍스트를 복원할 수 있음을 밝혀내어, 대형 언어 모델(LLMs)에 대한 프라이버시 위험을 초래합니다.
멀티턴 대화는 언어 모델 상호작용의 일반적이고 중요한 방식입니다. 그러나 현재 공개된 학습 및 평가 데이터는 단일 턴에 초점을 맞추고 있습니다.
대규모 언어 모델(LLM)은 사회에 영향을 미치는 애플리케이션에 점점 더 많이 배치되고 있어, 이들이 내포하는 문화적 편향에 대한 우려가 제기되고 있습니다. 우리는 …
이 보고서에서 우리는 IQuest-Coder-V1 시리즈-(7B/14B/40B/40B-Loop)를 소개합니다, 이는 새로운 코드 대형 언어 모델(LLM) 패밀리입니다. 정적 코드 표현을 넘어서는…
암은 일반적으로 단일 유전적 변이(즉, 히트)에서 발생하는 것이 아니라 세포 내에 축적되는 다중 히트 조합에 의해 발생합니다. 그러나 다중 히트...
Feature models는 소프트웨어 시스템의 구성 공간을 포착하는 데 널리 사용됩니다. 자동 추론은 문제를 일으키는 f를 감지하기 위해 연구되어 왔지만...
대규모 언어 모델(LLM)은 코드 번역의 기능적 정확성을 크게 향상시켰지만, 실행 효율성이라는 중요한 차원은 …
스파이킹 뉴럴 네트워크(SNN)는 기존 인공 신경망(ANN)에 비해 에너지 효율적인 대안을 제공하지만, 일반적으로 여전히 많은 수의 ...
Solana는 스마트 계약 개발자와 사용자들 사이에서 빠르게 주목받고 있습니다. 그러나 그 성장하는 채택은 일련의 주요 보안 i...
AI 코딩 어시스턴트는 코드를 작성하는 것에서 프롬프트를 구성하는 것으로 초점을 전환함으로써 소프트웨어 개발을 재구성하고 있습니다. vibe codi와 같은 채팅 중심 접근 방식에서는...
동적 다중모드 자원제한 프로젝트 일정 문제(DMRCPSP)는 실시간으로 의사결정을 내려야 하는 등 실용적인 중요성을 가지고 있습니다.
LLM 추론을 위한 GPU 플릿 규모를 정하는 것은 보기보다 어렵다. 몇 개의 GPU가 필요한지, 어떤 유형인지, 두 풀 플릿을 어디에 나눌지와 같은 명백한 질문들은 명확한 답이 없다.
Vision-Language-Action (VLA) 모델은 정적 조작에서는 뛰어나지만, 움직이는 목표가 있는 동적 환경에서는 어려움을 겪는다. 이 성능 격차는 주로 …
스케일링 깊이는 대형 언어 모델(LLMs)의 핵심 동인입니다. 그러나 LLM이 깊어짐에 따라 종종 신호 저하를 겪습니다: 유익한 특징이…
Vision-Language-Action (VLA) 모델은 최근 로봇 조작을 위한 유망한 패러다임으로 부상했으며, 신뢰할 수 있는 행동 예측이 결정적으로 의존한다.
시각 텍스트 렌더링을 위한 정확한 glyph를 생성하는 것은 필수적이지만 도전적인 작업입니다. 기존 방법들은 일반적으로 대량의 데이터를 사용해 학습함으로써 텍스트 렌더링을 향상시킵니다…
기존 behavioral alignment 기술은 Large Language Models (LLMs)에 대해 surface compliance와 internal unaligned representations 사이의 불일치를 종종 간과한다.
최근 비디오 디퓨전 모델은 시각적 품질에서 눈에 띄는 진전을 이루었지만, 정밀하고 세밀한 제어는 실용적인 c를 제한하는 주요 병목 현상으로 남아 있습니다.
우리는 HSImul3R을 제시한다. 이는 캐주얼 캡처, 특히 sparse-view 이미지를 포함한 인간‑장면 상호작용(HSI)의 simulation‑ready 3D reconstruction을 위한 통합 프레임워크이다.
SAM 3D Body (3DB)는 단일 카메라(monocular) 3D 인간 메시 복원에서 최첨단(state-of-the-art) 정확도를 달성하지만, 이미지당 몇 초의 추론 지연(inference latency) 때문에 실시간 적용이 불가능합니다.
최근 대화형 메모리 시스템은 인제스트 시점에 LLM 기반 구조화와 쿼리 시점에 학습된 검색 정책에 크게 투자합니다. 우리는 neithe…
우리는 적대적 부패(adversarial corruption)와 (1+ε)-차 유한 모멘트를 갖는 heavy-tailed noise가 존재하는 상황에서 linear contextual bandits를 연구한다. 여기서 ε는 (0,1] 구간에 있다. 기존 연구는 ...
Deep search 기능은 최첨단 Large Language Model (LLM) 에이전트에게 필수적인 역량이 되었지만, 고성능 검색의 개발은 …
Physics-informed neural networks (PINNs)와 neural operators (NOs)를 사용하여 극자외선 (EUV) 전자기파의 회절 문제를 해결하기 위해 ...
만약 세계 시뮬레이션 모델이 상상된 환경이 아니라 실제로 존재하는 도시를 렌더링할 수 있다면 어떨까요? 이전의 생성적 세계 모델들은 시각적으로 plausible…
Four-dimensional scanning transmission electron microscopy (4D-STEM)은 재료 구조에 대한 풍부하고 원자 규모의 통찰을 제공합니다. 그러나, 구체적인…
본 논문은 전방 반사-후방 분할(FRBS) 방법에 대한 새로운 variance-reduction 기법을 개발하여, 잠재적으로 비단조적인 stochastic 문제의 한 클래스를 해결한다.
추론 시간 컴퓨팅 규모 확대는 LLM 성능의 중요한 동인으로 부상했으며, 추론 효율성을 모델 설계의 핵심 초점으로 만들고 있습니다.
AI 코딩 에이전트가 소스 코드의 주요 생산자이자 소비자가 됨에 따라, 소프트웨어 산업은 제도적 지식의 가속적인 손실에 직면하고 있다. 각각…