우버의 AI 추진, 벽에 부딪히다 – CTO는 $3.4B 지출에도 예산 문제를 언급
번역할 텍스트를 제공해 주시겠어요?
번역할 텍스트를 제공해 주시겠어요?
달라스와 휴스턴으로 확장 테슬라는 소셜 미디어 게시물에 따르면 로보택시 서비스를 달라스와 휴스턴으로 확대하고 있습니다. https://x.com/robotaxi/status/20...
대규모 언어 모델은 신뢰성이 중요한 환경에 점점 더 많이 배치되고 있지만, 토큰 확률, 엔트로피와 같은 출력 수준의 불확실성 신호는 …
Adapter 기반 방법은 대규모 언어 모델(Large Language Models, LLMs)의 지속적 학습(continual learning, CL)을 위해 순차적으로 저랭크 업데이트를 학습함으로써 비용 효율적인 접근법이 되었다.
대형 언어 모델(LLMs)은 복잡한 작업을 해결하기 위해 점점 더 chain-of-thought (CoT) 추론에 의존하고 있다. 그러나 추론 트레이스가 모두 기여하도록 보장하는 것은…
최근 연구들은 작은 aligned 모델을 proxy 로 사용하여 더 큰 base (unaligned) 모델의 생성을 안내하는 test-time alignment 방법을 제안했습니다. T...
우리는 German sign language (DGS) fairy tales에 대한 sentiment analysis를 위한 dataset과 model을 제시한다. 먼저, 우리는 세 가지 수준의 ...
소개는 보통 암묵적인 가정을 동반합니다: 많은 양의 라벨된 데이터가 필요하다는 것. 동시에, 많은 모델은 데이터에서 구조를 발견할 수 있습니다.
소프트웨어 개발에서 Large Language Models (LLMs)의 급속한 확산으로 AI가 생성한 코드와 인간이 작성한 코드를 구별하는 것이 중요한 과제가 되었다.
Code localization은 autonomous software engineering의 핵심 요소입니다. 최근의 발전으로 real-world issue benchmarks에서 인상적인 성능을 달성했습니다. ...
배경: 유럽연합 집행위원회는 디지털 시장법(DMA)을 활용해 온라인 검색에서 구글의 지배적 위치를 다루고 있다. 2024년 3월 이후, 구글은 ...
전통적인 frame-based 카메라는 풍부한 컨텍스트 정보를 캡처하지만, dynamic scenes에서 제한된 temporal resolution과 motion blur가 발생합니다. Event camera...
이 논문은 flow matching models를 인간 선호와 정렬하는 데 초점을 맞춘다. 유망한 방법은 reward gradients를 직접 backpropagating하여 fine‑tuning하는 것이다 ...
이 논문은 사진에서 여러 illumination attributes를 정밀하고 연속적으로 제어할 수 있는 image relighting 방법을 제시한다. 우리는 ...
인공지능 생성 콘텐츠(AIGC) 도구의 급속한 발전으로 웹페이지 디자인을 위해 이미지, 비디오 및 시각화를 필요에 따라 생성할 수 있게 되었습니다.
고수준 자율 주행은 다중모드 미래 불확실성을 모델링하면서 폐루프 상호작용에서 견고함을 유지할 수 있는 motion planners를 필요로 합니다. A...
언어 모델이 체계적으로 일반화할 수 있는지는 여전히 활발히 논쟁되고 있다. 그러나 empirical performance는 training과 같은 여러 요인에 의해 동시에 형성된다.
LLM-as-judge 프레임워크는 자동 NLG 평가에 점점 더 많이 사용되고 있지만, 개별 인스턴스에 대한 신뢰성은 아직 충분히 이해되지 않고 있습니다. 우리는 두 갈래 접근법을 제시합니다.
많은 SLT 시스템은 짧은 수화 조각이 구어 단어에 직접 매핑된다고 조용히 가정합니다. 그 가정은 수화 사용자가 종종 의미를…
비디오 생성은 빠르게 발전했으며, 최근 방법들은 점점 더 설득력 있는 애니메이션 결과물을 만들어내고 있습니다. 그러나 기존 벤치마크는 주로 ...에 맞춰 설계되었습니다.
MLP는 테이블형 데이터에 대한 감독 학습을 위한 현대 딥러닝(DL) 아키텍처에서 널리 사용되는 백본이며, AdamW는 모델을 학습시키는 데 사용되는 대표적인 옵티마이저입니다.
지난 1년 동안, spatial intelligence는 점점 더 많은 관심을 끌고 있습니다. 많은 기존 연구들은 visual‑spatial intelligence의 관점에서 이를 연구했으며, 여기서 mo...
우리는 절단된 직교 다항식 커널로 구축된 서포트 벡터 머신(SVM)들의 사후 훈련 해석 가능성을 연구한다. 연관된 재현…
프리미티브의 효율적인 공간 할당은 3D Gaussian Splatting의 기반이 되며, 이는 표현 구성 요소 간의 시너지를 직접 결정합니다.
3D policy learning은 우수한 일반화와 cross-embodiment transfer를 약속하지만, 훈련 불안정성과 심각한 overfitting으로 인해 진전이 방해받고 있다.
감정을 이해하는 것은 지능형 시스템이 인간과 상호작용할 수 있는 기본적인 능력입니다. Vision-language models (VLMs)는 엄청난 p...
Node embeddings는 graph neural networks의 정보 인터페이스 역할을 하지만, 그들의 실증적 영향은 종종 일치하지 않는 backbones, splits, 그리고 …에 대해 보고됩니다.
이 논문은 텐서 프로그램을 위한 최초의 심볼릭 슈퍼옵티마이저인 Prism을 소개한다. 핵심 아이디어는 sGraph이며, 이는 심볼릭하고 계층적인 표현으로서 압축적으로…
신뢰할 수 있는 uncertainty estimation은 의료 영상 분할에서 매우 중요합니다. 여기서 automated contours는 downstream quantification 및 clinical decision support에 활용됩니다.
비직교 상태(non-orthogonal states)를 동시에 복제할 수 없다는 불가능성은 양자 이론(quantum theory)의 기초에 놓여 있다. 근사 오차(approximation errors)를 허용하더라도, 복제(cloning)…
LLM 에이전트가 다른 목표 추구 에이전트와 효과적이고 안전하게 상호작용하는 것이 점점 더 중요해지고 있지만, 최근 연구들은 반대 추세를 보고하고 있다: LLMs ...
Looped transformers는 더 어려운 문제에 더 많은 iterations를 사용함으로써 test-time compute scaling을 약속하지만, 어떤 architectural choices가 이를 가능하게 하는지는 아직 명확하지 않다.
Speculative decoding (SD)은 가벼운 초안 모델이 더 강력한 타깃 모델이 검증하는 출력을 제안하도록 함으로써 대형 언어 모델 추론을 가속화합니다.
우리는 제로섬 행렬 게임에서 minimax 정책을 학습하는 문제를 연구한다. Fiegel et al. (2025)은 최근 이 분야에서 마지막 반복 수렴(last-iterate convergence)을 달성하는 것이…
LLM-as-a-judge 패러다임은 자동화된 AI 평가 파이프라인의 운영 백본이 되었지만, 검증되지 않은 가정에 기반하고 있습니다: 즉, 심사자들이 평가한다는…
인공지능은 시스템 엔지니어링 활동에 점점 더 도입되고 있으며, 특히 요구사항 엔지니어링 분야에서 품질 평가가.
유머는 추론을 올바르게 하는 것이 정답을 맞추는 것만큼 중요한 몇 안 되는 인지 작업 중 하나입니다. 최근 연구에서는 유머를 평가…
Machine learning이 의료와 같은 고위험 분야에서는 강력한 예측 성능뿐만 아니라 신뢰할 수 있는 불확실성 정량화(UQ)를 필요로 한다...
그룹 수준 사용자 행동을 시뮬레이션하면 비용이 많이 드는 온라인 실험 없이도 상인 전략에 대한 확장 가능한 반사실 평가가 가능해집니다. 그러나, building a tr...
Agentic workflows는 여러 대형 언어 모델(LLM)과 도구들을 조정하여 복잡한 작업을 수행합니다. 이러한 워크플로를 목표 처리량으로 제공하려면 …
Sparse attention은 변환기(transformers)의 2차 비용을 완화하는 방법으로 제안되었으며, 이는 장기 컨텍스트 학습에서의 핵심 병목 현상입니다. 유망한 방향은 …
LLMs는 기계 번역에 능숙함을 입증하고 있지만, 그들의 생성적 특성 때문에 때때로 다양한 방식으로 overgenerate할 수 있습니다. 이러한 overgeneration…
이 작업은 단일 줄기 세포에서 시작하여 유전자 조절 규칙에 의해 제어되는 피질 신경 발생의 발달 과정을 시뮬레이션합니다. 이 규칙들은 mo...
이 베타 기술 보고서는 재사용 가능한 경험을 어떻게 표현해야 효과적인 테스트 시점 제어와 반복을 위한 기반으로 기능할 수 있는지를 묻는다.
공간을 탐색하기 위해 뇌는 place cells, grid cells, head direction cells 등 다양한 세포를 이용해 환경의 내부 표상을 만든다.
Open-weight Small Language Models(SLMs)는 더 낮은 비용으로 빠른 로컬 추론을 제공할 수 있지만, 상용 모델과 동일한 성능 수준을 달성하지 못할 수 있습니다…
Pareto 최적화는 진화적 다목적 알고리즘을 통해 제약이 있는 단조 서브모듈러 함수를 효율적으로 해결할 수 있음이 입증되었습니다. 전통적으로 …
GeForce NOW와 함께 바로 궤도로! https://www.nvidia.com/en-us/geforce-now/ — 우주 헬멧은 필요 없습니다. PRAGMATA, 캡콤의 오래 기다려온 SF 액션 어드벤처...