[Paper] VP-AutoTest: 가상-물리 융합 자율주행 테스트 플랫폼
자율주행 차량의 급속한 개발은 테스트 수요의 급증을 초래했습니다. 전통적인 테스트 방법으로는 virtual simulation, closed‑course, 그리고 p...
3272 posts from this source
자율주행 차량의 급속한 개발은 테스트 수요의 급증을 초래했습니다. 전통적인 테스트 방법으로는 virtual simulation, closed‑course, 그리고 p...
자연어 요구사항으로부터 검증 가능한 코드를 자동으로 합성하면 소프트웨어 정확성과 신뢰성을 보장하면서 장벽을 크게 낮출 수 있습니다.
우리는 대형 언어 모델(LLMs)이 도구 사용 능력을 갖춘 자율 에이전트로 작동할 때 어떻게 실패하는지를 조사한다. Kamiwaza Agentic Merit Index (KAM...
DreamerV3는 놀라운 샘플 효율성으로 알려진 최첨단 온라인 모델 기반 강화 학습(MBRL) 알고리즘입니다. 동시에, Kolmogorov-Arno…
활성 오토마타 학습, 모델 기반 테스트 및 모델 검증의 조합은 수많은 응용 분야에서 성공적으로 사용되어 왔으며, 예를 들어 버그를 찾아내는 데에 활용됩니다.
대규모 언어 모델(LLMs)이 code generation에 효과적임에도 불구하고, 종종 잘못된 코드를 출력합니다. 그 이유 중 하나는 모델 출력 확률이…
Otus는 2025년에 출범한 high-performance computing cluster이며, 파더보른 대학교의 Paderborn Center for Parallel Computing (PC2)에서 운영됩니다.
우리는 잡음이 섞인 과소결정 관측값으로부터 알려지지 않은 저차원 벡터를 복원하는 문제를 고려한다. 우리는 Generalized Projected Gradient에 초점을 맞춘다.
에지에서의 아날로그 컴퓨팅은 데이터 저장 및 전송 요구량과 에너지 소비를 제한하기 위한 새로운 전략이며, 그 실용적인 구현…
Video diffusion models (VDMs)는 3D 시공간 도메인에서 attention computation을 수행합니다. 1D 시퀀스를 처리하는 large language models (LLMs)와 비교하면…
Vision-language models (VLMs)는 인상적인 멀티모달 이해 능력을 보여주었으며, 점점 더 많은 온라인 비디오에서 배포되고 있습니다.
대규모 언어 모델(LLMs)의 빠른 채택은 AI 가속기를 점점 더 강력하고 특화된 설계로 몰아가고 있습니다. 대신에 더 복잡해지는…
프로세스 마이닝은 전통적으로 중앙 집중식 이벤트 데이터 수집 및 분석을 전제로 합니다. 그러나 현대의 Industrial Internet of Things 시스템은 점점 더 ...
서브레이트 역전파는 심층 스파이킹 신경망(SNN) 훈련에 유용함이 입증되었지만, 대규모 규모에서 생물학적으로 영감을 받은 로컬 신호를 통합하는 것은 ...
Lottery Ticket Hypothesis은 조밀하고 무작위 초기화된 신경망 내에 매우 희소하고 학습 가능한 서브네트워크('winning tickets')가 존재한다는 것을 주장한다.
우리는 Neuro-Vesicles를 소개합니다, 기존 신경망에 누락된 계산 레이어를 보강하는 프레임워크: 동적인 이동성, 이산…
이 논문은 ArcGD 옵티마이저의 공식화, 구현 및 평가를 제시한다. 평가는 처음에 비볼록 벤치마크 함수에 대해 수행된다.
우리는 조명 위상 다중화(illumination phase multiplexing)를 활용하여 출력 함수를 동적으로 재구성하는 단색 다중 작업 회절 네트워크 아키텍처를 보고한다.
LSTM 및 GRU와 같은 순환 신경망 구조는 시퀀스 모델링에서 여전히 널리 사용되지만, 두 가지 핵심 제한에 계속 직면하고 있습니다: 중복된 게이트‑spec…
대형 언어 모델(LLM) 시대에, 검색 강화 생성(RAG) 아키텍처는 언어를 기반으로 하는 능력으로 인해 큰 주목을 받고 있습니다.
Instruction-based image editing은 눈에 띄는 연구 분야로 부상했으며, image generation foundation models의 혜택을 받아 높은 미학적…
Real-time chunking (RTC)은 vision-language-action models (VLAs)이 비동기적으로 action chunks를 예측함으로써 부드럽고 반응적인 robot trajectories를 생성하도록 합니다.
Reinforcement Learning (RL)은 추론을 포함하는 작업을 해결하기 위해 LLM을 튜닝하는 사실상의 표준이 되었습니다. 그러나 점점 더 많은 증거가 모델이 …
수중 이미지는 파장에 따라 달라지는 빛의 흡수와 산란 때문에 색 왜곡이 심하고, 대비가 낮으며, 흐릿한 외관을 자주 보입니다. Si...
비전-언어 모델(VLM)은 시각 질문 응답(VQA)에서 강력한 성능을 달성했지만, 여전히 정적인 학습 데이터에 제한을 받고 있습니다. Retrieva...
대규모 언어 모델(LLM)을 기반으로 한 생성형 검색 엔진이 전통적인 검색을 대체하고 있으며, 정보 제공자가 보상받는 방식을 근본적으로 변화시키고 있습니다.
본 연구에서는 RKHS 함수의 밴딧 최적화에서 커널 정규성 및 알고리즘 성능 간의 관계를 조사합니다. While reproduci...
Vision-Language Models (VLMs)는 놀라운 상식 및 의미론적 추론 능력을 보여줍니다. 그러나 이들은 물리적 역학에 대한 근거 있는 이해가 부족합니다…
우리는 15,045개의 대학 수준 물리 문제로 구성된 대규모 synthetic benchmark(90/10% train/test split)를 소개한다. 각 문제는 완전히 parameterized되어 있으며, …
대규모 언어 모델을 기반으로 하는 AI 에이전트는 민감한 데이터에 자율적으로 접근하고, 외부 도구를 호출하며, inter…
불완전한 데이터는 실제 응용에서 흔합니다. 센서가 고장 나고, 기록이 일관되지 않으며, 서로 다른 출처에서 수집된 데이터셋은 종종 규모가 다릅니다.
미국(US) 인구조사국(US Census Bureau)에서 제공하는 개인에 대한 공개용 마이크로데이터 샘플(PUMS)은 수십 년 동안 이용 가능했습니다. 그러나 컴퓨…
자원 할당은 조합적 복잡성 때문에 여전히 NP-hard이다. Rainbow Deep Q-Network (DQN)와 같은 deep reinforcement learning (DRL) 방법은 ...
Grounding은 그래픽 사용자 인터페이스(GUI) 에이전트를 구축하기 위한 기본적인 능력입니다. 기존 접근 방식들은 대규모 바운딩 박스 감독에 의존하지만…
Optimal experimental design은 통계학에서 고전적인 주제로, 많은 연구된 문제, 응용 및 해결책이 있습니다. 우리가 연구하는 design problem은 p…
딥러닝을 위한 설명 가능한 AI(XAI)의 일반적인 접근 방식은 주어진 모델에서 분류 작업에 대한 입력 특징의 중요성을 분석하는 데 초점을 맞춥니다: sal...
본 논문에서는 traffic sign recognition 작업에서 d...의 장점을 결합한 synthesis pipeline 및 dataset을 제시하여 training / testing 데이터를 제공합니다.
우리는 blooming, echo pulse width, ambient light를 포함한 자동차용 time-of-flight (ToF) LiDAR 시뮬레이션을 위한 분석 모델을 제시하며, 단계와 함께 ...
딥 뉴럴 네트워크는 실제 환경에 배치될 때 분포 이동(distribution shift) 때문에 자주 실패하며, 이는 안전하고 신뢰할 수 있는 시스템을 구축하는 데 중요한 장벽이 됩니다. An eme...
Facial recognition은 인증 및 식별을 위한 널리 사용되는 방법이 되었으며, 보안 접근 및 실종자 찾기에 활용됩니다. Its ...
최근 생성 비디오 모델의 발전으로 고품질 비디오 합성에서 큰 돌파구가 마련되었으며, 특히 제어 가능한 비디오 생성 분야에서 눈에 띄는 진전이 이루어졌습니다.
우리는 균형 잡힌 k-means 클러스터링의 근본적인 문제를 고려한다. 특히, 우리는 교대 최소화에 대한 optimal transport 접근법을 소개한다.
출판된 AI 논문에는 얼마나 많은 실수가 포함되어 있을까요? Peer-reviewed 출판물은 새로운 연구와 지식이 구축되는 기반을 형성합니다. 오류가 …
Orthognathic surgery는 dentofacial skeletal 변형을 교정하여 occlusal 기능과 facial aesthetics를 향상시키는 중요한 중재입니다. 정확한…
멀티 리포지토리 마이크로서비스 아키텍처에서 버그 로컬라이제이션은 자연어 버그 보고서와 코드 사이의 의미 격차 때문에 어려우며, LLM ...
스파이킹 뉴럴 네트워크(SNNs)는 계산 신경과학 및 뉴로모픽 머신 러닝(ML)의 핵심이며, 효율적인 시뮬레이션과 그래디언트 기반 …
MLIR와 같은 현대의 확장 가능한 컴파일러 프레임워크는 도메인 특화 언어 다이얼렉트를 빠르게 생성할 수 있게 합니다. 그러나 이러한 유연성은 정확성을 보장하기 어렵게 만듭니다.
의료 질문‑응답(QA) 시스템은 대형 언어 모델(LLMs)의 발전으로 혜택을 볼 수 있지만, LLM을 임상 분야에 직접 적용하는 것은 도전 과제를 안고 있다.