[Paper] SafeGen-LLM: 로봇 시스템의 작업 계획에서 안전 일반화 향상
안전이 중요한 작업 계획은 로봇 시스템에서 여전히 도전 과제이다: 고전적인 플래너는 확장성이 부족하고, Reinforcement Learning (RL) 기반 방법은…
4528 posts from this source
안전이 중요한 작업 계획은 로봇 시스템에서 여전히 도전 과제이다: 고전적인 플래너는 확장성이 부족하고, Reinforcement Learning (RL) 기반 방법은…
현대 microscopy는 일상적으로 gigapixel 이미지를 생성하며, 이는 미세한 세포 형태에서부터 더 넓은 조직까지 다양한 spatial scales에 걸친 구조를 포함합니다.
Diffusion models는 state-of-the-art 비디오 생성 품질을 달성하지만, 순차적인 denoising 단계가 많이 필요하기 때문에 inference가 여전히 비용이 많이 듭니다....
그들의 능력에도 불구하고, Multimodal Large Language Models (MLLMs)는 그럴듯하지만 오류가 있는 출력을 생성할 수 있어 신뢰할 수 있는 배포를 방해합니다. 정확한 불확…
우리는 다중 회전 상호작용에서 언어 모델을 평가하기 위한 확장 가능한 방법론을 제시하며, 효과적인 커뮤니케이션을 요구하는 협업 게임 모음을 사용합니다.
소형 언어 모델(SLM)은 작업별 애플리케이션을 위한 대형 언어 모델의 효율적인 대안으로 등장했습니다. 그러나 이들은 종종 …
retrieval-augmented generation (RAG)의 멀티모달 영역으로의 확장은 복잡한 시각 문서, 예를 들어 fin… 처리에 대한 도전을 더욱 심화시켰다.
RTL 설계의 속성 검사는 형식 검증에서 핵심 작업이다. 사용 가능한 엔진 중 IC3/PDR은 성능이 중요한 널리 사용되는 백본이다.
배경. 자동화된 테스트 실행은 소프트웨어 프로젝트의 품질에 대한 정보를 수집하는 중요한 활동이다. 이른바 flaky tests는 그러나 …
우리는 asynchronous mixed choice (MC)를 지원하는 multiparty session type (MST) 프레임워크를 제시합니다. 우리는 일시적인 불일치를 허용하는 MC를 위한 핵심 구성을 제안합니다.
마이크로서비스 아키텍처는 비즈니스 로직을 작은 서비스들의 모음에 구축하는 신흥 기술입니다. 각 마이크로서비스는 자체 프로세스에서 실행되며 c...
AI coding agents는 소프트웨어 개발자가 코드를 빠르게 생성하도록 허용하며, 이는 프로젝트 매니저와 오픈 소스 유지관리자에게 실질적인 질문을 제기합니다: can vib...
소프트웨어 엔지니어링 에이전트(SWE)는 빠르게 개선되고 있으며, 최근의 성과는 주로 강화 학습(RL)에 의해 주도되고 있습니다. 그러나 RL 훈련은 …
대규모 언어 모델을 위한 머신 언러닝은 종종 프라이버시 딜레마에 직면하는데, 엄격한 제약으로 서버의 파라미터나 클...
현대 클라우드 서버는 자원 효율성을 향상시키기 위해 여러 latency-sensitive 마이크로서비스 인스턴스를 공동 배치한다. 그러나 마이크로서비스의 다양성은 ...
PoCo는 현대의 커버리지 기반 시드 선택(CSS) 기술(예: afl‑cmin)을 향상시키기 위해 장애 조건 문장을 점진적으로 제거하는 기술입니다.
분산 과학 워크플로의 중요성이 증가함에 따라, 최소화와 같은 Quality of Service (QoS) 제약을 보장해야 하는 중요한 필요성이 있습니다.
대규모 그래프 신경망(GNN)은 일반적으로 정점의 이웃을 고정 거리까지 샘플링하여 학습됩니다. 대규모 입력 그래프가 분산되어 있기 때문에,…
Federated Learning (FL)은 개별 데이터를 공유하지 않고도 여러 클라이언트가 협업하여 모델을 학습할 수 있게 하지만, 클라이언트 데이터가 …
우리는 MediX‑R1을 소개합니다. 이는 의료 멀티모달 대형 언어 모델(MLLMs)을 위한 개방형 강화 학습(RL) 프레임워크로, 임상적으로 기반된…
우리는 오프라인 피드포워드 방식의 중요한 한계인 계산 및 메모리 요구사항을 해결하는 확장 가능한 3D 재구성 모델을 제시합니다.
수많은 라인들이 모델 불일치를 제어하는 것을 목표로 합니다 — 두 머신러닝 모델이 예측에서 얼마나 서로 다른지를 나타냅니다. 우리는 간단하고 stan...
우리는 occlusion reasoning을 3D layout‑conditioned generation에 있어 근본적이면서도 간과된 측면으로 규정한다. 이는 부분적으로 가려진…
바이오 영감을 받은 이벤트 카메라는 비동기식 및 저지연 특성 때문에 최근 큰 연구 관심을 끌고 있습니다. 이러한 특징은 높은 dy...
플라톤적 표현 가설은 서로 다른 모달리티에 대해 훈련된 신경망이 세계에 대한 공유된 통계 모델로 수렴한다는 것을 주장한다. Rece...
Vision‑Language Models (VLMs)에서 추론 능력의 부족은 연구 논의의 최전선에 남아 있습니다. 우리는 이 현상이 …에서 비롯된다고 가정합니다.
표준 mixed-precision training은 신경망의 각 model parameter마다 많은 바이트의 accelerator memory를 필요로 합니다. 이러한 바이트들은 단지 파라미터…
Coarse data는 학습자가 샘플에 대한 부분적인 정보만을 관찰할 때 발생합니다; 즉, 샘플 자체의 정확한 값이 아니라 샘플을 포함하는 집합을 관찰하는 경우입니다. This occurs nat...
Open-vocabulary segmentation (OVS)은 vision-language models (VLMs)의 zero-shot 인식 능력을 pixel-level prediction으로 확장하여 segmentation을 가능하게 합니다.
AI‑powered scientific research tools가 연구 워크플로에 빠르게 통합되고 있지만, 이 분야는 연구자들이 이러한 시스템을 어떻게 사용하는지에 대한 명확한 시각이 부족합니다.
최근 몇 년간, 소프트웨어 엔지니어링에 Large Language Models (LLMs)를 활용하기 위한 최선의 실천 방안을 다루는 논문이 늘어나고 있습니다. 그러나 대부분은 ...
대형 언어 모델(LLMs)의 발전은 자율 금융 거래 시스템의 개발을 가속화했습니다. 주류 접근 방식은 다중…
대규모 언어 모델(LLMs)은 생물학 벤치마크에서 점점 더 좋은 성능을 보이고 있지만, 이들이 초보 사용자를 향상시키는지—즉, 인간이 ...
Self-reflection은 language agents가 해결책을 반복적으로 정제하도록 가능하게 하지만, 종종 추론 성능을 제한하는 반복적인 출력물을 생성한다. 최근 연구들은 …
Generalized Rapid Action Value Estimation (GRAVE)는 Monte‑Carlo Tree Search (MCTS) 알고리즘 계열에서 강력한 변형으로 입증되었습니다.
Omni-modal reasoning은 지능형 시스템이 다양한 데이터 소스로부터 이해하고 추론을 도출하는 데 필수적입니다. While existing omni-modal large language …
의료 진단은 시각적 표현과 임상 메타데이터를 효과적으로 통합해야 합니다. 그러나 기존 방법들은 종종 메타데이터를 고립된 …
최근에는 large datasets가 효율적인 model training을 방해하고 중복된 개념을 포함하고 있습니다. Dataset distillation은 compact datasets를 합성하는 것을 목표로 합니다.
실제 세계의 Table-Text 질문 응답(QA) 작업은 긴 텍스트와 원본 테이블을 가로질러 여러 홉을 탐색하고 co...를 실행할 수 있는 모델을 필요로 합니다.
Diffusion Language Models (DLMs)는 종종 병렬 토큰 생성을 가능하게 한다고 광고되지만, 실제로 빠른 DLM들은 자주 좌측‑우측 순서의 자동 회귀 방식으로 수렴합니다.
I/O 성능은 데이터 집약적인 과학 컴퓨팅에서 효율성에 매우 중요합니다; 그러나 대규모 스토리지 시스템을 튜닝하는 것은 복잡하고 비용이 많이 들며, 악명 높게 manp...
디코딩 중 대규모 언어 모델(LLMs)의 하드웨어 발자국을 줄이는 것은 효율적인 장기 시퀀스 생성에 필수적입니다. 주요 병목 현상은 키-...
우리는 MTRAG‑UN을 소개합니다. 이는 대형 언어 모델의 인기 있는 활용인 multi‑turn retrieval augmented generation의 열린 과제를 탐구하기 위한 benchmark입니다. 우리는 …
딥러닝(DL) 라이브러리는 중요한 애플리케이션에서 널리 사용되며, 사소한 무음 버그조차도 심각한 결과를 초래할 수 있습니다. 기존 DL 퍼징…
대규모 언어 모델(LLM) 서비스 인프라가 이질성 및 분산화 방향으로 전환하고 있습니다. 현대적인 배포는 점점 더 다양한…
LLM 기반 다중 에이전트 소프트웨어 시스템을 수명 초음파심장학과 같은 안전이 중요한 분야에 적용하면 시스템 수준의 위험이 발생하며 이는 해결될 수 없습니다.
이 논문은 새로운 대칭 원칙에 기반한 원시 요소인 등방성 활성화 함수(isotropic activation functions)를 활용하여 동적 네트워크(dynamic networks)를 위한 새로운 방법론을 소개한다. 이는…
현대의 멀티-테넌트, 하드웨어 이종 컴퓨팅 환경은 효과적인 워크로드 오케스트레이션에 상당한 도전을 제기합니다. 단순한 휴리스틱은 ...