Source

arXiv

4528 posts from this source

정렬:

2개월 전 · ai · - · -

[Paper] SafeGen-LLM: 로봇 시스템의 작업 계획에서 안전 일반화 향상

안전이 중요한 작업 계획은 로봇 시스템에서 여전히 도전 과제이다: 고전적인 플래너는 확장성이 부족하고, Reinforcement Learning (RL) 기반 방법은…

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] MuViT: 다중 해상도 Vision Transformers를 활용한 현미경에서의 스케일 간 학습

현대 microscopy는 일상적으로 gigapixel 이미지를 생성하며, 이는 미세한 세포 형태에서부터 더 넓은 조직까지 다양한 spatial scales에 걸친 구조를 포함합니다.

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] SenCache: Sensitivity-Aware Caching을 통한 Diffusion Model Inference 가속화

Diffusion models는 state-of-the-art 비디오 생성 품질을 달성하지만, 순차적인 denoising 단계가 많이 필요하기 때문에 inference가 여전히 비용이 많이 듭니다....

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] 멀티모달 대형 언어 모델을 위한 Uncertainty Quantification, Incoherence‑adjusted Semantic Volume 적용

그들의 능력에도 불구하고, Multimodal Large Language Models (MLLMs)는 그럴듯하지만 오류가 있는 출력을 생성할 수 있어 신뢰할 수 있는 배포를 방해합니다. 정확한 불확…

#research #paper #ai #machine-learning #nlp #computer-vision
2개월 전 · ai · - · -

[Paper] MT-PingEval: 다중 턴 협업을 Private Information Games로 평가

우리는 다중 회전 상호작용에서 언어 모델을 평가하기 위한 확장 가능한 방법론을 제시하며, 효과적인 커뮤니케이션을 요구하는 협업 게임 모음을 사용합니다.

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] 작업 중심 소형 언어 모델 가속

소형 언어 모델(SLM)은 작업별 애플리케이션을 위한 대형 언어 모델의 효율적인 대안으로 등장했습니다. 그러나 이들은 종종 …

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] AgenticOCR: 필요에 맞게 파싱하여 효율적인 Retrieval‑Augmented Generation

retrieval-augmented generation (RAG)의 멀티모달 영역으로의 확장은 복잡한 시각 문서, 예를 들어 fin… 처리에 대한 도전을 더욱 심화시켰다.

#OCR #retrieval-augmented generation #multimodal AI #document understanding #efficient inference
2개월 전 · software · - · -

[Paper] LeGend: 하드웨어 모델 검증에서 Lemma 생성을 위한 데이터 기반 프레임워크

RTL 설계의 속성 검사는 형식 검증에서 핵심 작업이다. 사용 가능한 엔진 중 IC3/PDR은 성능이 중요한 널리 사용되는 백본이다.

#research #paper #software
2개월 전 · software · - · -

[Paper] SAP HANA 맥락에서의 Flaky Tests 어휘

배경. 자동화된 테스트 실행은 소프트웨어 프로젝트의 품질에 대한 정보를 수집하는 중요한 활동이다. 이른바 flaky tests는 그러나 …

#research #paper #software
2개월 전 · devops · - · -

[Paper] Asynchronous Multiparty Session Types에서 Mixed Choice

우리는 asynchronous mixed choice (MC)를 지원하는 multiparty session type (MST) 프레임워크를 제시합니다. 우리는 일시적인 불일치를 허용하는 MC를 위한 핵심 구성을 제안합니다.

#research #paper #devops
2개월 전 · software · - · -

[Paper] 불변식 기반 자동 테스트

마이크로서비스 아키텍처는 비즈니스 로직을 작은 서비스들의 모음에 구축하는 신흥 기술입니다. 각 마이크로서비스는 자체 프로세스에서 실행되며 c...

#research #paper #software
2개월 전 · software · - · -

[Paper] 초보 개발자들은 Vibe Coding 중 프로젝트 유지관리자에게 더 큰 리뷰 오버헤드를 초래한다

AI coding agents는 소프트웨어 개발자가 코드를 빠르게 생성하도록 허용하며, 이는 프로젝트 매니저와 오픈 소스 유지관리자에게 실질적인 질문을 제기합니다: can vib...

#research #paper #software
2개월 전 · ai · - · -

[Paper] SWE-rebench V2: 언어에 구애받지 않는 대규모 SWE 작업 컬렉션

소프트웨어 엔지니어링 에이전트(SWE)는 빠르게 개선되고 있으며, 최근의 성과는 주로 강화 학습(RL)에 의해 주도되고 있습니다. 그러나 RL 훈련은 …

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] MPU: 대형 언어 모델을 위한 보안 및 프라이버시 보호 지식 언러닝을 향하여

대규모 언어 모델을 위한 머신 언러닝은 종종 프라이버시 딜레마에 직면하는데, 엄격한 제약으로 서버의 파라미터나 클...

#research #paper #ai #machine-learning
2개월 전 · devops · - · -

[Paper] Hestia: 하이퍼스레드 수준 스케줄링을 통한 클라우드 마이크로서비스의 인터페런스 인식 어텐션

현대 클라우드 서버는 자원 효율성을 향상시키기 위해 여러 latency-sensitive 마이크로서비스 인스턴스를 공동 배치한다. 그러나 마이크로서비스의 다양성은 ...

#research #paper #devops
2개월 전 · software · - · -

[Paper] 고치를 벗기기: 억제된 골든 시드를 활용한 Mutational Greybox Fuzzing

PoCo는 현대의 커버리지 기반 시드 선택(CSS) 기술(예: afl‑cmin)을 향상시키기 위해 장애 조건 문장을 점진적으로 제거하는 기술입니다.

#research #paper #software
2개월 전 · devops · - · -

[Paper] QoSFlow: 분산 워크플로의 서비스 품질 보장을 위한 해석 가능한 민감도 모델

분산 과학 워크플로의 중요성이 증가함에 따라, 최소화와 같은 Quality of Service (QoS) 제약을 보장해야 하는 중요한 필요성이 있습니다.

#research #paper #devops
2개월 전 · ai · - · -

[Paper] Rudder: LLM 에이전트를 활용한 분산 GNN 훈련에서 프리패칭 제어

대규모 그래프 신경망(GNN)은 일반적으로 정점의 이웃을 고정 거리까지 샘플링하여 학습됩니다. 대규모 입력 그래프가 분산되어 있기 때문에,…

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] FedDAG: 이기종 환경을 위한 전역 데이터 및 그래디언트 통합 기반 클러스터형 연합 학습

Federated Learning (FL)은 개별 데이터를 공유하지 않고도 여러 클라이언트가 협업하여 모델을 학습할 수 있게 하지만, 클라이언트 데이터가 …

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] MediX‑R1: 개방형 의료 강화 학습

우리는 MediX‑R1을 소개합니다. 이는 의료 멀티모달 대형 언어 모델(MLLMs)을 위한 개방형 강화 학습(RL) 프레임워크로, 임상적으로 기반된…

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] VGG‑T³: 대규모 오프라인 피드포워드 3D 재구성

우리는 오프라인 피드포워드 방식의 중요한 한계인 계산 및 메모리 요구사항을 해결하는 확장 가능한 3D 재구성 모델을 제시합니다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 앵커링을 통한 모델 합의

수많은 라인들이 모델 불일치를 제어하는 것을 목표로 합니다 — 두 머신러닝 모델이 예측에서 얼마나 서로 다른지를 나타냅니다. 우리는 간단하고 stan...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] SeeThrough3D: 폐색 인식 3D 제어를 이용한 텍스트-이미지 생성

우리는 occlusion reasoning을 3D layout‑conditioned generation에 있어 근본적이면서도 간과된 측면으로 규정한다. 이는 부분적으로 가려진…

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] 센서 일반화를 위한 적응형 센싱 및 이벤트 기반 객체 감지의 공동 분포 학습

바이오 영감을 받은 이벤트 카메라는 비동기식 및 저지연 특성 때문에 최근 큰 연구 관심을 끌고 있습니다. 이러한 특징은 높은 dy...

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] SOTAlign: 최적 수송을 통한 반감독식 단일모드 비전 및 언어 모델 정렬

플라톤적 표현 가설은 서로 다른 모달리티에 대해 훈련된 신경망이 세계에 대한 공유된 통계 모델로 수렴한다는 것을 주장한다. Rece...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 스케일은 프래그머틱스를 극복할 수 없다: 보고 편향이 Vision-Language Reasoning에 미치는 영향

Vision‑Language Models (VLMs)에서 추론 능력의 부족은 연구 논의의 최전선에 남아 있습니다. 우리는 이 현상이 …에서 비롯된다고 가정합니다.

#research #paper #ai #nlp #computer-vision
2개월 전 · ai · - · -

[Paper] FlashOptim: 메모리 효율적인 학습을 위한 옵티마이저

표준 mixed-precision training은 신경망의 각 model parameter마다 많은 바이트의 accelerator memory를 필요로 합니다. 이러한 바이트들은 단지 파라미터…

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 거친 데이터에서 평균 추정: 특성화 및 효율적인 알고리즘

Coarse data는 학습자가 샘플에 대한 부분적인 정보만을 관찰할 때 발생합니다; 즉, 샘플 자체의 정확한 값이 아니라 샘플을 포함하는 집합을 관찰하는 경우입니다. This occurs nat...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 검색 및 분할: 몇 개의 예시만으로 Open-Vocabulary Segmentation의 감독 격차를 메울 수 있을까?

Open-vocabulary segmentation (OVS)은 vision-language models (VLMs)의 zero-shot 인식 능력을 pixel-level prediction으로 확장하여 segmentation을 가능하게 합니다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] AI 기반 과학 연구 도구의 사용 및 참여 이해: Asta Interaction Dataset

AI‑powered scientific research tools가 연구 워크플로에 빠르게 통합되고 있지만, 이 분야는 연구자들이 이러한 시스템을 어떻게 사용하는지에 대한 명확한 시각이 부족합니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] LLMs를 활용한 산업 프로세스 자동화

최근 몇 년간, 소프트웨어 엔지니어링에 Large Language Models (LLMs)를 활용하기 위한 최선의 실천 방안을 다루는 논문이 늘어나고 있습니다. 그러나 대부분은 ...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 전문 투자 팀을 향해: 세분화된 트레이딩 작업을 갖춘 멀티 에이전트 LLM 시스템

대형 언어 모델(LLMs)의 발전은 자율 금융 거래 시스템의 개발을 가속화했습니다. 주류 접근 방식은 다중…

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] LLM 초보자 향상 on Dual-Use, In Silico 생물학 과제

대규모 언어 모델(LLMs)은 생물학 벤치마크에서 점점 더 좋은 성능을 보이고 있지만, 이들이 초보 사용자를 향상시키는지—즉, 인간이 ...

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] ParamMem: 파라메트릭 리플렉티브 메모리를 활용한 언어 에이전트 강화

Self-reflection은 language agents가 해결책을 반복적으로 정제하도록 가능하게 하지만, 종종 추론 성능을 제한하는 반복적인 출력물을 생성한다. 최근 연구들은 …

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 일반화된 Rapid Action Value Estimation in 메모리 제한 환경

Generalized Rapid Action Value Estimation (GRAVE)는 Monte‑Carlo Tree Search (MCTS) 알고리즘 계열에서 강력한 변형으로 입증되었습니다.

#Monte Carlo Tree Search #General Game Playing #memory optimization #node recycling #GRAVE algorithm
2개월 전 · ai · - · -

[Paper] ThinkOmni: 텍스트 추론을 Guidance Decoding을 통해 Omni-modal 시나리오로 확장

Omni-modal reasoning은 지능형 시스템이 다양한 데이터 소스로부터 이해하고 추론을 도출하는 데 필수적입니다. While existing omni-modal large language …

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] PRIMA: 위험 통합 이미지-메타데이터 정렬을 통한 사전 학습으로 LLM을 이용한 의료 진단

의료 진단은 시각적 표현과 임상 메타데이터를 효과적으로 통합해야 합니다. 그러나 기존 방법들은 종종 메타데이터를 고립된 …

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] ManifoldGD: 훈련 없이 계층적 매니폴드 가이던스 for Diffusion-Based Dataset Distillation

최근에는 large datasets가 효율적인 model training을 방해하고 중복된 개념을 포함하고 있습니다. Dataset distillation은 compact datasets를 합성하는 것을 목표로 합니다.

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] SPARTA: 텍스트와 테이블을 위한 트리 구조 멀티홉 QA의 확장 가능하고 원칙 기반 벤치마크

실제 세계의 Table-Text 질문 응답(QA) 작업은 긴 텍스트와 원본 테이블을 가로질러 여러 홉을 탐색하고 co...를 실행할 수 있는 모델을 필요로 합니다.

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] 왜 Diffusion Language Models는 진정한 병렬 (Non-Autoregressive) 디코딩에 어려움을 겪는가?

Diffusion Language Models (DLMs)는 종종 병렬 토큰 생성을 가능하게 한다고 광고되지만, 실제로 빠른 DLM들은 자주 좌측‑우측 순서의 자동 회귀 방식으로 수렴합니다.

#research #paper #ai #machine-learning #nlp
2개월 전 · devops · - · -

[Paper] STELLAR: 고성능 병렬 파일 시스템을 위한 LLM 자율 추론 활용 스토리지 튜닝 엔진

I/O 성능은 데이터 집약적인 과학 컴퓨팅에서 효율성에 매우 중요합니다; 그러나 대규모 스토리지 시스템을 튜닝하는 것은 복잡하고 비용이 많이 들며, 악명 높게 manp...

#research #paper #devops
2개월 전 · ai · - · -

[Paper] InnerQ: 하드웨어 인식 튜닝 프리 KV 캐시 양자화 for Large Language Models

디코딩 중 대규모 언어 모델(LLMs)의 하드웨어 발자국을 줄이는 것은 효율적인 장기 시퀀스 생성에 필수적입니다. 주요 병목 현상은 키-...

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] MTRAG-UN: 다중 턴 RAG 대화의 오픈 과제에 대한 벤치마크

우리는 MTRAG‑UN을 소개합니다. 이는 대형 언어 모델의 인기 있는 활용인 multi‑turn retrieval augmented generation의 열린 과제를 탐구하기 위한 benchmark입니다. 우리는 …

#research #paper #ai #nlp
2개월 전 · software · - · -

[Paper] LLM 구동 Silent Bug Fuzzing, 딥러닝 라이브러리에서 다목적 및 제어된 Bug Transfer를 통해

딥러닝(DL) 라이브러리는 중요한 애플리케이션에서 널리 사용되며, 사소한 무음 버그조차도 심각한 결과를 초래할 수 있습니다. 기존 DL 퍼징…

#research #paper #software
2개월 전 · ai · - · -

[Paper] LLMServingSim 2.0: 이기종 및 분산형 LLM 서빙 인프라를 위한 통합 시뮬레이터

대규모 언어 모델(LLM) 서비스 인프라가 이질성 및 분산화 방향으로 전환하고 있습니다. 현대적인 배포는 점점 더 다양한…

#research #paper #ai #machine-learning
2개월 전 · software · - · -

[Paper] LLM 기반 멀티에이전트 시스템 운영의 불확실성 관리

LLM 기반 다중 에이전트 소프트웨어 시스템을 수명 초음파심장학과 같은 안전이 중요한 분야에 적용하면 시스템 수준의 위험이 발생하며 이는 해결될 수 없습니다.

#research #paper #software
2개월 전 · ai · - · -

[Paper] De-Individuated Neurons에 대하여: Continuous Symmetries가 Dynamic Topologies를 가능하게 한다

이 논문은 새로운 대칭 원칙에 기반한 원시 요소인 등방성 활성화 함수(isotropic activation functions)를 활용하여 동적 네트워크(dynamic networks)를 위한 새로운 방법론을 소개한다. 이는…

#research #paper #ai #machine-learning
2개월 전 · devops · - · -

[Paper] 워크로드 부이언시: 공유 자원 병목 현상을 식별하여 앱을 정상 가동 상태로 유지

현대의 멀티-테넌트, 하드웨어 이종 컴퓨팅 환경은 효과적인 워크로드 오케스트레이션에 상당한 도전을 제기합니다. 단순한 휴리스틱은 ...

#research #paper #devops

Newer posts

Older posts