Source

arXiv

4670 posts from this source

정렬:

5개월 전 · devops · - · -

[Paper] LLM 추론 서빙에서 Goodput을 극대화하기 위한 동적 PD-Disaggregation 아키텍처

엄격한 서비스 수준 목표(SLO)를 충족하기 위해, 현대의 대형 언어 모델(LLMs)은 프리필(prefill) 단계와 디코딩(decoding) 단계를 분리하고 이를 별개의 GPU에 배치한다.

#LLM inference #dynamic scaling #GPU orchestration #goodput optimization #serving architecture
5개월 전 · ai · - · -

[Paper] 아라고그: 에이전트 워크플로우의 확장 가능한 서빙을 위한 실시간 모델 라우팅

Agentic workflows는 복잡하고 다단계 작업을 해결하기 위한 강력한 패러다임으로 부상했지만, 규모에 맞게 서비스를 제공하는 것은 계산 비용이 많이 듭니다, given the m...

#model routing #agentic workflows #LLM serving #scalable inference #cost optimization
5개월 전 · ai · - · -

[Paper] RosettaSpeech: 단일 언어 데이터에서 제로샷 음성‑음성 번역

The scarcity of parallel speech corpora critically hampers speech-to-speech translation (S2ST), often forcing reliance on complex, multi-stage pipelines. This p...

#research #paper #ai #machine-learning #nlp
5개월 전 · ai · - · -

[Paper] 대형 오디오 언어 모델에서 오디오 토큰 압축을 향하여

대형 오디오 언어 모델(LALM)은 음성 인식부터 일반 오디오 이해에 이르기까지 다양한 작업에서 인상적인 성능을 보여줍니다. 어떻게…

#research #paper #ai #machine-learning #nlp
5개월 전 · ai · - · -

[Paper] TrafficLens: 다중 카메라 트래픽 비디오 분석 LLM 활용

Traffic cameras are essential in urban areas, playing a crucial role in intelligent transportation systems. Multiple cameras at intersections enhance law enforc... 교통 카메라는 도시 지역에서 필수적이며, 지능형 교통 시스템에서 중요한 역할을 합니다. 교차로에 여러 대의 카메라를 설치하면 법 집행을 강화합니다...

#research #paper #ai #nlp #computer-vision
5개월 전 · ai · - · -

[Paper] SpaceX: 개발자 생산성을 위한 SPACE 모델을 활용한 메트릭 탐색

이 실증적 연구는 결정론적이며 단일 차원적인 생산성 휴리스틱의 한계를 밝히기 위해 SPACE 프레임워크를 운영함으로써 ...

#research #paper #ai #machine-learning
5개월 전 · software · - · -

[Paper] 소프트웨어 설계 역량에 대한 계층적 평가 – Large Language Models of Code

대형 언어 모델(LLMs)은 소프트웨어 엔지니어링 분야에서 점점 더 많이 채택되고 있지만, 핵심 소프트웨어 설계 개념에 대한 그들의 이해가 얼마나 견고한지는 아직 불확실합니다.

#research #paper #software
5개월 전 · ai · - · -

[논문] 잔차 하이브리드 양자‑클래식 모델을 위한 읽기 측면 바이패스

Quantum machine learning (QML)은 컴팩트하고 표현력이 풍부한 표현을 제공할 것을 약속하지만, 측정 병목 현상—좁은 양자‑클래식 읽기…에 시달린다.

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] 인프라 재건 프로그램 관리에 머신러닝 적용

이 논문의 목적은 엔지니어링 인프라 재구축의 효율성을 향상시키기 위한 adaptive decision‑making support model을 설명하는 것이다.

#machine learning #infrastructure planning #decision support #Azure ML #neural networks
5개월 전 · ai · - · -

[Paper] 편향 완화를 위한 진화된 SampleWeights: 효과는 Optimization Objectives에 따라 달라진다

Machine learning 모델이 실제 데이터를 기반으로 훈련될 경우, 의도치 않게 편향된 예측을 하여 소외된 커뮤니티에 부정적인 영향을 미칠 수 있습니다. Reweighting은 …

#bias mitigation #fairness #genetic algorithm #sample weighting #multi-objective optimization
5개월 전 · ai · - · -

[Paper] 사전 학습으로 이득 얻기: 깨끗한 라벨 없이도 강인한 학습

Training deep networks with noisy labels leads to poor generalization and degraded accuracy due to overfitting to label noise. Existing approaches for learning ... 노이즈가 있는 레이블로 딥 네트워크를 학습하면 레이블 노이즈에 과적합하여 일반화 성능이 저하되고 정확도가 떨어집니다. 기존의 학습 접근법은 ...

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] Voxel 기반 포인트 클라우드 네트워크에서 Sparse Convolutions 가속화

Sparse Convolution (SpC)은 자율 주행 및 AR/VR에 널리 사용되는 3D 포인트 클라우드 네트워크에 동력을 제공합니다. SpC는 입력 사이의 매핑을 저장하는 커널 맵을 구축합니다.

#sparse convolutions #point cloud #GPU acceleration #Spira #3D deep learning
5개월 전 · devops · - · -

[Paper] 가상화 시스템 아키텍처에서 가용성 향상을 위한 중복 전략 평가

클라우드 기반 스토리지 플랫폼은 데이터에 대한 유연한 접근성과 협업 지원 덕분에 학계와 비즈니스 환경 모두에서 점점 더 일반화되고 있습니다.

#availability #redundancy #virtualization #cloud #stochastic-petri-nets
5개월 전 · software · - · -

죄송합니다만, 번역하려는 전체 텍스트를 제공해 주시겠어요? 소스 링크와 함께 번역이 필요한 본문 전체가 필요합니다. 감사합니다.

Existing C to Rust translation techniques fail to balance quality and scalability: transpilation-based approaches scale to large projects but produce code with ... → 기존 C에서 Rust로의 변환 기술은 품질과 확장성의 균형을 맞추지 못합니다: 트랜스파일 기반 접근 방식은 대규모 프로젝트에 확장 가능하지만 코드가 ... 로 생성됩니다.

#research #paper #software
5개월 전 · ai · - · -

[Paper] EnergyTwin: 다중 에이전트 시스템을 이용한 에너지 마이크로그리드 시뮬레이션 및 조정

Microgrids는 구매한 전력망 에너지를 감소시키고, 변동성이 큰 tariffs에 대한 노출을 제한하며, 교란 상황에서 service continuity를 보장하기 위해 배치됩니다. 이는 …

#multi-agent systems #microgrid simulation #digital twin #energy forecasting #AI planning
5개월 전 · it · - · -

[Paper] Massive MIMO 시스템에서 Pilot Assignment Problem의 효율적인 병렬 구현

pilot sequence의 할당은 massive MIMO 시스템에서 중요한 과제이며, 여러 사용자가 동일한 pilot sequence를 공유하면 간섭을 초래한다…

#massive-mimo #fpga #pilot-assignment #6g #parallel-implementation
5개월 전 · ai · - · -

[Paper] 한 공격 도메인에서 다른 도메인으로: Contrastive Transfer Learning과 Siamese Networks를 활용한 APT Detection

Advanced Persistent Threats (APT)는 은밀함, 지속성 및 적응력 때문에 주요 사이버 보안 과제를 제기합니다. 전통적인 머신 러닝 detecto...

#APT detection #contrastive learning #Siamese networks #transfer learning #SHAP explainability
5개월 전 · ai · - · -

[Paper] 순위 강화 이상 탐지: 능동 학습 지원 어텐션 적대적 이중 오토인코더 사용

Advanced Persistent Threats (APTs)는 은밀하고 장기적인 특성 때문에 사이버 보안에서 상당한 도전을 제기합니다. 현대의 감독 학습 방법은 …

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] Java에서 자동화된 단위 테스트 생성 및 평가를 위한 LLMs: AgoneTest Framework

Unit testing은 소프트웨어 개발에서 필수적이지만 자원이 많이 소모되는 단계로, 개별 코드 유닛이 올바르게 작동하는지를 보장합니다. 이 논문은 Agone을 소개합니다.

#research #paper #ai #machine-learning
5개월 전 · devops · - · -

[Paper] Raspberry Pi에서 Proof-of-Work 합의 프로토콜의 인터랙티브 시각화

우리는 여러 Raspberry Pi(RPi) 컴퓨터에서 실행되는 완전한 기능을 갖춘 Ethereum Proof-of-Work(PoW) 블록체인 네트워크의 프로토타입을 설명한다. 이 프로토타입은 …

#research #paper #devops
5개월 전 · ai · - · -

[Paper] NNGPT: 대형 언어 모델을 활용한 AutoML 다시 생각하기

Building self-improving AI systems remains a fundamental challenge in the AI domain. We present NNGPT, an open-source framework that turns a large language mode...

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] Data-Driven Methods와 AI를 활용한 Engineering Design: 도전 과제와 기회에 초점을 맞춘 체계적 문헌 검토

데이터의 가용성이 증가하고 계산 지능의 발전으로 인해 데이터 기반 방법(DDMs)의 제품 개발 적용이 가속화되었습니다.

#engineering design #data-driven methods #machine learning #deep learning #systematic review
5개월 전 · ai · - · -

[Paper] Beluga: 확장 가능하고 효율적인 LLM KVCache 관리를 위한 CXL 기반 메모리 아키텍처

LLM 모델 크기의 급격한 증가와 장기 컨텍스트 추론에 대한 수요가 늘어나면서 메모리는 GPU 가속 서빙 시스템에서 중요한 병목 현상이 되었습니다.

#CXL #LLM #KVCache #memory architecture #inference acceleration
5개월 전 · devops · - · -

[Paper] 변형 가능한 물체 사이의 3D 탄성 정역학 접촉 역학 문제에 대한 병렬 시뮬레이션 및 적응형 메쉬 정밀화

Parallel implementation of numerical adaptive mesh refinement (AMR)strategies for solving 3D elastostatic contact mechanics problems is an essential step toward...

#research #paper #devops
5개월 전 · ai · - · -

[Paper] QiMeng-Kernel: 매크로 사고 마이크로 코딩 패러다임 for LLM 기반 고성능 GPU 커널 생성

고성능 GPU 커널을 개발하는 것은 AI와 과학 컴퓨팅에 매우 중요하지만, 전문가 수준의 정교한 설계에 의존하고 성능 예측이 어려워 여전히 도전적인 과제입니다.

#research #paper #ai #nlp
5개월 전 · ai · - · -

[Paper] Foundry: 엣지를 위한 3D 파운데이션 모델 증류

대규모 데이터셋에 대해 자체 지도 학습(self-supervised learning, SSL)으로 사전 학습된 Foundation models는 강력한 범용 feature extractor가 되었습니다. 그러나, ...

#3d-vision #model-distillation #edge-computing #foundation-models #point-clouds
5개월 전 · ai · - · -

[Paper] 변화하는 환경에서의 에너지 비용과 신경 복잡성 진화

Cognitive Buffer Hypothesis (CBH)는 큰 뇌가 변화하는 조건에서 생존을 향상시키기 위해 진화했다는 가설이다. 그러나 큰 뇌는 또한 더 높은 에너지…

#energy-efficient AI #neural architecture search #evolutionary reinforcement learning #edge AI #expensive brain hypothesis
5개월 전 · devops · - · -

[논문] SwitchDelta: 비동기 메타데이터 업데이트를 통한 인‑네트워크 데이터 가시성을 갖춘 분산 스토리지

Distributed storage systems typically maintain strong consistency between data nodes and metadata nodes by adopting ordered writes: 1) first installing data; 2)... 분산 스토리지 시스템은 일반적으로 순차적 쓰기를 채택하여 데이터 노드와 메타데이터 노드 간에 강력한 일관성을 유지합니다: 1) 먼저 데이터를 설치하고; 2)...

#research #paper #devops
5개월 전 · ai · - · -

[Paper] Stragglers Can Contribute More: Uncertainty-Aware Distillation for Asynchronous Federated Learning [Paper] 지연자도 더 많이 기여할 수 있다: 비동기 연합 학습을 위한 불확실성 인식 증류

비동기 연합 학습(FL)은 최근 효율성과 확장성을 높인다는 점에서 주목받고 있으며, 로컬 클라이언트가 모델 업데이트를 ...

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] ParaBlock: 대규모 언어 모델을 위한 통신‑계산 병렬 블록 좌표 연합 학습

연합 학습(Federated Learning, FL)은 프라이버시를 보호하는 학습 패러다임으로 광범위하게 연구되어 왔습니다. 최근에는 연합 블록 좌표 하강법(federated block coordinate descent) 스킴이 ...

#research #paper #ai #machine-learning
5개월 전 · devops · - · -

[Paper] PolarStore: 대규모 클라우드‑네이티브 데이터베이스를 위한 고성능 데이터 압축

최근 몇 년간, 리소스 탄력성과 비용 최적화는 RDBMS에 필수 요소가 되었습니다. 클라우드 네이티브 RDBMS는 d...을 통해 탄력적인 컴퓨팅 리소스를 제공합니다.

#research #paper #devops
5개월 전 · devops · - · -

[Paper] 모바일 에이전트를 통한 최소 지배 집합의 선형 시간 구축 개선

Mobile agents는 최근에 분산 환경에서 기본적인 그래프 문제를 해결하기 위한 강력한 프레임워크로 부상했습니다. 이러한 에이전트들은 aut...

#research #paper #devops
5개월 전 · ai · - · -

[Paper] CodeFuse-CommitEval: 커밋 메시지와 코드 변경 불일치 탐지에서 LLM의 성능 벤치마킹을 향하여

Version control은 코드 변경의 이유를 전달하기 위해 commit messages에 의존하지만, 이러한 메시지는 종종 품질이 낮고, 더 중요한 것은 일관성이 부족합니다 …

#LLM #benchmark #commit-message inconsistency #software engineering #code review
5개월 전 · ai · - · -

[Paper] 무선 분산 학습을 Hybrid Split 및 Federated Learning 최적화를 통해 가속화

연합 학습(Federated learning, FL)과 분할 학습(split learning, SL)은 무선 네트워크에서 효과적인 분산 학습 패러다임으로, 협업 모델 훈련을 가능하게 합니다.

#federated learning #split learning #edge AI #wireless optimization #distributed training
5개월 전 · ai · - · -

[Paper] 무선 엣지 네트워크에서 AIGC 서비스 프로비저닝을 위한 배치 디노이징

무선 엣지 네트워크에서 인공지능 생성 콘텐츠(AIGC) 서비스 제공은 두 단계로 이루어집니다: 엣지 서버에서의 콘텐츠 생성 및 …

#AIGC #edge computing #batch denoising #diffusion models #wireless networks
5개월 전 · devops · - · -

[Paper] 비균일 메모리 접근(NUMA) 아키텍처에서 과학 워크플로 스케줄링 연구 활성화

데이터 집약적인 과학 워크플로는 전통적인 Grid 및 Cloud 플랫폼을 보완하면서 고성능 컴퓨팅(HPC) 시스템에 점점 더 의존하고 있습니다. 그러나 …

#NUMA #workflow scheduling #HPC #runtime system #simulation
5개월 전 · software · - · -

[Paper] 성능 프로파일링을 통한 가속기 컴파일러 이해

Accelerator design languages (ADLs), high-level languages that compile to hardware units, help domain experts quickly design efficient application-specific hard... 가속기 설계 언어(ADL)는 하드웨어 유닛으로 컴파일되는 고수준 언어로, 도메인 전문가가 효율적인 응용 프로그램 전용 하드웨어를 빠르게 설계하도록 돕습니다.

#research #paper #software
5개월 전 · ai · - · -

[Paper] DUALGUAGE: 보안 코드 생성을 위한 자동화된 공동 보안·기능 벤치마킹

Large language models (LLMs)와 autonomous coding agents는 다양한 도메인에 걸쳐 소프트웨어를 생성하는 데 점점 더 많이 사용되고 있습니다. 그러나 핵심 요구 사항은 …

#secure code generation #LLM benchmarking #software security #AI research #dual evaluation
5개월 전 · ai · - · -

[Paper] Agint: 소프트웨어 엔지니어링 에이전트를 위한 Agentic Graph Compilation

LLM 기반 코딩 에이전트는 점점 흔해지고 있지만 여전히 컨텍스트 관리, 레이턴시, 신뢰성, 재현성 및 확장성 측면에서 도전에 직면하고 있습니다. We pres...

#agentic AI #LLM coding assistants #graph compilation #software engineering automation #research paper
5개월 전 · ai · - · -

[논문] 프롬프트는 적게, 미소는 더 많이: 프롬프트 엔지니어링 대신 의미 엔지니어링을 활용한 MTP

AI-통합 프로그래밍은 대형 언어 모델(LLM)을 활용한 지능형 시스템 구축을 위한 기본 패러다임으로 부상하고 있습니다. 최근 접근 방식인 M...

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] SLMFix: 소형 언어 모델을 활용한 강화 학습 기반 오류 수정

Recent advancements in large language models (LLMs) have shown very impressive capabilities in code generation across many programming languages. However, even ... 최근 대형 언어 모델(LLM)의 최근 발전은 다양한 프로그래밍 언어에서 코드 생성에 매우 인상적인 능력을 보여주었습니다. 그러나, ...

#research #paper #ai #machine-learning
5개월 전 · devops · - · -

[Paper] ARMv8 환경에서 가상 주소 원격 DMA를 위한 IOMMU 지원

많은 compute node가 여러 CPU를 포함하고 각 node 내에서 일관성을 유지하는 복잡한 시스템에서, 핵심 과제는 효율적이고 올바른 coherence를 유지하는 것이다.

#research #paper #devops
5개월 전 · ai · - · -

[Paper] 양자 오토인코더를 위한 신경망 구조 탐색

최근 몇 년간, 머신 러닝과 딥 러닝은 이미지 분류, 음성 인식, 그리고 이상 탐지와 같은 분야에서 l...에 의해 발전을 이끌어 왔습니다.

#research #paper #ai #machine-learning
5개월 전 · it · - · -

[Paper] 코드랄 그래프 및 관련 클래스에서 리더 선출을 위한 상수 크기 인증서

분산 컴퓨팅에서 certification scheme은 일련의 states와 그 states에 대한 conditions로 구성되며, 이를 통해 graph의 각 node가 효율적으로 ver…

#distributed systems #leader election #self-stabilization #graph algorithms #certificates
5개월 전 · ai · - · -

[Paper] AME: 스마트폰을 위한 효율적인 이종 에이전트 메모리 엔진

스마트폰의 온-디바이스 에이전트는 개인화되고 컨텍스트-어웨어하며 장기적인 행동을 지원하기 위해 지속적으로 진화하는 메모리를 점점 더 필요로 합니다. 이를 충족하기 위해 ...

#vector database #mobile AI #edge computing #privacy-preserving #smartphone hardware
5개월 전 · software · - · -

[Paper] 사양 후보를 좁히기 위한 테스트 케이스 합성

이 논문은 대안 집합 중에서 최적의 형식 사양 후보를 선택하는 데 도움이 되는 기술을 제안한다. 사양 집합이 주어지면, 우리의 기술은…

#research #paper #software
5개월 전 · software · - · -

[Paper] LLMs 기반 실시간 결함 주입: 지능형 결함 테스트 케이스 생성을 위한 접근법

자동차 소프트웨어 시스템(ASSs)의 안전성 평가 및 실시간 검증을 위한 잘 알려진 테스트 방법은 Fault Injection(FI)이다. 이에 따라...

#research #paper #software
5개월 전 · ai · - · -

[Paper] LLM이 프로그램 의미론을 복원할 수 있을까? 심볼릭 실행을 통한 체계적인 평가

Obfuscation은 프로그램 이해, 유지보수, 테스트 및 취약점 탐지와 같은 소프트웨어 엔지니어링 작업에 지속적인 도전을 제기한다. 하지만 ...

#LLM #symbolic execution #code deobfuscation #program semantics #research

Newer posts

Older posts