Source

arXiv

4538 posts from this source

정렬:

3개월 전 · software · - · -

[Paper] 실제 Java 프로젝트에서 취약한 의존성의 숨겨진 포함 관계 밝히기

오픈소스 소프트웨어(OSS) 의존성은 현대 소프트웨어 코드베이스의 지배적인 구성 요소입니다. 검증되고 충분히 테스트된 OSS 구성 요소를 사용하면 개발자들이 redu...

#research #paper #software
3개월 전 · software · - · -

[Paper] SolAgent: Solidity 코드 생성을 위한 특화된 다중 에이전트 프레임워크

스마트 계약은 탈중앙화 웹의 핵심이지만, 그 기능적 정확성과 보안을 보장하는 것은 여전히 중요한 과제입니다. While Large Lang...

#research #paper #software
3개월 전 · ai · - · -

[Paper] TriCEGAR: 트레이스 기반 추상화 메커니즘 for Agentic AI

Agentic AI 시스템은 도구를 통해 작동하고, 길고 확률적인 상호작용 트레이스를 따라 행동을 진화시킵니다. 이러한 설정은 행동이 …

#research #paper #ai #machine-learning
3개월 전 · devops · - · -

[Paper] ERA: 에포크 기반 중재를 통한 그룹 관리 CRDT에서의 경쟁 관리자

Conflict-Free Replicated Data Types (CRDTs)는 강력한 최종 일관성을 보장하는 조정 없는 복제로 인해 다양한 분야에서 사용됩니다. By prioritis...

#research #paper #devops
3개월 전 · ai · - · -

[Paper] AscendCraft: DSL 가이드 트랜스컴파일을 통한 자동 Ascend NPU 커널 생성

딥러닝 모델의 성능은 효율적인 커널 구현에 크게 좌우되지만, 특수 가속기에 대한 고성능 커널을 개발하는 것은 ...

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] SQUAD: 확장 가능한 쿼럼 적응형 의사결정, early exit neural networks 앙상블을 통해

Early-exit neural networks는 충분한 confidence가 달성될 때 intermediate predictions를 허용함으로써 inference latency를 줄이는 데 인기를 얻고 있습니다. Howev...

#research #paper #ai #machine-learning #computer-vision
3개월 전 · devops · - · -

[Paper] CONCUR: 혼잡 기반 동시성 제어를 통한 LLM의 고처리량 에이전트형 배치 추론

Batch inference는 agentic workloads에 대해 GPU key-value (KV) cache를 지속적이고 누적적으로 압박하여, 종종 심각한 throughput 저하를 일으킵니다.

#research #paper #devops
3개월 전 · ai · - · -

[Paper] COBRA++: 증강된 Surrogate Pool 및 강화된 Surrogate Selection을 통한 향상된 COBRA Optimizer

현실 세계의 최적화 문제는 비용이 많이 드는 평가 문제와 복잡한 제약조건 등 최적화 알고리즘에 상당한 도전을 제시합니다.

#research #paper #ai
3개월 전 · ai · - · -

[Paper] HetCCL: 이기종 GPU를 활용한 LLM 학습 가속화

대규모 언어 모델의 급속한 성장으로 인해 조직들은 종종 여러 공급업체의 GPU를 사용하여 GPU 클러스터를 확장하고 있습니다. 그러나 현재의 딥…

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[논문] 감지하고 행동하기: Automated Dynamic Optimizer through Meta-Black-Box Optimization

Dynamic Optimization Problems (DOPs)는 복잡한 특성, 즉 동적 환경 변화 때문에 해결하기 어렵습니다. Evolutionary Computation 방법…

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] 다당사자 다목적 최적화를 위한 공정성 인식 성능 평가

다당사자 다목적 최적화 문제에서는 솔루션 집합을 일반적으로 클래식 성능 지표를 사용하여 평가하고, 의사결정자(DM)들에 걸쳐 집계합니다. 그러나, ...

#research #paper #ai
3개월 전 · devops · - · -

[Paper] Power Grid Frequency Regulation Service와 Data Center Load Flexibility 연계

AI/ML 데이터 센터 성장으로 인해 에너지 소비와 탄소 배출이 증가했습니다. 재생 에너지로의 전환과 증가하는 데이터 센터 에너지 수요는 ...

#research #paper #devops
3개월 전 · ai · - · -

[Paper] AsyncMesh: 데이터 및 파이프라인 병렬성을 위한 완전 비동기 최적화

Data 및 pipeline parallelism은 분산 장치에서 신경망 훈련을 확장하기 위한 핵심 전략이지만, 높은 통신 비용 때문에 ...

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] 대규모 언어 모델 서빙의 탄력성을 위한 KevlarFlow

대규모 언어 모델(LLM) 서빙 시스템은 근본적으로 취약한 상태를 유지하고 있으며, 하이퍼스케일 클러스터에서 빈번한 하드웨어 결함이 서비스에 불균형적인 영향을 초래합니다...

#research #paper #ai #machine-learning #nlp
3개월 전 · ai · - · -

[Paper] SAIR: 비용 효율적인 다단계 ML 파이프라인 자동 스케일링 via In-Context Reinforcement Learning

Multi-stage ML inference pipelines는 이기종 리소스, 단계 간 결합, 그리고 동적 병목 현상 마이그레이션 때문에 자동 확장이 어렵습니다. 우리는 제시합니다…

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] 인간 지식 없이 증명 가능한 분산 프로토콜 학습

증명 가능한 올바른 분산 프로토콜은 현대 분산 시스템의 핵심 구성 요소이며, 설계가 매우 어렵고 종종 d...

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] 파라미터화와 옵티마이저의 상호작용 조사: Gradient-Free 토폴로지 최적화, 캔틸레버 빔 사례 연구

Gradient-free black-box optimization (BBO)은 엔지니어링 설계에서 널리 사용되며, 토폴로지 최적화 (TO)를 위한 유연한 프레임워크를 제공하여 d...

#research #paper #ai
3개월 전 · ai · - · -

[Paper] RedSage: 사이버보안 제너럴리스트 LLM

사이버 보안 운영은 민감한 데이터를 노출하지 않으면서 다양한 워크플로를 지원하는 어시스턴트 LLM을 필요로 합니다. 기존 솔루션은 독점 API에 의존하거나…

#research #paper #ai #machine-learning #nlp
3개월 전 · ai · - · -

[Paper] 원스텝 Latent-free 이미지 생성 with Pixel Mean Flows

현대 diffusion/flow 기반 이미지 생성 모델은 일반적으로 두 가지 핵심 특성을 보인다: (i) 다단계 샘플링을 사용하고, (ii) 잠재…

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 모델 레포지토리에서 숨은 보석 찾기

공개 저장소에는 수백만 개의 fine-tuned models가 호스팅되고 있지만, 커뮤니티 사용은 여전히 소수의 foundation checkpoints에 불균형적으로 집중되어 있습니다....

#research #paper #ai #machine-learning #nlp
3개월 전 · ai · - · -

[Paper] 에이전트를 위한 Reasoning Reward Model 탐구

Agentic Reinforcement Learning (Agentic RL)은 에이전트가 복잡한 추론과 도구 사용을 수행하도록 하는 데 눈에 띄는 성공을 거두었습니다. 그러나 대부분의 방법은 아직...

#research #paper #ai #machine-learning #nlp
3개월 전 · ai · - · -

[Paper] UEval: 통합 멀티모달 생성 벤치마크

우리는 UEval이라는 벤치마크를 도입합니다. 이는 이미지와 텍스트를 모두 생성할 수 있는 통합 모델을 평가하기 위한 것입니다. UEval은 1,000개의 전문가가 선정한 질문으로 구성됩니다.

#research #paper #ai #nlp #computer-vision
3개월 전 · ai · - · -

[Paper] DynamicVLA: 동적 객체 조작을 위한 Vision-Language-Action 모델

동적 객체를 조작하는 것은 Vision-Language-Action (VLA) 모델에게 여전히 해결되지 않은 과제이며, 정적 조작에서 강력한 일반화 능력을 보임에도 불구하고, str...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 최신 발표 결과: 엣지 컴퓨팅을 위한 신경망을 논리 흐름으로 변환

Neural networks는 일반적으로 그래픽 처리 장치(GPUs) 대신 중앙 처리 장치(CPUs)를 사용하는 다양한 자원 제한 엣지 디바이스에 성공적으로 적용되었습니다.

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] VLMs는 인지하는가, 기억하는가? 고전 시각 착시를 통한 시각 인지와 기억 탐구

대형 비전-언어 모델(VLMs)은 원본 이미지에서 고전적인 시각 착시 현상에 대해 ‘정확하게’ 답변하는 경우가 많지만, 착시 현상의 사실이...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] DynaWeb: 모델 기반 강화 학습을 이용한 웹 에이전트

대규모 언어 모델(LLMs)과 강화 학습(RL)으로 구동되는 자율 웹 에이전트의 개발은 일반…

#research #paper #ai #machine-learning #nlp
3개월 전 · ai · - · -

[Paper] FineInstructions: 합성 지시문을 사전 학습 규모로 확장

제한된 감독 학습 데이터 때문에, 대규모 언어 모델(LLMs)은 일반적으로 자체 감독 “다음 단어 예측” 목표를 사용하여 vas...

#research #paper #ai #machine-learning #nlp
3개월 전 · ai · - · -

[Paper] JUST-DUB-IT: Joint Audio-Visual Diffusion을 통한 비디오 더빙

Audio-Visual Foundation Models는 사운드와 시각 콘텐츠를 공동으로 생성하도록 사전 학습된 모델로, 최근 다중‑...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] Routing the Lottery: 이질적 데이터에 대한 적응형 서브네트워크

프루닝에서, Lottery Ticket Hypothesis는 큰 네트워크가 희소 서브네트워크, 즉 winning tickets를 포함하고 있으며, 이들은 별도로 훈련되어 t...와 일치하도록 할 수 있다고 제시한다.

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[Paper] 질문하면서 추론하기: 추론 Large Language Models를 수동적 해결자에서 능동적 탐구자로 전환

추론 지향 대형 언어 모델(LLMs)은 Chain-of-Thought (CoT) 프롬프트를 통해 눈부신 진전을 이루었지만, 여전히 근본적인 한계가 있다.

#research #paper #ai #machine-learning #nlp
3개월 전 · ai · - · -

[Paper] PRISM: 분포 자유 적응형 행렬 함수 계산을 통한 신경망 학습 가속화

행렬 함수인 제곱근, 역제곱근, 그리고 직교화는 신경망 훈련을 위한 사전조건화된 gradient methods에서 핵심적인 역할을 합니다.

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] StepShield: 언제, Rogue Agents에 개입할지 여부가 아니라 개입 시점

기존 에이전트 안전 벤치마크는 binary accuracy를 보고하며, early intervention과 post-mortem analysis를 혼동합니다. step 8에서 violation을 표시하는 detector는 …

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[논문] PI-Light: Physics-Inspired Diffusion for Full-Image Relighting

Full-image relighting은 대규모 구조화된 paired data를 수집하기 어려운 점과 물리적 … 때문에 여전히 도전적인 문제로 남아 있다.

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] Computed Tomography를 통한 췌장암의 조기 및 진단 전 탐지

Pancreatic ductal adenocarcinoma (PDAC), 가장 치명적인 고형 악성 종양 중 하나로, 종종 늦은 단계에서 수술이 불가능한 상태로 발견됩니다. 선행 연구들의 회고적 검토는 …

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 힌트에만 비용을, 답은 무료: 비용 효율적인 추론을 위한 LLM Shepherding

대형 언어 모델(LLMs)은 복잡한 추론 작업에서 최첨단(state-of-the-art) 성능을 제공하지만, 추론(inference) 비용 때문에 대규모 배포가 제한됩니다. 작은 언어…

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] SMOG: 확장 가능한 메타러닝을 위한 다목적 베이지안 최적화

Multi-objective optimization은 경쟁하는 목표들을 가진 문제들을 해결하는 것을 목표로 하며, 종종 문제에 대한 black-box 접근만 가능하고 제한된 측정 예산을 가지고 있다.

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] SWE-Replay: 소프트웨어 엔지니어링 에이전트를 위한 효율적인 테스트 시 스케일링

Test-time scaling은 소프트웨어 엔지니어링(SWE) 작업에서 Large Language Model(LLM) 에이전트의 능력을 향상시키기 위해 널리 채택되었습니다. 그러나, the sta...

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] EditYourself: 오디오 기반 Talking Head 비디오의 생성 및 조작 with Diffusion Transformers

현재 generative video models는 text and image prompts로부터 새로운 콘텐츠를 생성하는 데 뛰어나지만, 기존 pre-recorded videos를 편집하는 데 중요한 격차를 남겨두고 있습니다, ...

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[Paper] 창의적인 이미지 생성 with Diffusion Model

Creative image generation은 새로운 고품질 이미지를 생산하고 경계를 확장하려는 필요에 의해 주도되는 매력적인 연구 분야로 부상했습니다.

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 의학에서 대형 언어 모델 학습을 위한 연합 및 파라미터 효율적인 프레임워크

대형 언어 모델(LLMs)은 질문 응답 및 진단을 포함한 의료 벤치마크에서 강력한 성능을 입증했습니다. 임상에서의 활용을 가능하게 하기 위해…

#research #paper #ai #nlp
3개월 전 · ai · - · -

[Paper] ECO: 전체 정밀 마스터 가중치 없이 양자화 훈련

Quantization은 대규모 언어 모델(Large Language Model, LLM) 훈련의 연산(compute) 및 메모리 효율성을 크게 향상시켰습니다. 그러나 기존 접근 방식은 여전히 acc…

#research #paper #ai #machine-learning #nlp
3개월 전 · ai · - · -

[Paper] 줄은 어디로 가는가? 인퍼런스 에너지 소비 진단

에너지는 이제 중요한 ML 컴퓨팅 자원입니다. 에너지 소비를 측정하고 추세를 관찰하는 것이 귀중한 첫 번째 단계이지만, 정확하게 이해하고 …

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] Lens-descriptor 기반 진화 알고리즘을 이용한 복합 광학 시스템 최적화와 유리 선택

high-performance optical lenses를 설계하는 것은 surface curvatures, glass choices, element thickness 등과 같은 고차원이며 엄격히 제한된 공간을 탐색하는 것을 포함합니다…

#research #paper #ai
3개월 전 · ai · - · -

[Paper] ‘더 나은’ 프롬프트가 해를 끼칠 때: LLM 애플리케이션을 위한 평가 기반 반복

대규모 언어 모델(Large Language Model, LLM) 애플리케이션을 평가하는 것은 전통적인 소프트웨어 테스트와 다릅니다. 왜냐하면 출력이 stochastic하고, high-dimensional하며, 민감하기 때문입니다.

#research #paper #ai #machine-learning #nlp
3개월 전 · ai · - · -

[Paper] 이기종 컴퓨팅: AI 에이전트 추론의 미래를 구동하는 핵심

AI 에이전트 추론은 추론 중심의 데이터센터 미래를 주도하고 있으며, 컴퓨팅을 넘어 메모리 용량, 메모리 대역폭 및 hig...

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] Liquid Interfaces: 자율 시스템의 상호 운용성을 위한 Dynamic Ontology

현대 소프트웨어 아키텍처는 적응형이고 확률적이며 상황에 의존적인 추론을 하는 자율 에이전트를 지원하는 데 어려움을 겪으며, 시스템 통합…

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] 다중 에이전트 액터-크리틱을 활용한 분산 LLM 협업 학습

최근 연구에서는 Multi-Agent Reinforcement Learning (MARL)을 통해 LLM 협업을 최적화하는 방법을 탐구했습니다. 그러나 대부분의 MARL 파인튜닝 접근 방식은 사전...

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] 클래식 플래닝에서 Domain Model Design의 에너지 영향

AI 연구는 전통적으로 알고리즘 성능을 우선시해 왔으며, 예를 들어 머신 러닝에서 정확도를 최적화하거나 자동 계획에서 실행 시간을 최적화하는 것이 포함됩니다. 떠오르는...

#research #paper #ai #machine-learning

Newer posts

Older posts