Source

arXiv

4531 posts from this source

정렬:

2개월 전 · ai · - · -

[Paper] 투사된 노이즈를 이용한 라그랑주 동역학의 암시적 정규화에 관하여

우리는 등거리 군 작용에 수직인 방향으로 투사된 잡음이 포함된 Langevin dynamics를 연구한다. 이 수학적 모델은 새로운 통찰을 제공하기 위해 도입되었다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] '죄송합니다, 못 들었어요': Speech Models가 가장 중요한 것을 놓치는 이유

표준 벤치마크에서 낮은 word error rates를 달성한 speech recognition systems라도, 실제 배포 환경에서 짧고 high-stakes utterances에 대해서는 종종 실패한다.

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] Olmix: LM 개발 전반에 걸친 데이터 믹싱 프레임워크

데이터 믹싱 — 서로 다른 도메인의 데이터를 어떤 비율로 섞을지 결정하는 것 — 은 언어 모델(LMs) 훈련에서 일차적인 관심사이다. 기존의 믹싱 방법...

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] On-Policy SFT를 향하여: Distribution Discriminant Theory 및 LLM Training에서의 응용

Supervised fine-tuning (SFT)은 계산 효율성이 높지만 강화 학습(RL)에 비해 일반화 성능이 종종 떨어집니다. 이 차이는 주로…

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] Visual Reasoning Benchmark: 초등 교육 교실 실제 시각 문제에 대한 Multimodal LLMs 평가

AI 모델은 textual reasoning에서 state-of-the-art 결과를 달성했지만, spatial 및 relational structures에 대한 추론 능력은 여전히 중요한 문제로 남아 있다.

#research #paper #ai #machine-learning #nlp
2개월 전 · software · - · -

[Paper] Large Language Models를 활용한 IoT 네트워크의 알 수 없는 공격 탐지: 견고하고 데이터 효율적인 접근법

사이버 공격의 급속한 진화는 알려지지 않은 (zero-day) 위협의 등장을 지속적으로 촉진하고 있으며, 이는 네트워크 침입 탐지에 상당한 도전을 제기합니다.

#research #paper #software
2개월 전 · ai · - · -

[Paper] TexSpot: 공간적으로 균일한 Point Latent Representation을 이용한 3D Texture 향상

고품질 3D 텍스처 생성은 현재 주류 멀티‑뷰 디퓨전 파이프라인에 내재된 뷰‑불일치(view‑inconsistency) 때문에 근본적인 과제로 남아 있습니다. ...

#research #paper #ai #computer-vision
2개월 전 · devops · - · -

[Paper] OServe: 공간-시간 워크로드 오케스트레이션을 통한 LLM 서빙 가속화

Large Language Models (LLMs)를 서비스하는 것은 모델과 입력 요청을 여러 장치에 걸쳐 병렬 처리함으로써 엄청난 이점을 얻을 수 있지만, 들어오는 워크로드는 …

#research #paper #devops
2개월 전 · ai · - · -

[Paper] 오픈소스 Android 및 iOS 개발에서 AI 코딩 에이전트 채택에 관하여

AI coding agents는 소프트웨어 개발에 점점 더 기여하고 있지만, 모바일 개발에 대한 그들의 영향은 실증적인 주목을 거의 받지 못했습니다. 이 ...

#research #paper #ai #machine-learning
2개월 전 · software · - · -

[Paper] PPTAM$η$: 에너지 인식 CI/CD 파이프라인, 컨테이너 기반 애플리케이션을 위한

현대의 컨테이너 기반 마이크로서비스는 빠른 배포 사이클을 통해 진화하지만, CI/CD 파이프라인은 여전히 에너지 소비를 측정하는 경우가 거의 없습니다, 비록 이전 연구가…

#research #paper #software
2개월 전 · software · - · -

[Paper] 성능 안티패턴: 전력 소비에 대한 천사인가 악마인가?

Performance antipatterns는 microservice-based systems의 응답성을 저하시킨다는 것이 알려져 있지만, energy consumption에 대한 영향은 아직 크게 탐구되지 않았습니다.

#research #paper #software
2개월 전 · ai · - · -

[Paper] PrefillShare: 다중 LLM 분산 서비스에서 KV 재사용을 위한 공유 Prefill 모듈

Multi-agent systems는 복잡한 현실 세계 문제를 해결하기 위해 여러 전문화된 language models를 점점 더 조정하고 있으며, 종종 이를 shared context에서 호출합니다.

#research #paper #ai #machine-learning
2개월 전 · software · - · -

[Paper] 수동 및 자동 코드 리뷰를 통해 권장된 품질 향상 연구

여러 Deep Learning (DL) 기반 기술이 코드 리뷰를 자동화하기 위해 제안되었습니다. 그러나 이러한 접근 방식이 어느 정도까지 추천할 수 있는지는 아직 명확하지 않습니다…

#research #paper #software
2개월 전 · software · - · -

[Paper] Small Language Model-as-a-judge를 통한 코드 생성 개선

대형 언어 모델(LLMs)은 자동 코드 생성에서 놀라운 능력을 보여주었습니다. 주류 언어에 대해서는 효과적이지만, 그들은 ...에 대해 성능이 떨어질 수 있습니다.

#research #paper #software
2개월 전 · ai · - · -

[Paper] MUSE: 멀티테넌트 모델 서빙과 원활한 모델 업데이트

이진 분류 시스템에서 decision thresholds는 model scores를 행동으로 변환합니다. 적절한 thresholds를 선택하는 것은 t의 특정 분포에 의존합니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] LoRA 기반 파라미터 효율적인 LLM을 이용한 엣지 기반 악성코드 탐지의 지속 학습

에지 디바이스의 급증으로 인해 실시간으로 악성코드를 탐지하면서 엄격한 컴퓨...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] Predictive Associative Memory: 유사성을 넘어선 검색, 시간적 동시 발생을 통해

현재 신경 시스템에서 메모리에 대한 현재 접근 방식은 similarity-based retrieval에 의존한다: query가 주어지면 가장 representationally similar한 stored state를 찾는다. This as...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] SurfPhase: 희소 비디오에서 얻은 2상 흐름의 3D 계면 역학

두 상 흐름에서의 계면 역학은 운동량, 열, 그리고 물질 전달을 지배하지만, 실험적으로 측정하기는 여전히 어렵습니다. 고전적인 기법들은 침입성…

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] YOR: 당신만의 모바일 매니퓰레이터 for Generalizable Robotics

최근 robot learning의 최근 발전은 인간 수준의 역량에 접근할 수 있는 유능한 플랫폼에 대한 큰 관심을 불러일으켰습니다. 이러한 관심은 …

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] SCRAPL: 머신러닝을 위한 랜덤 경로 기반 Scattering Transform

wavelet scattering transform 계수(경로라고도 함) 사이의 Euclidean distance는 perceptual quality assessment를 위한 informative gradients를 제공합니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[논문] GENIUS: 생성형 유동 지능 평가 스위트

Unified Multimodal Models (UMMs)는 시각 생성에서 눈에 띄는 진전을 보여주었습니다. 그러나 기존 벤치마크는 주로 Crystallized Intelligence를 평가하며, w...

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] LCIP: 손실 제어 역투영을 통한 고차원 이미지 데이터

Projections (또는 dimensionality reduction) 방법 P는 고차원 데이터를 일반적으로 2D scatterplots으로 매핑하여 visual exploration을 목표로 합니다. Inverse projection 메...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] TabICLv2: 더 나은, 더 빠른, 확장 가능한, 그리고 오픈된 테이블형 파운데이션 모델

Tabular foundation models(예: TabPFNv2 및 TabICL)는 최근 예측 벤치마크에서 gradient-boosted trees를 제치고 최고 자리를 차지했으며, 그 가치를 입증하고 있습니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] Weight Decay가 Language Model의 Plasticity를 향상시킨다

대형 언어 모델(LLM) 개발에서 지배적인 패러다임은 베이스 모델을 사전 학습(pretrain)한 뒤, 성능과 모델을 개선하기 위해 추가 학습을 수행하는 것입니다.

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] Just on Time: 토큰 수준 조기 중단 for Diffusion Language Models

Diffusion 언어 모델은 텍스트를 반복적인 정제 과정을 통해 생성합니다. 이 과정은 많은 토큰이 안정 상태에 도달하기 전까지 여러 번 업데이트가 필요하기 때문에 계산 효율성이 낮은 경우가 많습니다. 기존 방법에서는 각 토큰이 완전히 수렴할 때까지 여러 단계의 디퓨전 과정을 거치며, 이는 전체 생성 시간과 비용을 크게 증가시킵니다. 최근 연구들은 이러한 비효율성을 완화하기 위해 토큰 수준에서의 동적 스케줄링, 조기 종료 전략, 그리고 부분적인 샘플링 기법을 도입하고 있습니다. 예를 들어, 토큰이 일정 기준 이상의 확신도를 보이면 해당 토큰에 대한 추가 디퓨전 단계를 건너뛰고, 남은 불확실한 토큰에만 집중하는 방식이 제안되었습니다. 또한, 모델이 학습 단계에서 다양한 노이즈 레벨에 대한 복원 능력을 동시에 습득하도록 설계함으로써, 추론 시에 한 번의 전방 패스로 여러 디퓨전 단계의 효과를 모방할 수 있는 방법도 연구되고 있습니다. 이러한 접근법들은 전통적인 디퓨전 기반 텍스트 생성의 계산 복잡성을 크게 낮추면서도, 품질 면에서는 기존 방법과 비슷하거나 더 나은 성능을 보이는 결과를 보여주고 있습니다.

#research #paper #ai #machine-learning #nlp
2개월 전 · devops · - · -

[Paper] Min‑Sum 균일 커버리지 문제 by 자율 모바일 로봇

우리는 주어진 유한한 선분과 유한한 양의 반지름을 갖는 원 위에 있는 n개의 모바일 로봇 군집에 대한 min-sum uniform coverage problem을 연구한다, 여기서...

#research #paper #devops
2개월 전 · ai · - · -

[Paper] PhyCritic: Physical AI를 위한 멀티모달 Critic 모델

대규모 멀티모달 모델의 급속한 발전과 함께, 신뢰할 수 있는 judge 및 critic 모델은 개방형 평가와 preference alignment에 필수적이 되었습니다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 크로스 도메인 에이전틱 워크플로우 생성을 위한 구성 학습

자동으로 에이전트 워크플로우를 생성하는 것—추론, 검증 및 수리를 조정하는 실행 가능한 연산자 그래프 또는 코드—은 실용적인…

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] TEGRA: 텍스트 인코딩과 그래프 및 검색 보강을 통한 허위정보 탐지

Misinformation detection은 외부 지식의 통합으로부터 크게 이익을 얻을 수 있는 중요한 작업이며, 이는 manual fact‑checking과 매우 유사합니다. In this w...

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] Reasoning Models에서의 Safety Recovery는 몇 단계의 초기 Steering만으로도 가능

명시적 체인오브생각(예: GRPO)을 위한 강화학습(RL) 기반 사후 학습은 멀티모달 대규모 추론 모델의 추론 능력을 향상시킨다.

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] 생체 보행 인식을 위한 제1회 국제 StepUP 대회: 방법, 결과 및 남은 과제

Biometric footstep recognition은 걷는 동안 발 아래에 나타나는 사람 고유의 압력 패턴을 기반으로 하는 생체인식 기술로, 응용 분야가 확대되고 있는 신흥 분야입니다.

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] SteuerLLM: 독일 세법 분석을 위한 지역 특화 대규모 언어 모델

대규모 언어 모델(LLMs)은 강력한 일반 추론 및 언어 이해를 보여주지만, 그들의 성능은 엄격한 형태…

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] PuriLight: 단일 카메라 깊이 추정을 위한 경량 셔플 및 정화 프레임워크

우리는 경량이면서 효율적인 프레임워크인 PuriLight를 제안한다. 이는 self-supervised monocular depth estimation을 위한 것으로, 계산 효율성의 이중 과제에 대응한다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 다중 작업 진화 정책 탐색을 위한 인터랙티브 LLM 지원 커리큘럼 학습

Multi-task policy search는 정책이 훈련 사례를 넘어 일반화해야 하기 때문에 어려운 문제입니다. Curriculum learning은 효과적인 것으로 입증되었습니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 고품질 소프트웨어 생성을 위해 LLM을 효과적으로 통합하는 프레임워크

최근 연구에 따르면, LLM을 적절히 프롬프트하고 구성하면 혼합된 결과를 보여줍니다. 이러한 결과는 종종 기준을 충족하거나 초과합니다...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] VulReaD: 지식 그래프 기반 소프트웨어 취약점 추론 및 탐지

소프트웨어 취약점 탐지(SVD)는 현대 시스템에서 중요한 과제입니다. 대형 언어 모델(LLMs)은 자연어 설명을 제공하면서 사전...

#research #paper #ai #machine-learning
2개월 전 · software · - · -

[Paper] LLMware 생태계의 숨겨진 라이선스 위험

대규모 언어 모델(LLMs)은 소프트웨어 시스템에 점점 더 통합되고 있으며, 이를 통해 LLMware라고 불리는 새로운 유형의 시스템이 등장하고 있습니다. 전통적인…

#research #paper #software
2개월 전 · ai · - · -

[Paper] ISD-Agent-Bench: LLM 기반 인스트럭셔널 디자인 에이전트 평가를 위한 포괄적인 벤치마크

대규모 언어 모델(LLM) 에이전트는 교육 개발에 대한 체계적인 접근법인 교육 시스템 설계(ISD)를 자동화하는 데 유망한 잠재력을 보여주었습니다.

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] MindPilot: EEG-guided Diffusion을 이용한 뇌 변조를 위한 Closed-loop 시각 자극 최적화

대다수의 뇌‑컴퓨터 인터페이스 연구가 신경 신호를 행동이나 의도로 해독하는 데 초점을 맞춘 반면, 반대 과제인 제어된 자극을 사용하여…

#research #paper #ai
2개월 전 · ai · - · -

[Paper] 계층적 응집 군집화를 위한 Chamfer-Linkage

Hierarchical Agglomerative Clustering (HAC)은 가장 가까운 클러스터 쌍을 반복적으로 병합하는 방식에 기반한 널리 사용되는 클러스터링 방법으로, 클러스터 간 거리…

#research #paper #ai #machine-learning
2개월 전 · devops · - · -

[Paper] 네트워크 아키텍처에 대한 Global Distributed Protocols의 구현 가능성

글로벌 프로토콜은 분산된 메시지‑패싱 프로토콜을 조감도에서 지정하며, 로컬 구현을 합성하기 위한 사양으로 사용됩니다. I...

#research #paper #devops
2개월 전 · devops · - · -

[Paper] AMD MI300A에서 FP8 매트릭스 코어, 비동기 실행 및 구조적 희소성에 대한 실행 중심 특성화

AMD MI300A APU는 CDNA3 GPU와 고대역폭 메모리, 그리고 고급 가속기 기능을 통합합니다: FP8 매트릭스 코어, 비동기 컴퓨트 엔진(ACE), 그리고...

#research #paper #devops
2개월 전 · ai · - · -

[Paper] KORAL: Knowledge Graph 기반 LLM 추론을 이용한 SSD 운영 분석

Solid State Drives (SSDs)는 데이터센터, 소비자 플랫폼 및 미션 크리티컬 시스템에 필수적입니다. 그러나 그들의 성능과 신뢰성을 진단하는 것은 dif...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] ImprovEvolve: AlphaEvolve에 입력 솔루션을 개선하도록 요청하고 즉흥 연주

LLM 기반 진화 계산의 최근 발전, 특히 AlphaEvolve는 새로운 수학적 구조를 발견하는 데 놀라운 성공을 보여주었습니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 맹점에서의 편향: LLM이 언급하지 못하는 것을 탐지하기

대형 언어 모델(LLMs)은 종종 설득력 있게 보이는 사고 흐름(chain-of-thought, CoT) 추론 흔적을 제공하지만, 내부 편향을 숨길 수 있습니다. 우리는 이를 *unverbali...

#bias detection #large language models #machine learning research #fairness #explainability
2개월 전 · ai · - · -

[Paper] SAGE: 스케일러블 에이전틱 3D 씬 생성 for Embodied AI

실제 세계에서 embodied agents를 위한 데이터 수집은 비용이 많이 들고 위험하기 때문에 확장 가능하고 현실적이며 simulator-ready 3D environments가 필요합니다. 그러나 기존…

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 양자 다중 회전 평균화

Multiple rotation averaging (MRA)는 3D 비전 및 로보틱스 분야에서 전역적으로 일관된 절대 회전을 복구하는 것을 목표로 하는 기본적인 최적화 문제입니다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] Olaf-World: 비디오 세계 모델링을 위한 잠재 행동 정렬

액션 라벨의 부족으로 인해 action-controllable world models의 확장이 제한됩니다. latent action learning은 제어 인터페이스를 u...

#research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts