Source

arXiv

4670 posts from this source

정렬:

5개월 전 · ai · - · -

[Paper] 에지에서 프라이버시를 보존하는 낙상 감지: Sony IMX636 이벤트 기반 비전 센서와 Intel Loihi 2 neuromorphic processor 이용

비침습적인 비전 기반 시스템을 이용한 노인 돌봄을 위한 낙상 감지는 여전히 중요한 미해결 문제입니다. 엄격한 프라이버시 요구사항에 의해, ...

#research #paper #ai
5개월 전 · ai · - · -

[Paper] 다른 위상의 random reservoirs가 다양한 degrees of freedom를 가진 nonlinear dynamical systems에 대한 예측 성능

Reservoir computing (RC)은 비선형 동역학 시스템을 예측하기 위한 강력한 프레임워크이지만, 레저버 토폴로지—특히 연결의 대칭성—의 역할은 ...

#research #paper #ai
5개월 전 · ai · - · -

[Paper] 제한 없이 Equilibrium Propagation

우리는 Equilibrium Propagation (EP)을 무한소 교란의 한계에서 해방시키고, 지역 신용 할당을 위한 유한-교란 기반을 확립합니다. By...

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] 난이도 수준별 일반화 재검토: 그렇게 쉽지는 않다

우리는 대형 언어 모델(LLM)이 다양한 과제 난이도에 걸쳐 얼마나 잘 일반화되는지를 조사합니다. 이는 효과적인 데이터 선별 및 평가를 위해 핵심적인 질문입니다. E...

#research #paper #ai #machine-learning #nlp
5개월 전 · ai · - · -

[Paper] Canvas-to-Image: 구성적 이미지 생성 with 멀티모달 제어

현대 diffusion models는 고품질이고 다양한 이미지를 생성하는 데 뛰어나지만, 고충실도 구성 및 멀티모달 제어에서는 여전히 어려움을 겪는다, ...

#image generation #diffusion models #multimodal control #computer vision #research
5개월 전 · ai · - · -

[Paper] TraceGen: 3D 트레이스 공간에서의 세계 모델링은 교차 구현 비디오 학습을 가능하게 합니다

새로운 플랫폼과 새로운 장면에서 단 몇 개의 시연만으로 새로운 로봇 작업을 학습하는 것은 여전히 어려운 과제입니다. 다른 구현체—예를 들어 인간—의 비디오를 활용하면서도…

#research #paper #ai #machine-learning #computer-vision
5개월 전 · ai · - · -

[Paper] ToolOrchestra: 효율적인 모델 및 도구 오케스트레이션을 통한 지능 향상

Large language models are powerful generalists, yet solving deep and complex problems such as those of the Humanity's Last Exam (HLE) remains both conceptually ... (keep the source link unchanged) 대형 언어 모델은 강력한 제너럴리스트이지만, 인류 최후의 시험(HLE)과 같은 깊고 복잡한 문제를 해결하는 것은 개념적으로 여전히 …

#research #paper #ai #machine-learning #nlp
5개월 전 · ai · - · -

[Paper] G$^2$VLM: 기하학 기반 비전-언어 모델, 통합 3D 재구성 및 공간 추론

Vision-Language Models (VLMs)은 여전히 공간 지능에서 견고함이 부족하여 공간 이해 및 추론 작업에서 성능이 저조합니다. 우리는 ...

#research #paper #ai #machine-learning #nlp #computer-vision
5개월 전 · ai · - · -

[Paper] 매트릭스: 피어‑투‑피어 다중‑에이전트 합성 데이터 생성 프레임워크

Synthetic data has become increasingly important for training large language models, especially when real data is scarce, expensive, or privacy-sensitive. Many ...

#research #paper #ai #machine-learning #nlp
5개월 전 · ai · - · -

[Paper] 픽셀 없이 보기: 카메라 궤적에서의 인식

https://arxiv.org/abs/2405.05384 카메라 궤적—공간을 가로지르는 경로—만으로 픽셀을 보지 않고도 영상의 내용을 인식할 수 있을까? 이 논문은 이러한 질문에 처음으로 체계적인 접근을 시도한다. 우리는 카메라가 이동하면서 기록한 3차원 궤적 정보만을 이용해, 해당 영상이 어떤 장면을 담고 있는지, 어떤 동작이 일어나고 있는지를 추론한다. 이를 위해 새로운 데이터셋을 구축하고, 궤적 기반의 특징 추출 및 시퀀스 모델링 기법을 제안한다. 실험 결과, 제안된 방법은 기존 영상 기반 모델에 비해 픽셀 정보를 전혀 사용하지 않음에도 불구하고 의미 있는 수준의 인식 성능을 달성한다. 이 연구는 비전 시스템이 시각적 입력이 제한된 상황에서도 공간적 움직임 정보를 활용할 수 있음을 보여준다.

#research #paper #ai #computer-vision
5개월 전 · ai · - · -

[Paper] 에이전시 학습자와 Grow-and-Refine 다중모달 의미 메모리

MLLMs는 개별 질의에 대해 강력한 추론 능력을 보여주지만, de novo 방식으로 작동하여 각 문제를 독립적으로 해결하고 종종 같은 실수를 반복합니다. Existi...

#multimodal memory #lifelong learning #large multimodal models #semantic memory #AI reasoning
5개월 전 · ai · - · -

[Paper] 간섭 하에서 실험을 위한 진화 기반 모델

네트워크 시스템에서 인과 효과 추정은 데이터 기반 의사결정의 핵심입니다. 이러한 환경에서는 한 단위에 대한 개입이 다른 단위로 파급될 수 있으며, 이는 ...

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] 대규모 희소 네트워크에서 이벤트 기반 적격성 전파: 생물학적 현실성에 의해 형성된 효율성

놀라운 기술적 진보에도 불구하고, AI 시스템은 여전히 재발 연결성(recurrent connectivity) 및 에너지 효율적인 메커니즘(energy‑efficient mechanisms)과 같은 생물학적 원리로부터 혜택을 받을 수 있다...

#spiking neural networks #eligibility propagation #event-driven learning #computational neuroscience #bio-inspired AI
5개월 전 · ai · - · -

[Paper] 글리오마 분할 및 등급 매김 혁신: 3D MRI 기반 가이드 하이브리드 딥러닝 모델

Gliomas는 사망률이 높은 뇌종양 유형으로, 이는 종양에 대한 치료 개입을 위해 조기 및 정확한 진단이 중요함을 의미합니다....

#research #paper #ai #computer-vision
5개월 전 · ai · - · -

[Paper] DSD: 에지-클라우드 민첩한 대규모 모델 서빙을 위한 Distributed Speculative Decoding 솔루션

대규모 언어 모델(LLM) 추론은 종종 높은 디코딩 지연과 이질적인 엣지‑클라우드 환경 전반에 걸친 제한된 확장성으로 고통받는다. Existing spe...

#speculative decoding #LLM serving #edge‑cloud inference #distributed inference #adaptive window control
5개월 전 · ai · - · -

[Paper] 통신 렌즈를 통해: 모든 훈련 샘플이 중요한가?

통신 분야에서 AI의 부상은 라디오 액세스 네트워크 최적화부터 사용자 경험 관리에 이르기까지 데이터 양과 학습 요구를 급격히 증가시켰습니다...

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] 검증기 탈출: 시연을 통한 추론 학습

대형 언어 모델(LLMs)을 추론하도록 훈련하는 것은 종종 작업별 검증자를 이용한 강화 학습(RL)에 의존한다. 그러나 많은 실제 상황의 추론‑...

#LLM #reinforcement learning #reasoning #research paper
5개월 전 · ai · - · -

[Paper] 시각 객체 자세 추정을 위한 불확실성 정량화

객체의 자세 추정에 대한 불확실성을 정량화하는 것은 견고한 제어와 계획에 필수적입니다. 자세 추정은 로봇공학에서 잘 연구된 문제이지만…

#research #paper #ai #computer-vision
5개월 전 · ai · - · -

[Paper] Vision-Language-Action 모델에 대한 Attention-Guided Patch-Wise Sparse Adversarial Attacks

최근 몇 년간, 구현 지능 분야에서 Vision-Language-Action (VLA) 모델이 급속히 발전했습니다. 그러나 기존의 적대적 공격 방법은 비용이 많이 듭니다...

#adversarial attacks #vision-language models #embodied AI #feature-space perturbation #multimodal robustness
5개월 전 · ai · - · -

[Paper] 멀티-크리트: 다중모달 판사들의 다원적 기준 준수 벤치마킹

대형 멀티모달 모델(LMM)은 강력한 지시 수행 능력과 일관성 때문에 멀티모달 평가 시스템에서 판사 역할로 점점 더 많이 채택되고 있습니다.

#research #paper #ai #computer-vision
5개월 전 · ai · - · -

[Paper] AI/ML 모델 카드 in Edge AI 사이버인프라: Agentic AI를 향하여

AI/ML model cards는 의도된 사용에 대한 AI/ML 모델의 벤치마크된 평가를 포함할 수 있지만, 모델 훈련 중에 한 번만 수행되는 평가는 ...

#model cards #edge AI #model context protocol #dynamic evaluation #AI governance
5개월 전 · ai · - · -

[Paper] EvilGenie: 보상 해킹 벤치마크

우리는 프로그래밍 환경에서 보상 해킹을 위한 벤치마크인 EvilGenie를 소개합니다. 우리는 LiveCodeBench에서 문제를 가져와 에이전트가 사용할 수 있는 환경을 만들고...

#reward hacking #code generation #benchmark #LLM evaluation #AI safety
5개월 전 · ai · - · -

[Paper] CaFlow: 장기 행동 품질 평가 향상을 위한 Causal Counterfactual Flow

Action Quality Assessment (AQA)는 행동 비디오에서 세밀한 실행 점수를 예측하며, 스포츠, 재활 및 기술 평가에 널리 적용됩니다....

#action-quality-assessment #causal-inference #video-analysis #computer-vision #long-term-temporal-modeling
5개월 전 · ai · - · -

[Paper] 저자원 디바이스에서 지속적인 오류 교정

일상 기기에 AI models가 급증하면서 중요한 과제가 부각되었습니다: prediction errors가 사용자 경험을 저하시키는 문제입니다. 기존 existing solution은…

#continual learning #edge AI #few-shot correction #prototype classifier #mobile AI
5개월 전 · ai · - · -

[Paper] Iterative PPO를 활용한 다중 턴 대화 결과 지향 LLM 정렬

대규모 언어 모델(LLMs)을 다중 턴 대화 결과에 최적화하는 것은 특히 AI 마케팅과 같은 목표 지향적 환경에서 여전히 큰 과제입니다.

#LLM #reinforcement learning #PPO #RLHF #goal-oriented dialogue
5개월 전 · ai · - · -

[Paper] 불가피한 A Priori를 연결하기: 비교 인과 모델링을 위한 프레임워크

AI/ML 모델은 이전에 해결되지 않았던 문제들을 해결하기 위한 혁신으로 급속히 주목받고 있으며, 인간 편견을 증폭시키는 부작용도 발생하고 있다.

#causal inference #system dynamics #probabilistic modeling #python library #research
5개월 전 · ai · - · -

[Paper] Vision Transformers에서 비단조 스케일링 메커니즘

Deeper Vision Transformers는 종종 얕은 모델보다 성능이 떨어지며, 이는 일반적인 스케일링 가정에 도전합니다. ViT-...에 대한 체계적인 실증 분석을 통해 이를 조사합니다.

#research #paper #ai #machine-learning #computer-vision
5개월 전 · ai · - · -

[Paper] Qwen3-VL 기술 보고서

우리는 Qwen 시리즈 중 현재까지 가장 뛰어난 비전‑언어 모델인 Qwen3‑VL을 소개합니다. 이 모델은 다양한 멀티모달 벤치마크 전반에 걸쳐 우수한 성능을 달성합니다.

#research #paper #ai #machine-learning #computer-vision
5개월 전 · ai · - · -

[Paper] 저자는 사망했지만, 그들이 살아 있지 않았다면? 체코 AI 및 인간이 만든 시에 대한 수용 실험

대형 언어 모델은 창의적인 텍스트를 생성하는 능력이 점점 향상되고 있지만, AI‑생성 시에 대한 대부분의 연구는 영어—지배적인 언어인—에 초점을 맞추고 있습니다.

#research #paper #ai #nlp
5개월 전 · ai · - · -

[Paper] 스케일에 구애받지 않는 콜모고로프‑아놀드 기하학 in 신경망

Freedman과 Mulligan의 최근 연구에 따르면, 얕은 다층 퍼셉트론이 Kolmogorov‑Arnold 기하학적(KAG) 구조를 자발적으로 개발한다는 것이 입증되었습니다. 이는 t… 동안에 발생합니다.

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] GCN 기반 행동 인식을 위한 능동 학습

그래프 컨볼루션 네트워크(GCNs)가 스켈레톤 기반 행동 인식에서 눈에 띄는 성공을 거두었음에도 불구하고, 그 성능은 종종 대규모 실험실...

#active learning #graph convolutional networks #action recognition #skeleton-based vision #computer vision
5개월 전 · ai · - · -

[Paper] TAGFN: 텍스트 속성 그래프 데이터셋을 이용한 LLM 시대의 가짜 뉴스 탐지

대형 언어 모델(LLM)은 최근 텍스트 속성 그래프에 대한 머신러닝을 혁신했지만, LLM을 그래프 이상치 탐지에 적용하는 것은, ...

#research #paper #ai #nlp
5개월 전 · ai · - · -

[Paper] AI에서 알고리즘적 진보의 기원에 관하여

Algorithms have been estimated to increase AI training FLOP efficiency by a factor of 22,000 between 2012 and 2023 [Ho et al., 2024]. Running small-scale ablati... → 알고리즘은 2012년부터 2023년 사이에 AI 훈련 FLOP 효율성을 22,000배 향상시킨 것으로 추정됩니다 [Ho et al., 2024]. 소규모 ablati...

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] URL을 넘어: 효율적인 LLM 사전학습을 위한 메타데이터 다양성 및 위치

Large Language Models (LLMs) 사전 학습에 메타데이터를 통합하는 것이 최근 훈련을 가속화하기 위한 유망한 접근법으로 부상하고 있습니다. 그러나 이전 연구는 …

#LLM pretraining #metadata #training efficiency #research paper #large language models
5개월 전 · devops · - · -

[Paper] Diagonal Scaling: 다차원 리소스 모델 및 분산 데이터베이스를 위한 최적화 프레임워크

현대 클라우드 데이터베이스는 확장을 이진 선택으로 제시합니다: 노드를 추가하여 scale‑out하거나 노드당 리소스를 늘려 scale‑up합니다. 이 일차원적인 관점은 i...

#autoscaling #distributed databases #resource optimization #cloud-native #DIAGONALSCALE
5개월 전 · ai · - · -

[Paper] 보조 메트릭이 야생에서 스킬 뉴런 디코딩을 돕는다

대규모 언어 모델(LLM)은 다양한 작업에 걸쳐 놀라운 능력을 보여주지만, 그 내부 메커니즘은 대부분 불투명하게 남아 있다. 이 논문에서, w...

#LLM interpretability #skill neurons #auxiliary metrics #neuron probing #model debugging
5개월 전 · ai · - · -

[Paper] 정확도를 넘어: 임퓨테이션에서 불확실성 추정에 관한 실증 연구

결측 데이터 처리는 데이터 기반 분석에서 핵심적인 과제입니다. 최신 imputation 방법은 정확한 복원을 목표로 할 뿐만 아니라 ...

#imputation #uncertainty estimation #calibration #deep generative models #benchmark
5개월 전 · ai · - · -

[Paper] ReSAM: 정제, 재조회, 그리고 강화: 원격 감지 이미지를 위한 자체 프롬프트 포인트‑감독 세분화

Interactive segmentation models such as the Segment Anything Model (SAM) have demonstrated remarkable generalization on natural images, but perform suboptimally...

#research #paper #ai #computer-vision
5개월 전 · ai · - · -

[Paper] TAB-DRW: 생성형 테이블 데이터를 위한 DFT 기반 강인 워터마크

생성 AI의 부상으로 의료, 금융, 공공 정책 등 분야에서 고충실도 합성 표형 데이터의 생산이 가능해졌으며, ...

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] 차원 축소를 통한 LLM 잠재 공간 기하학 시각화

Large language models (LLMs) achieve state-of-the-art results across many natural language tasks, but their internal mechanisms remain difficult to interpret. I...

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] MoGAN: 몇 단계 모션 적대적 사후 훈련을 통한 비디오 확산에서 모션 품질 향상

Video diffusion models achieve strong frame-level fidelity but still struggle with motion coherence, dynamics and realism, often producing jitter, ghosting, or ... 비디오 확산 모델은 프레임 수준에서 높은 충실도를 달성하지만, 움직임 일관성, 역동성 및 현실감에서는 여전히 어려움을 겪으며, 흔히 흔들림, 유령 현상 등을 발생시킵니다.

#research #paper #ai #computer-vision
5개월 전 · ai · - · -

[Paper] 대형 언어 모델에서 선천적 계획의 한계에 대하여

Large language models (LLMs) achieve impressive results on many benchmarks, yet their capacity for planning and stateful reasoning remains unclear. We study the...

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] AI 기반 하이브리드 사이버-물리 프레임워크를 이용한 스마트 그리드의 적응형 제어

스마트 그리드는 고전적인 전력 인프라와 첨단 통신 네트워크 및 스마트 제어를 결합하여 사이버-물리 환경을 구축합니다.

#smart grid #cybersecurity #machine learning #cloud computing #forensic analytics
5개월 전 · ai · - · -

[Paper] 폐쇄‑루프 엔드‑투‑엔드 자율 주행을 위한 모델 기반 정책 적응

엔드‑투‑엔드(E2E) 자율주행 모델은 오픈‑루프 평가에서 강력한 성능을 보여왔지만, 종종 연쇄 오류와 일반화 부족으로 어려움을 겪는다.

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] 딥러닝 기반 구강 병변 다중 클래스 분류와 계층화 증강

구강암은 전 세계적으로 매우 흔하며, 양성, 전암성 및 악성 병변과 시각적으로 매우 유사하기 때문에 주로 후기 단계에서 진단됩니다.

#oral lesions #multiclass classification #medical imaging #data augmentation #deep learning
5개월 전 · ai · - · -

[Paper] 언제 멈출지 학습: Adaptive Latent Reasoning via Reinforcement Learning

Latent reasoning은 Transformer 언어 모델에서 새로운 개발을 의미하며, chain-of-thought에 비해 추론 길이를 압축하는 잠재력을 보여주었습니다.

#research #paper #ai #machine-learning
5개월 전 · ai · - · -

[Paper] Harmony: 오디오와 비디오 생성의 교차 작업 시너지로 조화

동기화된 오디오-비주얼 콘텐츠의 합성은 생성 AI에서 핵심 과제이며, 오픈소스 모델들은 견고한 오디오-비디오 정렬에 어려움을 겪고 있습니다.

#audio-visual generation #multimodal diffusion #cross-modal synchronization #generative AI #research
5개월 전 · ai · - · -

[Paper] HarmonicAttack: 적응형 교차 도메인 오디오 워터마크 제거

고품질 AI-generated audio의 가용성은 misinformation campaigns 및 voice-cloning fraud와 같은 보안 문제를 야기합니다. 이에 대한 핵심 방어책은 …

#audio watermarking #deep learning #adversarial attack #AI security #speech synthesis

Newer posts

Older posts