computer-vision — Page 41

1개월 전 · ai

[Paper] CaFlow: 장기 행동 품질 평가 향상을 위한 Causal Counterfactual Flow

Action Quality Assessment (AQA)는 행동 비디오에서 세밀한 실행 점수를 예측하며, 스포츠, 재활 및 기술 평가에 널리 적용됩니다....

#action-quality-assessment #causal-inference #video-analysis #computer-vision #long-term-temporal-modeling
1개월 전 · ai

[Paper] Vision Transformers에서 비단조 스케일링 메커니즘

Deeper Vision Transformers는 종종 얕은 모델보다 성능이 떨어지며, 이는 일반적인 스케일링 가정에 도전합니다. ViT-...에 대한 체계적인 실증 분석을 통해 이를 조사합니다.

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai

[Paper] Qwen3-VL 기술 보고서

우리는 Qwen 시리즈 중 현재까지 가장 뛰어난 비전‑언어 모델인 Qwen3‑VL을 소개합니다. 이 모델은 다양한 멀티모달 벤치마크 전반에 걸쳐 우수한 성능을 달성합니다.

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai

[Paper] GCN 기반 행동 인식을 위한 능동 학습

그래프 컨볼루션 네트워크(GCNs)가 스켈레톤 기반 행동 인식에서 눈에 띄는 성공을 거두었음에도 불구하고, 그 성능은 종종 대규모 실험실...

#active learning #graph convolutional networks #action recognition #skeleton-based vision #computer vision
1개월 전 · ai

[Paper] ReSAM: 정제, 재조회, 그리고 강화: 원격 감지 이미지를 위한 자체 프롬프트 포인트‑감독 세분화

Interactive segmentation models such as the Segment Anything Model (SAM) have demonstrated remarkable generalization on natural images, but perform suboptimally...

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] MoGAN: 몇 단계 모션 적대적 사후 훈련을 통한 비디오 확산에서 모션 품질 향상

Video diffusion models achieve strong frame-level fidelity but still struggle with motion coherence, dynamics and realism, often producing jitter, ghosting, or ... 비디오 확산 모델은 프레임 수준에서 높은 충실도를 달성하지만, 움직임 일관성, 역동성 및 현실감에서는 여전히 어려움을 겪으며, 흔히 흔들림, 유령 현상 등을 발생시킵니다.

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] 다중모달 강인 프롬프트 증류 for 3D 포인트 클라우드 모델

적대적 공격은 학습 기반 3D 포인트 클라우드 모델에 중대한 위협을 가하며, 보안에 민감한 응용 분야에서 그 신뢰성을 심각하게 저해합니다.

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai

[Paper] UAVLight: 무인 항공기(UAV) 장면에서 조명 강인성 3D 재구성을 위한 벤치마크

Illumination inconsistency는 다중 뷰 3D 재구성에서 근본적인 도전 과제입니다. 햇빛 방향, 구름 양, 그리고 그림자의 변동은 일관성을 깨뜨립니다.

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] 비디오 생성 모델은 좋은 잠재 보상 모델이다

Reward feedback learning (ReFL)은 인간 선호에 맞춰 이미지 생성을 정렬하는 데 효과적인 것으로 입증되었습니다. 그러나 비디오 생성으로 확장하는 데는 ...

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] Bangla Sign Language Translation: 데이터셋 생성 과제, 벤치마킹 및 전망

Bangla Sign Language Translation (BdSLT)은 언어 자체가 매우 low-resource이기 때문에 지금까지 크게 제한되어 왔습니다. Standard sentence level dataset을 만들…

#sign-language #dataset #translation #computer-vision #benchmark
1개월 전 · ai

[Paper] 비균일 시간 간격에서 특성 제약을 이용한 연령별 알츠하이머병 예측

Alzheimer’s disease는 인지 기능 저하를 특징으로 하는 쇠약해지는 질환입니다. 질병을 시기 적절하게 식별하는 것은 ...

#research #paper #ai #computer-vision
1개월 전 · ai

[Paper] EoS-FM: 전문가 모델들의 앙상블이 범용 특징 추출기로 작동할 수 있을까?

최근 파운데이션 모델의 발전은 자연어 처리와 컴퓨터 비전과 같은 분야에서 큰 가능성을 보여주었으며, 유사한 노력들이 이제 …

#ensemble learning #remote sensing #foundation models #computer vision #sustainability

Newer posts

Older posts