computer vision — Page 15

정렬:

3개월 전 · ai · - · -

[Paper] Meta-Learning 기반 Pruning을 활용한 Few-Shot 식물 병리학 Edge Devices 적용

원격 지역의 농부들은 plant diseases를 신속하고 신뢰할 수 있게 식별할 방법이 필요하지만, 종종 laboratories나 high‑performance computing에 접근할 수 없습니다.

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[Paper] 3D Gaussian Modeling에서 이방성 로컬 인코딩을 활용한 공동 의미 및 렌더링 향상

최근 연구들은 3DGS를 의미론적 특징 벡터와 결합하여 의미론적 분할과 이미지 렌더링을 동시에 수행하도록 확장하는 방안을 제안하고 있다. 그러나 이러한 방법들은 종종 ...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] BEDS: 베이지안 발현 소산 구조

우리는 BEDS (Bayesian Emergent Dissipative Structures)라는 이론적 프레임워크를 제시한다. 이 프레임워크는 non‑equilibrium thermodynamics와 Bayesian inference의 개념을 통합한다.

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

Fusion2Print: Deep Flash-Non-Flash Fusion을 이용한 비접촉 지문 매칭

비접촉 지문 인식은 위생적이고 편리한 대안을 제공하여 접촉 기반 시스템에 비해 잠재 지문 없이 빠른 획득을 가능하게 합니다, 사전…

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] Prithvi-Complimentary Adaptive Fusion Encoder (CAFE): 홍수 침수 매핑을 위한 잠재력 완전 활용

Geo-Foundation Models (GFMs)는 의미 분할, 분류 및 회귀 작업을 포함한 다양한 다운스트림 애플리케이션에서 효과가 입증되었습니다. H...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 360DVO: Deep Visual Odometry for Monocular 360도 카메라

Monocular omnidirectional visual odometry (OVO) 시스템은 360-degree 카메라를 활용하여 perspective VO 시스템의 field-of-view 제한을 극복합니다. 그러나, ...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] SortWaste: 산업 폐기물 분류에서 객체 감지를 위한 고밀도 주석 데이터셋

인구 증가에 의해 촉진된 폐기물 생산량의 증가는 재료를 효과적으로 관리하고 재활용하는 데 어려움을 야기하고 있습니다. Manual waste sorting은…

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] TopoLoRA-SAM: 얇은 구조와 교차 도메인 이진 의미 분할을 위한 토폴로지 인식 파라미터 효율 적응 기반 파운데이션 세그멘터

Segment Anything Model (SAM)과 같은 기반 세분화 모델은 대규모 사전학습을 통해 강력한 zero-shot 일반화를 보여주지만, 적응…

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

특징 검출, 파트 3: Harris Corner Detection

이미지에서 가장 정보가 풍부한 포인트 찾기. The post Feature Detection, Part 3: Harris Corner Detection은 처음으로 Towards Data Science에 게재되었습니다.....

#harris corner detection #feature detection #computer vision #image processing #corner detection
3개월 전 · ai · - · -

[Paper] 맞춤형 CNN, 사전 학습 모델 및 전이 학습을 통한 다중 시각 데이터셋 비교 연구

Convolutional Neural Networks (CNNs)는 원시 픽셀로부터 계층적 표현을 학습하는 능력 때문에 시각 인식에 대한 표준 접근 방식이다....

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[Paper] VIBE: 시각적 지시 기반 편집기

Instruction-based image editing은 생성 AI에서 가장 빠르게 발전하고 있는 분야 중 하나입니다. 지난 1년 동안 이 분야는 새로운 수준에 도달했으며, 수십 개의 op...

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

YOLOv1 Loss Function Walkthrough: 모두를 위한 회귀

YOLOv1이 객체 탐지 및 분류 예측의 정확성을 어떻게 측정하는지에 대한 설명. The post YOLOv1 Loss Function Walkthrough: Regressi...

#YOLOv1 #loss function #object detection #computer vision #deep learning
3개월 전 · ai · - · -

[Paper] Adaptive Hybrid Optimizer 기반 프레임워크를 이용한 Lumpy Skin Disease 식별

Lumpy Skin Disease (LSD)는 전염성 바이러스 감염으로, 가축의 건강을 크게 악화시켜 전 세계 경제에 심각한 위협을 초래합니다.

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[Paper] VerLM: 자연어를 이용한 얼굴 검증 설명

얼굴 인증 시스템은 상당한 발전을 이루었지만, 의사결정 과정에서 투명성이 부족한 경우가 많습니다. 본 논문에서는 우리는 …

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

DeepFakes: 얼굴 인식에 대한 새로운 위협? 평가 및 탐지

소개: 비디오에서 얼굴을 교체하는 것이 새로운 deep‑fake 도구들 덕분에 점점 더 쉬워지고 있으며, 우리는 이미 조작된 클립으로 인해 유명인들이 피해를 입는 사례를 목격했습니다.

#deepfake #face recognition #AI detection #computer vision #security
3개월 전 · ai · - · -

ZoeDepth: 상대 깊이와 메트릭 깊이를 결합한 제로샷 전이

개요 ZoeDepth는 단일 이미지에서 깊이를 예측하며, 가까운 물체와 먼 물체를 모두 정확하게 처리합니다. 두 가지 학습 전략을 결합합니다: 하나는 …

#depth estimation #computer vision #zero-shot transfer #ZoeDepth #neural networks #image processing #relative depth #metric depth
3개월 전 · ai · - · -

“AI-3D 모션 기술로 ‘Next AI 시대’를 열다”, 네이션에이 유수연 대표

네이션에이는 3D 모션 데이터를 AI로 제작·소비 대중화하여 ‘Next AI’ 시대 핵심인 공간 지능 병목을 해결한다. ‘뉴로이드 Neuroid’와 ‘헤이디 Hey.D’로 3D 데이터 플라이휠을 구축하고, 백만 사용자 기반 글로벌 시장을 선도하고 있다. The post “AI‑3D 모션 기…

#AI #3D motion #spatial intelligence #Neuroid #Hey.D #NationAI #generative AI #computer vision
3개월 전 · ai · - · -

Mish: 자기 정규화된 비단조 활성화 함수

개요 Mish는 이미지 기반 AI 모델의 성능을 눈에 띄게 향상시킬 수 있는 간단한 활성화 함수입니다. 표준 활성화를 M으로 교체함으로써…

#Mish activation #neural networks #deep learning #computer vision #image recognition #regularization #activation functions
3개월 전 · ai · - · -

[Paper] AdaGaR: 동적 장면 재구성을 위한 적응형 Gabor 표현

단일 카메라 비디오에서 동적 3D 장면을 재구성하려면 고주파 외관 디테일과 시간적으로 연속적인 움직임을 동시에 포착해야 합니다. Exi...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] Cine Cardiac MRI에서 좌심실 자동 분할을 위한 두 가지 Deep Learning 접근법

좌심실(LV) 분할은 심장 영상의 임상 정량화 및 진단에 필수적입니다. 본 연구에서는 두 가지 새로운 딥러닝 아키텍처를 제안합니다.

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[Paper] Fusion-SSAT: Feature Fusion을 통한 Self-supervised Auxiliary Task의 잠재력 발휘로 일반화된 Deepfake Detection

본 연구에서는 self-supervised learning의 잠재력을 활용하여 일반화된 deepfake의 주요 작업을 최적화할 수 있는 보조 작업으로 활용하고자 하였다.

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] FedHypeVAE: 차등 프라이버시 임베딩 공유를 위한 Hypernetwork 생성 Conditional VAE를 활용한 Federated Learning

연합 데이터 공유는 원시 데이터를 중앙화하지 않고도 유용성을 제공한다는 약속을 하지만, 기존의 embedding-level generators는 non-IID client heterogeneity와 p... 아래에서 어려움을 겪는다.

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[Paper] 오디오 딥페이크 탐지 맥락에서 멀티모달 대형 언어 모델 활용 가능성 조사

Vision-Language Models (VLMs)와 Multimodal Large Language Models (MLLMs)는 이미지 및 비디오 딥페이크 탐지에서 강력한 일반화를 보여주었지만, 그들의 ...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 통합된 Primitive Proxies for Structured Shape Completion

구조화된 형태 완성은 비구조화된 점이 아니라 프리미티브로 누락된 기하학을 복구하여 프리미티브 기반 표면 재구성을 가능하게 합니다. In...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 멀티모달 대형 언어 모델을 이용한 손글씨 공학 시험 채점

손으로 쓴 STEM 시험은 개방형 추론과 다이어그램을 포착하지만, 수작업 채점은 느리고 규모를 확대하기 어렵습니다. 우리는 end-to-end 워크플로우를 제시합니다 for gradi...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 시각 품질 검사의 Continual Learning을 위한 다중 레벨 Feature Fusion

Deep neural networks는 제조업에서 다양한 visual quality inspection 작업을 자동화하는 데 큰 잠재력을 보여줍니다. 그러나 그 적용 가능성은 …

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 데이터 시프트 하에서 병리학 Vision-Language Model의 성능 저하 감지

Vision-Language Models는 의료 영상 분석 및 질병 진단에서 강력한 잠재력을 보여주었습니다. 그러나 배포 후에는 성능이 dete...

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[Paper] 효율적인 Deep Demosaicing과 Spatially Downsampled Isotropic Networks

디지털 이미징에서, 이미지 디모자이싱은 색 필터 어레이(CFA)에서 RGB 정보를 복원하는 중요한 첫 단계입니다. 종종 딥러닝은 …

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

PyTorch vs. TensorFlow: 2026년을 위한 AI 프레임워크 선택

TensorFlow란 무엇인가? Google Brain에서 개발한 TensorFlow는 방대한 도구, 라이브러리 및 리소스로 유명한 견고하고 다재다능한 프레임워크입니다.

#PyTorch #TensorFlow #machine learning #deep learning #AI frameworks #computer vision #natural language processing #model training #scalability
3개월 전 · ai · - · -

컴퓨터 비전 서비스: Oodles와 함께 지능형 시각 시스템 구축

이미지와 비디오는 방대한 양의 데이터를 포함하고 있지만, 그로부터 의미 있는 통찰을 추출하려면 고급 AI 시스템이 필요합니다. Computer Vision Services https://www...

#computer vision #deep learning #AI #image analytics #object detection #OCR #neural networks #visual data
3개월 전 · ai · - · -

[Paper] SpaceTimePilot: 동적 장면의 공간 및 시간에 걸친 생성적 렌더링

우리는 SpaceTimePilot을 소개합니다. 이는 공간과 시간을 분리하여 제어 가능한 생성 렌더링을 가능하게 하는 비디오 디퓨전 모델입니다. 단일 카메라 비디오가 주어지면, SpaceTimePil…

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[Paper] GaMO: 기하학 인식 다중 뷰 디퓨전 아웃페인팅을 통한 희소 뷰 3D 재구성

최근 3D reconstruction은 고밀도 multi-view 이미지로부터 고품질 장면 캡처에서 눈에 띄는 진전을 이루었지만, 입력 view가 ...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] Edit3r: 희소한 비포즈 이미지로부터 즉시 3D 씬 편집

우리는 Edit3r를 제시합니다. 이는 feed‑forward 프레임워크로, unposed, view‑inconsistent, instruction‑edited 이미지들로부터 단일 패스로 3D 씬을 재구성하고 편집합니다. U...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] FineTec: Temporal Corruption 하에서 Skeleton Decomposition 및 Sequence Completion을 이용한 Fine-Grained Action Recognition

시간적으로 손상된 skeleton sequences 로부터 fine-grained actions 를 인식하는 것은 특히 온라인 상황에서 실제 세계 시나리오에 적용될 때 큰 도전 과제로 남아 있다.

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 인페인팅에서 에디팅까지: 컨텍스트가 풍부한 비주얼 더빙을 위한 Self-Bootstrapping Framework

Audio-driven visual dubbing은 비디오의 입 움직임을 새로운 음성에 맞추는 것을 목표로 하지만, 이상적인 학습 데이터가 부족하여 근본적으로 어려움을 겪습니다: pai...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 생성적 분류기는 단축 해결책을 피한다

Discriminative approaches to classification은 종종 in-distribution에서는 유효하지만 사소한 distribution shift에서도 실패하는 shortcuts를 학습합니다. 이러한 실패 모드는…

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[Paper] FoundationSLAM: Depth Foundation Models의 힘을 활용한 End-to-End Dense Visual SLAM

우리는 FoundationSLAM을 제시한다. 이는 학습 기반 단안 밀집 SLAM 시스템으로, 기존 흐름 기반 접근 방식에서 나타나는 기하학적 일관성 부재 문제를 해결한다.

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] Bi-C2R: 양방향 지속 가능한 호환 표현을 위한 재색인 없는 평생 Person Re-identification

Lifelong person Re-IDentification (L‑ReID)은 순차적으로 수집된 데이터를 활용해 ReID 모델을 지속적으로 학습하고 업데이트하며, 전체 성능에 초점을 맞춘다.

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] PhysTalk: 언어 기반 실시간 물리 in 3D 가우시안 씬

현실적인 시각 시뮬레이션은 어디에나 존재하지만, 이를 만들기 위해서는 컴퓨팅 시간, 렌더링, 그리고 전문가 수준의 애니메이션 지식이 필요합니다. Open-vocabulary visual effe...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] DarkEQA: 저조도 실내 환경에서 Embodied Question Answering을 위한 Vision‑Language 모델 벤치마킹

Vision Language Models (VLMs)는 구현된 에이전트의 핵심 추론 모듈로 점점 더 많이 채택되고 있습니다. 기존 벤치마크는 그들의 능력을 …

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[Paper] CPJ: 설명 가능한 농업 해충 진단 via Caption-Prompt-Judge with LLM-Judged Refinement

정확하고 해석 가능한 작물 질병 진단은 농업 의사결정에 필수적이지만, 기존 방법들은 종종 비용이 많이 드는 감독된 파인튜닝에 의존한다...

#research #paper #ai #nlp #computer-vision
3개월 전 · ai · - · -

[Paper] Projection 기반 적대적 공격 using Physics-in-the-Loop Optimization for 단안 깊이 추정

Deep neural networks (DNNs)는 입력 이미지에 특정 perturbations가 추가될 때 misclassification을 일으키는 adversarial attacks에 여전히 취약합니다. This vu...

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

딥 미로 솔버

소개 며칠 전 나는 X 포스트 https://twitter.com/ArnaudPannatier/status/1762864347397628396 를 보았는데, diffusion models가 사용될 수 있다고 설명하고 있었다...

#convolutional neural network #PyTorch #maze solving #supervised learning #diffusion models #computer vision
3개월 전 · ai · - · -

[Paper] RedunCut: 측정 기반 샘플링 및 정확도 성능 모델링을 통한 저비용 실시간 비디오 분석

Live video analytics (LVA)는 대규모 카메라 플릿에서 지속적으로 실행되지만, 최신 비전 모델을 사용한 추론 비용은 여전히 높습니다. 이를 해결하기 위해, dynamic m...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

AI로 CapCut 워터마크 제거 — 플리커 없는 비디오 인페인팅 시스템 구축 방법

AI를 사용한 CapCut 워터마크 제거 커버 이미지 — 플리커 없는 비디오 인페인팅 시스템 구축 방법 https://media2.dev.to/dynamic/image/width=1000,height=420,...

#CapCut #watermark removal #video inpainting #AI restoration #deep learning #computer vision #flicker‑free video #video editing
3개월 전 · ai · - · -

산업 현장을 위한 AI 기반 히트맵

AI‑Powered Heat Maps for Industrial Worksites의 커버 이미지 https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/https...

#computer vision #heatmaps #industrial safety #video analytics #workforce monitoring #CCTV #AI-powered analytics
3개월 전 · ai · - · -

[Paper] Stream-DiffVSR: 저지연 스트리밍 가능한 비디오 초해상도 via 자동회귀 확산

Diffusion-based video super-resolution (VSR) 방법은 강력한 perceptual quality를 달성하지만, ...에 대한 의존으로 인해 latency-sensitive settings에서는 실용적이지 않습니다.

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] Diffusion은 투명성을 안다: 투명 객체 깊이 및 노멀 추정을 위한 Video Diffusion 재활용

투명한 물체는 인식 시스템에게 여전히 악명 높게 어려운 문제입니다: refraction, reflection 그리고 transmission이 stereo, ToF 및 순수 …

#research #paper #ai #computer-vision

Newer posts

Older posts