research — Page 120

정렬:

3개월 전 · ai · - · -

[Paper] 멀티-크리트: 다중모달 판사들의 다원적 기준 준수 벤치마킹

대형 멀티모달 모델(LMM)은 강력한 지시 수행 능력과 일관성 때문에 멀티모달 평가 시스템에서 판사 역할로 점점 더 많이 채택되고 있습니다.

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 불가피한 A Priori를 연결하기: 비교 인과 모델링을 위한 프레임워크

AI/ML 모델은 이전에 해결되지 않았던 문제들을 해결하기 위한 혁신으로 급속히 주목받고 있으며, 인간 편견을 증폭시키는 부작용도 발생하고 있다.

#causal inference #system dynamics #probabilistic modeling #python library #research
3개월 전 · ai · - · -

[Paper] Vision Transformers에서 비단조 스케일링 메커니즘

Deeper Vision Transformers는 종종 얕은 모델보다 성능이 떨어지며, 이는 일반적인 스케일링 가정에 도전합니다. ViT-...에 대한 체계적인 실증 분석을 통해 이를 조사합니다.

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[Paper] Qwen3-VL 기술 보고서

우리는 Qwen 시리즈 중 현재까지 가장 뛰어난 비전‑언어 모델인 Qwen3‑VL을 소개합니다. 이 모델은 다양한 멀티모달 벤치마크 전반에 걸쳐 우수한 성능을 달성합니다.

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[Paper] 저자는 사망했지만, 그들이 살아 있지 않았다면? 체코 AI 및 인간이 만든 시에 대한 수용 실험

대형 언어 모델은 창의적인 텍스트를 생성하는 능력이 점점 향상되고 있지만, AI‑생성 시에 대한 대부분의 연구는 영어—지배적인 언어인—에 초점을 맞추고 있습니다.

#research #paper #ai #nlp
3개월 전 · ai · - · -

[Paper] 스케일에 구애받지 않는 콜모고로프‑아놀드 기하학 in 신경망

Freedman과 Mulligan의 최근 연구에 따르면, 얕은 다층 퍼셉트론이 Kolmogorov‑Arnold 기하학적(KAG) 구조를 자발적으로 개발한다는 것이 입증되었습니다. 이는 t… 동안에 발생합니다.

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] TAGFN: 텍스트 속성 그래프 데이터셋을 이용한 LLM 시대의 가짜 뉴스 탐지

대형 언어 모델(LLM)은 최근 텍스트 속성 그래프에 대한 머신러닝을 혁신했지만, LLM을 그래프 이상치 탐지에 적용하는 것은, ...

#research #paper #ai #nlp
3개월 전 · ai · - · -

[Paper] AI에서 알고리즘적 진보의 기원에 관하여

Algorithms have been estimated to increase AI training FLOP efficiency by a factor of 22,000 between 2012 and 2023 [Ho et al., 2024]. Running small-scale ablati... → 알고리즘은 2012년부터 2023년 사이에 AI 훈련 FLOP 효율성을 22,000배 향상시킨 것으로 추정됩니다 [Ho et al., 2024]. 소규모 ablati...

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] ReSAM: 정제, 재조회, 그리고 강화: 원격 감지 이미지를 위한 자체 프롬프트 포인트‑감독 세분화

Interactive segmentation models such as the Segment Anything Model (SAM) have demonstrated remarkable generalization on natural images, but perform suboptimally...

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] TAB-DRW: 생성형 테이블 데이터를 위한 DFT 기반 강인 워터마크

생성 AI의 부상으로 의료, 금융, 공공 정책 등 분야에서 고충실도 합성 표형 데이터의 생산이 가능해졌으며, ...

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] 차원 축소를 통한 LLM 잠재 공간 기하학 시각화

Large language models (LLMs) achieve state-of-the-art results across many natural language tasks, but their internal mechanisms remain difficult to interpret. I...

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] MoGAN: 몇 단계 모션 적대적 사후 훈련을 통한 비디오 확산에서 모션 품질 향상

Video diffusion models achieve strong frame-level fidelity but still struggle with motion coherence, dynamics and realism, often producing jitter, ghosting, or ... 비디오 확산 모델은 프레임 수준에서 높은 충실도를 달성하지만, 움직임 일관성, 역동성 및 현실감에서는 여전히 어려움을 겪으며, 흔히 흔들림, 유령 현상 등을 발생시킵니다.

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 대형 언어 모델에서 선천적 계획의 한계에 대하여

Large language models (LLMs) achieve impressive results on many benchmarks, yet their capacity for planning and stateful reasoning remains unclear. We study the...

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] 폐쇄‑루프 엔드‑투‑엔드 자율 주행을 위한 모델 기반 정책 적응

엔드‑투‑엔드(E2E) 자율주행 모델은 오픈‑루프 평가에서 강력한 성능을 보여왔지만, 종종 연쇄 오류와 일반화 부족으로 어려움을 겪는다.

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] 언제 멈출지 학습: Adaptive Latent Reasoning via Reinforcement Learning

Latent reasoning은 Transformer 언어 모델에서 새로운 개발을 의미하며, chain-of-thought에 비해 추론 길이를 압축하는 잠재력을 보여주었습니다.

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] Harmony: 오디오와 비디오 생성의 교차 작업 시너지로 조화

동기화된 오디오-비주얼 콘텐츠의 합성은 생성 AI에서 핵심 과제이며, 오픈소스 모델들은 견고한 오디오-비디오 정렬에 어려움을 겪고 있습니다.

#audio-visual generation #multimodal diffusion #cross-modal synchronization #generative AI #research
3개월 전 · ai · - · -

[Paper] 다중모달 강인 프롬프트 증류 for 3D 포인트 클라우드 모델

적대적 공격은 학습 기반 3D 포인트 클라우드 모델에 중대한 위협을 가하며, 보안에 민감한 응용 분야에서 그 신뢰성을 심각하게 저해합니다.

#research #paper #ai #machine-learning #computer-vision
3개월 전 · ai · - · -

[논문] 전문가 페르소나 LLM의 자기 투명성 실패: 대규모 행동 감사

언어 모델이 전문가 상황에서 AI 정체성을 신뢰할 수 있게 공개하지 못한다면, 사용자는 그 모델의 역량 한계를 신뢰할 수 없습니다. 이 연구는 자기 투명성...

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] RoParQ: 패러프레이즈 인식 정렬을 통한 대형 언어 모델의 패러프레이즈 질문에 대한 견고성 향상

대형 언어 모델(LLM)은 종종 바뀐 형태의 질문에 답할 때 일관되지 않은 행동을 보이며, 이는 깊은 이해보다는 표면 수준의 패턴에 의존하고 있음을 시사한다.

#research #paper #ai #nlp
3개월 전 · ai · - · -

[Paper] UAVLight: 무인 항공기(UAV) 장면에서 조명 강인성 3D 재구성을 위한 벤치마크

Illumination inconsistency는 다중 뷰 3D 재구성에서 근본적인 도전 과제입니다. 햇빛 방향, 구름 양, 그리고 그림자의 변동은 일관성을 깨뜨립니다.

#research #paper #ai #computer-vision
3개월 전 · ai · - · -

[Paper] 머신러닝 접근법을 통한 임상 위험 예측: 전자 건강 기록에서의 다중 스케일 시간 정렬

이 연구는 시간적 불규칙성, 샘플링...와 같은 문제들을 해결하기 위해 다중 스케일 시간 정렬 네트워크(Multi-Scale Temporal Alignment Network, MSTAN)를 기반으로 한 위험 예측 방법을 제안한다.

#research #paper #ai #machine-learning
3개월 전 · ai · - · -

[Paper] VacuumVLA: 복합 로봇 조작을 위한 통합 흡입 및 그리핑 도구를 통한 VLA 능력 향상

Vision Language Action 모델은 대규모 사전 학습된 비전 및 언어 표현을 활용함으로써 범용 로봇 조작을 크게 발전시켰습니다…

#research #paper #ai #machine-learning
3개월 전 · devops · - · -

[Paper] MAD-DAG: 블록체인 합의를 MEV로부터 보호하기

블록체인 보안은 채굴자(운영자)가 프로토콜을 벗어나 수익을 늘리려는 selfish mining에 의해 위협받습니다. selfish mining은 악화됩니다.

#research #paper #devops
3개월 전 · ai · - · -

[Paper] MMA: 관성 센서를 이용한 인간 활동 인식용 모멘텀 맘바 아키텍처

Human activity recognition (HAR) from inertial sensors is essential for ubiquitous computing, mobile health, and ambient intelligence. Conventional deep models ...

#research #paper #ai #machine-learning

Newer posts

Older posts