research — Page 79

정렬:

2개월 전 · ai · - · -

[Paper] SpatialTree: MLLM에서 공간 능력이 어떻게 확장되는가

인지 과학은 공간 능력이 인식에서 추론 및 상호작용으로 점진적으로 발달한다고 제안합니다. 그러나 멀티모달 LLMs(MLLMs)에서는 이 계층…

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 클로즈드 루프 월드 모델링을 통한 비디오 아바타의 액티브 인텔리전스

현재 video avatar generation 방법은 identity preservation과 motion alignment에서 뛰어나지만, genuine agency가 부족하고 장기적인 목표를 자율적으로 추구할 수 없습니다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 대형 언어 모델을 효율적인 Dense Retriever로 만들기

최근 연구에 따르면 대형 언어 모델(LLMs)을 직접 파인튜닝하여 dense retrieval을 수행하면 강력한 성능을 얻을 수 있지만, 그들의 상당한 파라미터 수...

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] FedPOD: 연합 학습을 위한 배포 가능한 학습 단위

본 논문은 연합 학습에서 학습 효율성과 통신 비용을 최적화하기 위해 FedPOD (Proportionally Orchestrated Derivative)를 제안한다.

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] Saddle-to-Saddle Dynamics가 신경망 아키텍처 전반에 걸친 Simplicity Bias를 설명한다

Neural networks가 gradient descent로 훈련될 때, 시간에 따라 복잡도가 증가하는 해결책을 학습하는 경우가 많으며, 이는 simplicity bias라고 알려진 현상이다. Despite being wid...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] Video Diffusion Transformers 재활용을 통한 견고한 포인트 트래킹

포인트 트래킹은 비디오 프레임 간에 대응되는 포인트를 위치 지정하는 것을 목표로 하며, 4D 재구성, 로보틱스 및 비디오 편집을 위한 기본 작업이다. Exis...

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] Autoregressive 모델에서 출현하는 시간 추상화가 Hierarchical Reinforcement Learning을 가능하게 한다

다음 토큰 예측을 사전 학습하고 강화 학습(RL)으로 미세 조정된 대규모 자동회귀 모델은 많은 분야에서 전례 없는 성공을 거두었습니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] MoE-DiffuSeq: Sparse Attention 및 Mixture of Experts를 활용한 Long-Document Diffusion 모델 강화

우리는 MoE‑DiffuSeq를 제시한다. 이는 mixture of experts 기반 프레임워크로, 긴 문서 생성에서 diffusion 모델을 향상시키기 위한 것이다. 기존 diffusion 기반 텍스트 생성…

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] Cube Bench: MLLMs의 공간 시각 추론을 위한 벤치마크

우리는 Cube Bench를 소개합니다. 이는 Rubik's-cube 벤치마크로, 멀티모달 대형 언어 모델(MLLMs)의 공간 및 순차적 추론을 평가하기 위해 설계되었습니다. 이 벤치마크는 ...

#research #paper #ai #machine-learning #nlp #computer-vision
2개월 전 · ai · - · -

[Paper] High-Fidelity Digital Models와 Reinforcement Learning을 활용한 Mission Engineering: Perfect Information 하의 Aerial Firefighting 사례 연구

시스템 엔지니어링(SE) 목표가 단일 시스템의 설계 및 운영에서 복잡한 System of Systems(SoS)로 진화함에 따라, 미션 엔지니어링 분야는…

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 자동화된 stereotactic radiosurgery 계획을 위한 human-in-the-loop 추론 large language model 에이전트

Stereotactic radiosurgery (SRS)는 중요한 구조물 주변에 정밀한 dose shaping을 요구하지만, black-box AI 시스템은 불투명성 때문에 임상 채택이 제한적이다 ...

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] Relu와 softplus 신경망을 제로섬 턴제 게임으로

우리는 ReLU 신경망의 출력이 제로섬, 턴제, 스톱핑 게임의 값으로 해석될 수 있음을 보여준다. 우리는 이를 ReLU net game이라고 부른다. …

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] LLM이 자신의 실패를 예측할 수 있을까? 내부 회로를 통한 자기 인식

Large language models (LLMs)는 유창하고 복잡한 출력을 생성하지만, 자신의 실수와 hallucinations를 인식하지 못하는 경우가 많다. 기존 접근 방식은 보통…

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] Gold-Standard 품질 메트릭을 활용한 ML 학습 데이터 개선

핸드 태깅된 훈련 데이터는 많은 머신러닝 작업에 필수적입니다. 그러나 훈련 데이터 품질 관리에 대해서는 문헌에서 거의 주목받지 못했습니다, d...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] Performative Policy Gradient: Performative Reinforcement Learning에서의 최적성

배포 후 머신러닝 알고리즘은 종종 자신이 작동하는 환경에 영향을 미치며, 따라서 표준 강화학습이 가정하는 기본 역학을 변화시킵니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 빠르게 실패하고 크게 승리하라: Diffusion LLMs를 통한 Speculative Decoding에서 초안 전략 재고

Diffusion Large Language Models (dLLMs)는 빠르고 병렬적인 토큰 생성을 제공하지만, 단독으로 사용할 경우 효율성과 품질 사이의 내재된 트레이드오프에 시달립니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] KL‑가이드 레이어 선택을 통한 하이브리드 어텐션 모델 디스틸링

사전 학습된 softmax attention Transformers를 softmax와 linear attention 레이어를 교차 배치하는 보다 효율적인 하이브리드 아키텍처로 증류하는 것은 유망한…

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] LEAD: End-to-End 운전에서 학습자‑전문가 비대칭 최소화

시뮬레이터는 사실상 무제한에 가까운 주행 데이터를 생성할 수 있지만, 시뮬레이션에서의 imitation learning 정책은 여전히 견고한 closed-loop performance를 달성하는 데 어려움을 겪는다.

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] Shallow Neural Networks가 Learnable Channel Attention을 통해 Low‑Degree Spherical Polynomials를 학습한다

우리는 차수 ℓ₀ = Θ(1) ≥ 1인 저차원 구면 다항식을 ℝ^d의 단위 구면 위에서 학습하는 문제를 연구한다. 이를 위해 과다 매개변수화된 모델을 훈련한다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] FlashVLM: 텍스트 가이드 시각 토큰 선택 for 대규모 멀티모달 모델

대규모 비전-언어 모델(VLM)은 일반적으로 이미지 또는 비디오 프레임당 수백에서 수천 개의 visual tokens를 처리하며, 이로 인해 제곱 규모의 attention 비용이 발생하고 ...

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 4D에서 추론 학습: Vision Language Models를 위한 동적 공간 이해

Vision-language models (VLM)은 일반적인 이해에 뛰어나지만 동적 공간 추론(DSR), 즉 객체의 변화를 추론하는 데는 약합니다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 멀티모달 교사 감정 분석의 진보: 대규모 T-MED 데이터셋 및 효과적인 AAM-TSA 모델

교사의 감정 상태는 교육 현장에서 중요하며, teaching efficacy, student engagement, learning achievements에 깊은 영향을 미칩니다. 그러나...

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] Step-DeepResearch 기술 보고서

LLM이 자율 에이전트로 전환함에 따라 Deep Research가 핵심 지표로 부상했습니다. 그러나 BrowseComp와 같은 기존 학술 벤치마크는 종종 …

#research #paper #ai #nlp
2개월 전 · devops · - · -

[Paper] WOC: 이중 경로 가중 객체 합의 효율화

현대 분산 시스템은 중요한 과제에 직면해 있습니다: 기존 합의 프로토콜은 노드 이질성 또는 워크로드 독립성 중 하나만 최적화하고, 두 가지를 모두 최적화하지는 못합니다.

#research #paper #devops

Newer posts

Older posts