research — Page 50

정렬:

3주 전 · ai · - · -

[Paper] TabICLv2: 더 나은, 더 빠른, 확장 가능한, 그리고 오픈된 테이블형 파운데이션 모델

Tabular foundation models(예: TabPFNv2 및 TabICL)는 최근 예측 벤치마크에서 gradient-boosted trees를 제치고 최고 자리를 차지했으며, 그 가치를 입증하고 있습니다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] Weight Decay가 Language Model의 Plasticity를 향상시킨다

대형 언어 모델(LLM) 개발에서 지배적인 패러다임은 베이스 모델을 사전 학습(pretrain)한 뒤, 성능과 모델을 개선하기 위해 추가 학습을 수행하는 것입니다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] Just on Time: 토큰 수준 조기 중단 for Diffusion Language Models

Diffusion 언어 모델은 텍스트를 반복적인 정제 과정을 통해 생성합니다. 이 과정은 많은 토큰이 안정 상태에 도달하기 전까지 여러 번 업데이트가 필요하기 때문에 계산 효율성이 낮은 경우가 많습니다. 기존 방법에서는 각 토큰이 완전히 수렴할 때까지 여러 단계의 디퓨전 과정을 거치며, 이는 전체 생성 시간과 비용을 크게 증가시킵니다. 최근 연구들은 이러한 비효율성을 완화하기 위해 토큰 수준에서의 동적 스케줄링, 조기 종료 전략, 그리고 부분적인 샘플링 기법을 도입하고 있습니다. 예를 들어, 토큰이 일정 기준 이상의 확신도를 보이면 해당 토큰에 대한 추가 디퓨전 단계를 건너뛰고, 남은 불확실한 토큰에만 집중하는 방식이 제안되었습니다. 또한, 모델이 학습 단계에서 다양한 노이즈 레벨에 대한 복원 능력을 동시에 습득하도록 설계함으로써, 추론 시에 한 번의 전방 패스로 여러 디퓨전 단계의 효과를 모방할 수 있는 방법도 연구되고 있습니다. 이러한 접근법들은 전통적인 디퓨전 기반 텍스트 생성의 계산 복잡성을 크게 낮추면서도, 품질 면에서는 기존 방법과 비슷하거나 더 나은 성능을 보이는 결과를 보여주고 있습니다.

#research #paper #ai #machine-learning #nlp
3주 전 · devops · - · -

[Paper] Min‑Sum 균일 커버리지 문제 by 자율 모바일 로봇

우리는 주어진 유한한 선분과 유한한 양의 반지름을 갖는 원 위에 있는 n개의 모바일 로봇 군집에 대한 min-sum uniform coverage problem을 연구한다, 여기서...

#research #paper #devops
3주 전 · ai · - · -

[Paper] PhyCritic: Physical AI를 위한 멀티모달 Critic 모델

대규모 멀티모달 모델의 급속한 발전과 함께, 신뢰할 수 있는 judge 및 critic 모델은 개방형 평가와 preference alignment에 필수적이 되었습니다.

#research #paper #ai #computer-vision
3주 전 · ai · - · -

[Paper] 크로스 도메인 에이전틱 워크플로우 생성을 위한 구성 학습

자동으로 에이전트 워크플로우를 생성하는 것—추론, 검증 및 수리를 조정하는 실행 가능한 연산자 그래프 또는 코드—은 실용적인…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] TEGRA: 텍스트 인코딩과 그래프 및 검색 보강을 통한 허위정보 탐지

Misinformation detection은 외부 지식의 통합으로부터 크게 이익을 얻을 수 있는 중요한 작업이며, 이는 manual fact‑checking과 매우 유사합니다. In this w...

#research #paper #ai #nlp
3주 전 · ai · - · -

[Paper] Reasoning Models에서의 Safety Recovery는 몇 단계의 초기 Steering만으로도 가능

명시적 체인오브생각(예: GRPO)을 위한 강화학습(RL) 기반 사후 학습은 멀티모달 대규모 추론 모델의 추론 능력을 향상시킨다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] 생체 보행 인식을 위한 제1회 국제 StepUP 대회: 방법, 결과 및 남은 과제

Biometric footstep recognition은 걷는 동안 발 아래에 나타나는 사람 고유의 압력 패턴을 기반으로 하는 생체인식 기술로, 응용 분야가 확대되고 있는 신흥 분야입니다.

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] SteuerLLM: 독일 세법 분석을 위한 지역 특화 대규모 언어 모델

대규모 언어 모델(LLMs)은 강력한 일반 추론 및 언어 이해를 보여주지만, 그들의 성능은 엄격한 형태…

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] PuriLight: 단일 카메라 깊이 추정을 위한 경량 셔플 및 정화 프레임워크

우리는 경량이면서 효율적인 프레임워크인 PuriLight를 제안한다. 이는 self-supervised monocular depth estimation을 위한 것으로, 계산 효율성의 이중 과제에 대응한다.

#research #paper #ai #computer-vision
3주 전 · ai · - · -

[Paper] 다중 작업 진화 정책 탐색을 위한 인터랙티브 LLM 지원 커리큘럼 학습

Multi-task policy search는 정책이 훈련 사례를 넘어 일반화해야 하기 때문에 어려운 문제입니다. Curriculum learning은 효과적인 것으로 입증되었습니다.

#research #paper #ai #machine-learning

Newer posts

Older posts