ai — Page 10 | EUNO.NEWS

정렬:

3주 전 · ai · - · -

[Paper] LLMs를 향상시키는 LLMs: Test-Time Scaling을 위한 Agentic Discovery

Test-time scaling (TTS)은 추론 중에 추가 연산을 할당함으로써 대형 언어 모델의 성능을 향상시키는 효과적인 접근법이 되었습니다. H...

#research #paper #ai #nlp
3주 전 · ai · - · -

[Paper] 트래젝터리 모델 정규화

Diffusion 기반 모델은 샘플링을 많은 작은 Gaussian 디노이징 단계로 분해합니다 — 생성이 몇 개의 coar... 로 압축될 때 이 가정은 깨집니다.

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] 제로샷 상상 음성 디코딩 via 상상-청취 MEG 매핑

비침습 뇌 기록으로부터 상상된 말을 디코딩하는 것은 상상 데이터셋이 부족하고 피험자 간에 시간적으로 정렬하기 어려워 도전적이다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] GRAPHLCP: 구조 인식 그래프에 대한 지역화된 컨포멀 예측

Conformal prediction (CP)은 distribution‑free 접근법으로, finite‑sample guarantees를 갖는 uncertainty quantification을 제공합니다. 그러나 CP를 graph neural networks에 적용하는 것은…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] VecCISC: 추론 트레이스 클러스터링 및 후보 답변 선택을 통한 신뢰도 기반 자체 일관성 향상

추론 시간 추론을 확장하기 위한 표준 기법은 Self-Consistency이며, LLM에서 여러 후보 답변을 샘플링하고 가장 흔한 …

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] Proxy3D: Vision‑Language 모델을 위한 효율적인 3D 표현, 시맨틱 클러스터링 및 정렬을 통해

시각-언어 모델(VLM)에서의 공간 지능은 3D 세계에서 추론해야 하는 실용적인 요구와 함께 연구 관심을 끌고 있습니다. 유망한 결과에도 불구하고, ...

#research #paper #ai #computer-vision
3주 전 · ai · - · -

[Paper] Flow-OPD: Flow Matching 모델을 위한 온-폴리시 증류

기존 Flow Matching (FM) 텍스트‑투‑이미지 모델은 다중 작업 정렬에서 두 가지 중요한 병목 현상을 겪는다: 스칼라 값 보상으로 인해 발생하는 보상 희소성…

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] Rubric-Grounded RL: 구조화된 판정 보상을 위한 일반화 가능한 추론

우리는 보상을 가중된 검증 가능한 기준으로 분해하고 LLM judge를 사용해 이를 점수화하는 것이 부분‑credit 최적화 신호를 제공한다고 주장한다: 대신 …

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 기억의 저주: 확장된 회상이 LLM 에이전트의 협력적 의도를 침식한다

Context window 확장은 종종 LLM의 단순한 기능 업그레이드로 간주되지만, 우리는 이것이 다중 에이전트 social dilemmas에서 체계적으로 실패한다는 것을 발견했습니다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] CA-SQL: 복잡도 인식 추론 시간 Reasoning for Text-to-SQL via 탐색 및 Compute Budget Allocation

최근 추론 시 학습(inference-time learning)의 발전으로 LLM이 Text-to-SQL 작업에서 추론 능력이 향상되었지만, 현재 솔루션은 여전히 m...에 대해 좋은 성능을 내는 데 어려움을 겪고 있다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] 고제약 인간 모션 생성에 대한 Retrieval-Guided Diffusion Noise Optimization

맞춤형 zero-shot 목표 함수를 만족하는 인간 동작을 생성하여, 제어 가능한 캐릭터 애니메이션 및 행동 합성 등과 같은 응용을 가능하게 합니다.

#research #paper #ai #computer-vision
3주 전 · ai · - · -

[Paper] 지수 효용을 위한 강화 학습: 알고리즘 및 Discounted MDPs에서의 수렴

할인된 마코프 결정 과정(MDPs)에서 지수 효용 최적화를 위한 강화 학습(RL)은 원칙적인 가치 기반 알고리즘이 부족합니다. 우리는 ...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

CyberSecQwen-4B: 방어 사이버에 작은, 특화된, 로컬에서 실행 가능한 모델이 필요한 이유

!https://cdn-avatars.huggingface.co/v1/production/uploads/620760a26e3b7210c2ff1943/-s1gyJfvbE1RgO5iBeNOi.png Qwen/Qwen3-4B-Instruct-2507 - 텍스트 생성 - 4 B...

#ai #ai-models #opensource
3주 전 · ai · - · -

[Paper] MoCoTalk: Multi-Conditional Diffusion과 Adaptive Router를 활용한 Controllable Talking Head Generation

Talking-head generation은 identity, head pose, facial expression, 그리고 mouth dynamics의 공동 모델링을 필요로 합니다. 기존 방법들은 일반적으로 그 중 일부만을 다룹니다.

#research #paper #ai #computer-vision
3주 전 · ai · - · -

[Paper] 불확실성 인식 구조화 데이터 추출 전체 CMR 보고서에서 증류된 LLM을 통해

자유 텍스트 형태의 심장 자기공명(CMR) 보고서를 감사 가능한 구조화된 데이터로 변환하는 것은 코호트 구성, 장기 큐레이션, 그리고 …에 있어 여전히 병목 현상으로 남아 있습니다.

#research #paper #ai #nlp
3주 전 · ai · - · -

[Paper] 빠른 Byte Latent Transformer

최근 바이트 수준 언어 모델(LM)은 서브워드 어휘에 의존하지 않으면서 토큰 수준 모델의 성능과 일치하지만, 그 유용성은 slo...

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] SCOPE: 구조적 분해 및 조건부 스킬 오케스트레이션을 통한 복잡한 이미지 생성

텍스트-투-이미지 모델이 visual fidelity에서 큰 진전을 이루었지만, complex visual intents를 충실히 구현하는 것은 여전히 어려운 과제이다. 많은 요구사항이…

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] PropSplat: 지도 없이 RF 필드 재구성 via 3D Gaussian Propagation Splatting

사이트 특화 전파 모델을 구축하려면 일반적으로 상세한 3D 지도에 대한 ray-tracing이나 밀집 측정 캠페인 중 하나가 필요합니다. 두 접근 방식 모두 비용이 많이 듭니다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 해석 가능한 분포적 처리 효과를 위한 세미파라메트릭 효율 검정

Distributional treatment effects는 평균값(means)으로는 보이지 않을 수 있다: 처치는 average outcomes를 유지하면서도 tails, modes, dispersion, 혹은 rare‑event 확률을 변화시킬 수 있다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 객체 환각 방지 강화 언러닝 for Vision-Language Models

Vision-language models (VLMs)는 프라이버시, 저작권 및 편향에 대한 우려가 커지고 있어, 민감한 지식을 제거하기 위한 머신 언러닝을 촉진하고 있습니다. 그러나, e...

#research #paper #ai #computer-vision
3주 전 · ai · - · -

[Paper] MPD$^2$-Router: Mask-aware Multi-expert Prior-regularized Dual-head Deferral Router를 이용한 녹내장 선별 및 진단

Learning-to-defer (L2D)는 어려운/불확실한 사례를 인간에게 전달함으로써 glaucoma screening을 보다 안전하게 만들 수 있지만, 기존의 공식들은 expert availability를 간과한다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 파라미터 재구성을 통한 스파이킹 신경망의 전역 최적 훈련

Spiking Neural Networks (SNNs)는 기존의 Artificial Neural Networks (ANNs)에 대한 생물학적으로 타당하고 에너지 효율적인 대안으로 제안되었습니다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] Position: Mechanistic Interpretability은 Causal Claims를 위한 Identification Assumptions를 공개해야 한다

Mechanistic interpretability 논문들은 점점 인과적 어휘를 사용하고 있다: circuits, mediators, causal abstraction, monosemanticity. 이러한 주장들은 명시적인 i...

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] Tool Calling은 선형적으로 읽을 수 있고 언어 모델에서 제어 가능합니다

툴을 호출하는 에이전트가 잘못된 툴을 선택하면, 실패는 실행될 때까지 보이지 않는다: 이메일이 전송되고, 회의가 놓치게 된다. Probing 12 instruction-t

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] GLiGuard: 스키마 조건부 분류를 이용한 LLM 보호

대규모 언어 모델에서 안전하고 정책을 준수하는 출력을 보장하려면 여러 안전 차원에 걸쳐 확장 가능한 실시간 콘텐츠 검토가 필요합니다. Howev...

#research #paper #ai #nlp
3주 전 · ai · - · -

[Paper] FLAM: 연합 학습에서 집계 가능한 측정값으로 모델 성능 평가

성능 평가는 머신 러닝(ML) 모델의 품질을 평가하고 배포 결정을 안내하는 데 필수적입니다. 연합 학습(FL)에서는 ...

#research #paper #ai #machine-learning
3주 전 · it · - · -

당신의 Google I/O 치트 시트: 기대할 내용

Gemini는 이미 검색 결과, Gmail, 캘린더, 그리고 Android에 포함되어 있습니다 https://mashable.com/category/android phone. Google에서도 https://mashable.com/...

#Google I/O #Google #Gemini #AI #smart glasses #Android #laptop OS #product launch
3주 전 · ai · - · -

[Paper] mathsf{VISTA}: 적대자가 지배하는 환경에서의 분산 머신러닝

분산 머신러닝은 종종 신뢰할 수 없는 워커 노드에 그래디언트 평가와 같은 계산을 외주하는 데 의존합니다. 기존의 강인한 집계 방법은...

#research #paper #ai #machine-learning
3주 전 · it · - · -

거버넌스, 게이트키핑이 아니라: SAP가 AI 연결성에 엔터프라이즈급 안전성을 제공하는 방법

SAP 제공: 엔터프라이즈 소프트웨어 산업은 근본적인 변화를 겪었으며, 벤더들은 고객을 보다 잘 보호하기 위해 접근 방식을 조정하고 있습니다.

#it #startups #ai
3주 전 · ai · - · -

[Paper] 같은 뇌, 다른 예측: 전처리 선택이 EEG 디코딩 신뢰도를 약화시키는 방법

뇌전도(EEG)는 뇌-컴퓨터 인터페이스와 임상 신경과학의 핵심이지만, 딥러닝 모델은 일반적으로 훈련되고 평가됩니다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] o‑Mininal Structure에서 정의 가능한 모든 Feedforward Neural Network은 Finite Sample Complexity를 갖는다

우리는 정확한 의미에서, 광범위한 클래스의 피드포워드 신경망이 PAC 모델에서 학습한다(유한 샘플 복잡도를 가진다)는 것을 보여준다: 모든 고정된 유한 피드포워드 신경망…

#research #paper #ai #machine-learning
3주 전 · it · - · -

Sakana가 7B 모델을 훈련시켜 GPT-5, Claude Sonnet 4 및 Gemini 2.5 Pro를 오케스트레이션하는 방법

Hard‑Coded LangChain 파이프라인의 문제 > “당신 팀이 하드코딩한 모든 LangChain 파이프라인은 쿼리 분포가 변하는 순간부터 깨지기 시작합니다 — 그리고...”

#it #startups #ai
3주 전 · ai · - · -

다음 미국 세기를 위한 전력 공급: 미국 에너지 장관 크리스 라이트와 NVIDIA의 이안 벅이 말하는 Genesis Mission

AI는 필요한 에너지를 구축하는 데 도움을 줄 것입니다. 미국 에너지 장관 Chris Wright와 NVIDIA의 Hyperscale 및 High‑Performance Computing 부사장 Ian Buck이 …

#ai #gpu #nvidia
3주 전 · ai · - · -

[Paper] UniPool: 전 세계적으로 공유되는 전문가 풀 for Mixture-of-Experts

현대 Mixture-of-Experts (MoE) 아키텍처는 전문가 용량을 엄격한 레이어별 규칙을 통해 할당한다: 각 transformer 레이어는 별개의 전문가 집합을 가진다. 이 c...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] EMO: 사전 학습 Mixture of Experts for 자생적 모듈성

Large language models은 일반적으로 monolithic 시스템으로 배포되며, 애플리케이션이 좁은 범위의 기능만 필요하더라도 전체 모델을 요구합니다, 예를 들어…

#research #paper #ai #nlp
3주 전 · ai · - · -

[Paper] 검증기 기반 난이도 높은 문제 생성: 수학적 추론

대형 언어 모델(LLMs)은 과학 및 수학 문제를 해결하는 데 강력한 능력을 보여주지만, 유효하고 도전적인 …

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] Relit‑LiVE: 환경 비디오를 공동 학습하여 비디오 재조명

최근 연구에 따르면 large-scale video diffusion models를 먼저 비디오를 intrinsic scene representations로 분해함으로써 neural renderers로 재활용할 수 있음이 밝혀졌다.

#research #paper #ai #computer-vision
3주 전 · ai · - · -

[Paper] 왜 글로벌 LLM 리더보드는 오해를 불러일으키는가: 이질적인 지도 학습을 위한 작은 포트폴리오

쌍별 인간 피드백을 통한 LLM 순위 매기기는 창의적 글쓰기와 문제 해결과 같은 개방형 작업에 대한 현재 리더보드의 기반이 됩니다. 우리는 약 89K comp...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 옵티마이저-모델 일관성: 프리트레이닝과 동일한 옵티마이저를 사용한 전체 파인튜닝은 덜 잊는다

Optimizers는 대규모 언어 모델(LLMs)을 학습할 때 사전 학습(pretraining) 및 미세 조정(finetuning) 단계 모두에서 중요한 역할을 합니다. 본 논문에서는 관찰을 제시합니다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 벤치마크가 없을 때: Comparative LLM Safety Scoring을 Ground-Truth Labels 없이 검증

많은 배포에서는 관련 언어, 분야, 혹은 규제 체계에 대한 라벨이 붙은 benchmark가 존재하기 전에 후보 candidate language model들의 안전성을 비교해야 합니다. 우리는...

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] AI Co-Mathematician: Agentic AI와 함께 수학자 가속화

우리는 AI co-mathematician을 소개합니다, 이는 수학자들이 AI agents를 인터랙티브하게 활용하여 open-ended research를 수행할 수 있는 워크벤치입니다. AI co-mathematician ...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] Negative Rollouts를 넘어: Implicit Negative Gradients를 이용한 Positive-Only Policy Optimization

검증 가능한 보상을 이용한 강화 학습(RLVR)은 결정론적 검증 덕분에 추론 능력을 향상시키는 주요 패러다임이 된다.

#research #paper #ai #nlp
3주 전 · ai · - · -

[Paper] Superintelligent Retrieval Agent: 정보 검색의 다음 경계

Retrieval-augmented agents는 대규모 조직 지식 베이스에 대한 인터페이스로 점점 더 많이 사용되고 있지만, 대부분은 여전히 retrieval을 블랙 박스로 취급합니다: they issue exp...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 귀납적 Venn-Abers 및 관련 회귀기

Venn‑Abers predictors는 유효성의 매력적인 특성을 갖는 확률적 예측기이지만, 주요 제한점은 오직 t…에만 적용 가능하다는 것이다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 성숙한 chromophore-region에서 edge-specific signal propagation을 이용한 3D mechanism graphs 기반 fluorescent protein quantum-yield 예측

형광 단백질 quantum yield (QY)는 서열 정체성만이 아니라 성숙한 chromophore와 그 three-dimensional microenvironment에 의해 결정됩니다. Pro...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 멀티모달 도메인 일반화에서 진전이 있나요? 포괄적인 Benchmark Study

멀티모달 도메인 일반화(MMDG)가 모델 견고성을 향상시키기 위해 점점 인기를 얻고 있음에도 불구하고, 보고된 성능 향상이 실제로 ...

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] StraTA: 전략적 궤적 추상화를 통한 에이전트 강화학습 인센티브 제공

Large language models (LLMs)은 점점 더 인터랙티브 에이전트로 사용되고 있지만, 장기 의사결정을 위해 이를 최적화하는 것은 현재… 때문에 여전히 어렵다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] GlazyBench: 세라믹 유약 속성 예측 및 이미지 생성을 위한 벤치마크

세라믹 유약을 개발하는 것은 복잡한 화학 때문에 비용이 많이 들고 시간도 많이 소요되는 시행착오 과정이며, 이는 독립 아티스트에게 큰 부담을 줍니다. ...

#research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts