ai — Page 101 | EUNO.NEWS

3주 전 · ai

[Paper] 주관적 깊이와 시간 스케일 트랜스포머: 언제 어디서 계산할지 학습

The rigid, uniform allocation of computation in standard Transformer (TF) architectures can limit their efficiency and scalability, particularly for large-scale... → 표준 Transformer (TF) 아키텍처에서의 경직되고 균일한 연산 할당은 특히 대규모...

#research #paper #ai #machine-learning #nlp
3주 전 · ai

[Paper] Text-to‑SQL을 이중‑상태 추론으로: 적응형 컨텍스트와 점진적 생성 통합

Recent divide-and-conquer reasoning approaches, particularly those based on Chain-of-Thought (CoT), have substantially improved the Text-to-SQL capabilities of ... → 최근의 분할‑정복 추론 접근 방식, 특히 체인‑오브‑씽크(Chain-of-Thought, CoT)를 기반으로 한 방식은 Text-to‑SQL 기능을 크게 향상시켰습니다 ...

#research #paper #ai #nlp
3주 전 · ai

[Paper] LLM이 인간과 같은 세밀한 증거를 추출하여 증거 기반 사실 검증에 활용할 수 있을까?

온라인 뉴스 기사 아래 사용자 댓글에서 허위 정보가 자주 퍼지며, 사실적으로 잘못된 정보를 탐지하기 위한 효과적인 방법의 필요성을 강조한다.

#LLM #evidence extraction #fact-checking #multilingual dataset #benchmark
3주 전 · ai

[Paper] 내성적 행동 훈련: 파인튜닝이 7B 모델에서 신뢰할 수 있는 내부 상태 감지를 유도한다

Lindsey (2025)는 네 가지 실험을 통해 언어 모델의 내성적 인식을 조사했으며, 모델이 때때로 주입된 …을 감지하고 식별할 수 있음을 발견했습니다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai

[Paper] Prune4Web: 웹 에이전트를 위한 DOM 트리 프루닝 프로그래밍

Web automation employs intelligent agents to execute high-level tasks by mimicking human interactions with web interfaces. Despite the capabilities of recent La... 웹 자동화는 지능형 에이전트를 사용하여 웹 인터페이스와의 인간 상호작용을 모방함으로써 고수준 작업을 수행합니다. 최근 대형 언어 모델(LLM)의 능력에도 불구하고...

#research #paper #ai #machine-learning #nlp
3주 전 · ai

[Paper] 추론 Vision-Language Models는 Test-Time Compute에서 역으로 스케일링되는가? Distractor-centric Empirical Analysis

관련 없는 정보(즉, distractors)가 vision-language models (VLMs)의 test-time scaling에 어떤 영향을 미칩니까? 언어 모델에 대한 이전 연구에서는 …

#vision-language models #distractor analysis #inverse scaling #prompt engineering #multimodal reasoning
3주 전 · ai

[Paper] Monet: 이미지와 언어를 넘어선 잠재 시각 공간에서의 추론

'이미지를 통한 사고'는 시각적 추론을 발전시키는 효과적인 패러다임으로 떠오르며, 시각적 증거를 삽입함으로써 텍스트만으로 이루어진 사고 사슬을 넘어 확장됩니다.

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai

[Paper] BanglaASTE: Bangla 전자상거래 리뷰에서 Aspect‑Sentiment‑Opinion 추출을 위한 새로운 프레임워크, Ensemble Deep Learning 활용

Aspect-Based Sentiment Analysis (ABSA)는 사용자 생성 콘텐츠, 특히 i…에서 세밀한 감성 인사이트를 추출하는 데 중요한 도구로 부상했습니다.

#aspect-based sentiment analysis #Bangla NLP #ensemble deep learning #low-resource languages #dataset release
3주 전 · ai

[Paper] 오염된 학습 데이터를 위한 적응형 및 공격적 거부 기반 이상 탐지

오염된 데이터를 처리하는 것은 anomaly detection에서 중요한 과제이며, 전통적인 모델은 순수하게 정상 데이터만으로 학습한다고 가정합니다. 기존 방법은 mi...

#anomaly detection #adaptive rejection #contaminated data #machine learning research #unsupervised learning
3주 전 · ai

[Paper] Attention logits의 변화를 제어하기

신경망 가중치의 안정성은 트랜스포머 모델을 훈련할 때 매우 중요합니다. 쿼리와 키 가중치는 특히 문제가 되는데, 이들은 성장하는 경향이 있습니다.

#attention #transformer training #learning rate scaling #model stability #research paper
3주 전 · ai

[Paper] Bounding Boxes와 함께 생각하기: 강화 학습 미세조정을 통한 시공간 비디오 그라운딩 향상

시공간 비디오 그라운딩(STVG)은 자연어 설명을 기반으로 잘라내지 않은 비디오에서 대상 객체를 시간적으로와 공간적으로 모두 위치 지정해야 합니다....

#research #paper #ai #computer-vision
3주 전 · ai

[Paper] Differentiable Physics-Neural Models를 활용한 Non-Markovian Closures 학습으로 Accelerated Coarse-Grained Physics Simulations

Numerical simulations는 많은 물리적, 실제 문제에 대한 핵심적인 통찰을 제공합니다. 그러나 이러한 시뮬레이션이 전체 3D domain에서 해결되는 반면, 대부분의 분석은 …

#differentiable physics #neural closure #surrogate modeling #non‑Markovian #simulation acceleration

Newer posts

Older posts