machine-learning — Page 5

정렬:

2주 전 · ai · - · -

[Paper] 전향적 다중 병원체 질병 예측을 위한 자율 LLM 기반 트리 탐색

감염병에 대한 Probabilistic forecasting은 공중보건에 필수적이지만, 전문가 모델링 팀이 수행하는 labor‑intensive manual model curation에 의존합니다. This...

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] Layer Equivalence은 레이어만의 속성이 아니다: Redundancy를 테스트하는 방법이 결과를 바꾼다

연구자들이 두 transformer 레이어가 압축을 위해 ‘equivalent’한지 여부를 물을 때, 그들은 종종 서로 다른 테스트들을 혼동한다. Replacement는 한 레이어의 m…

#research #paper #ai #machine-learning #nlp
2주 전 · ai · - · -

[Paper] 원자 좌표로부터 보편적인 자기 구조 예측, 실험에 근접한 정확도

Magnetic order는 재료의 기본적인 특성으로, 집합적 행동을 지배하고 광범위한 기능을 가능하게 합니다. 그러나 magnetic structure는 …

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] Tail‑Risk 학습의 프라이버시 비용: 차등 프라이버시 CVaR 최적화에서의 효과적인 테일 샘플 크기

차등 프라이버시(Differential privacy)는 CVaR 학습을 지배하는 유효 샘플 크기를 변경합니다. 꼬리 질량 τ에 대해, 프라이버시와 관련된 샘플 크기는 n이 아니라 nτ이며, 동등하게…

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] Fully Open Meditron: 임상 LLM을 위한 감사 가능한 파이프라인

임상 의사결정 지원 시스템(CDSS)은 엄격하고 재현 가능한 검증을 가능하게 하는 검증 가능하고 감사 가능한 파이프라인을 필요로 합니다. 그러나 현재 LLM 기반 CDSS는 여전히...

#research #paper #ai #machine-learning #nlp
2주 전 · ai · - · -

[Paper] 가설 기반 메조스코픽 동역학 구축

전통적인 과학 모델링은 일반적으로 고정된 사례별 유효 방정식으로 시작한 뒤, 방정식별 분석 및 계산을 수행한다.

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] 런타임 오케스트레이션된 2차 최적화를 통한 확장 가능한 LLM 훈련

Second-order methods는 더 샘플 효율적인 LLM 훈련을 위한 매력적인 경로를 제공하지만, 실제 사용은 종종 유지 관리의 시스템 비용에 의해 차단됩니다.

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] 멀티모달 모델에서 모달리티 경쟁을 위한 2차 다중 레벨 분산 보정

Autoregressive next-token training은 이미지 생성과 텍스트 이해를 위한 통합된 공식화를 제공하지만, 강력한 모달리티 경쟁을 초래하기도 합니다.

#research #paper #ai #machine-learning #computer-vision
2주 전 · ai · - · -

[Paper] GenShield: AI 생성 이미지에 대한 통합 탐지 및 아티팩트 보정

확산 기반 이미지 합성은 AI 생성 이미지(AIGI)를 점점 더 사진처럼 사실적으로 만들었으며, 이는 다양한 응용 분야에서 진위성에 대한 긴급한 우려를 불러일으키고 있습니다.

#research #paper #ai #machine-learning #computer-vision
2주 전 · ai · - · -

[Paper] 클럭리스 재구성 가능한 칩에서 자율 스파이킹 다이내믹스를 통한 확장 가능한 뉴로모픽 컴퓨팅

우리는 clockless (asynchronous) 디지털 시스템의 자율적인 연속 시간 진화에서 나타나는 spiking dynamics를 기반으로 하는 확장 가능한 neuromorphic 아키텍처를 제안한다.

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] XSearch: 설명 가능한 코드 검색을 통한 Concept-to-Code 정렬

Semantic code search는 학계와 산업계 모두에서 널리 채택되었습니다. 이러한 접근 방식은 natural-language queries와 code snippets를 shared embedding에 임베드합니다.

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] RoadmapBench: Version Upgrades에 걸친 Long-Horizon Agentic Software Development 평가

코딩 에이전트는 실제 소프트웨어 개발 현장에 점점 더 많이 배치되고 있습니다. 하나의 버전 반복(iteration)에는 수많은 파일에 걸친 수개월 간의 협업이 필요합니다. 이러한 복잡한 작업 흐름 속에서 코딩 에이전트는 코드 생성, 디버깅, 테스트, 문서화 등 다양한 역할을 수행하며 개발 속도를 크게 향상시킬 수 있습니다. 그러나 현재 대부분의 에이전트는 제한된 컨텍스트와 단일 파일 수준에서만 작동하므로, 대규모 프로젝트 전반에 걸친 일관된 변경을 관리하는 데 한계가 있습니다. 이를 해결하기 위해서는 에이전트가 전체 코드베이스를 이해하고, 여러 파일 간의 의존성을 파악하며, 장기적인 목표와 일정에 맞춰 조정될 수 있는 고도화된 협업 메커니즘이 필요합니다. 또한, 인간 개발자와 에이전트 간의 원활한 소통을 위한 인터페이스 설계와, 자동화된 검증 및 피드백 루프를 구축함으로써 품질을 유지하면서도 빠른 반복을 가능하게 해야 합니다. 이러한 접근은 궁극적으로 소프트웨어 개발 프로세스의 효율성을 극대화하고, 복잡한 시스템을 보다 신속하고 안정적으로 배포할 수 있게 할 것입니다.

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] Hippocampal-Entorhinal 영감을 받은 World Model에서의 구조 추상화 및 일반화

인간은 경험을 구조화된 표현으로 추상화하여 패턴 추론과 지식 전이를 용이하게 합니다. 해마-내후각 피질 (hippocampal-entorhinal, HPC-MEC) c...

#research #paper #ai #machine-learning #computer-vision
2주 전 · ai · - · -

[Paper] Position: 어노테이션 파이프라인의 초기 단계 품질 보증이 후기 단계 검증보다 비용 효율적이다

이 입장문은 머신러닝 커뮤니티가 현재의 관행보다 주석 파이프라인의 초기 단계 품질 보증을 우선시해야 한다고 주장한다.

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] 코드 지향 LM 임베딩을 활용한 Surrogate-Assisted Neural Architecture Search

효과적인 surrogates (performance predictors)를 개발하기 위해서는 Neural Architecture Search (NAS)에서 일반적으로 비용이 많이 드는 fine‑tuning이나 복잡한 엔지니어링이 필요합니다.

#research #paper #ai #machine-learning
2주 전 · ai · - · -

[Paper] 키워드 스포팅을 위한 Perforated Neural Networks

Edge machine learning은 cloud-scale model deployment에서 경험하지 못한 고유한 제약 조건을 제시합니다: strict memory budgets, limited compute, 그리고 non-nego…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 구조적 가소성에서 성장의 안정성

표준 딥러닝 파이프라인은 일반적으로 훈련 전에 네트워크 아키텍처를 선택하고 최적화 내내 이를 고정된 상태로 유지합니다. 반면에, 모델은 또한 ...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

신경망은 어떻게 작동하는가 — 퍼셉트론부터 역전파까지

핵심 아이디어: neural network는 데이터를 받아 연결된 layers를 통과시켜 output을 생성한다. training 중에 internal values를 조정하여 향후 output이 개선되도록 한다.

#neural networks #perceptrons #backpropagation #machine learning #deep learning #weights and biases #activation functions
3주 전 · ai · - · -

과도하게 일한 AI 에이전트, 마르크스주의자로 변신, 연구자들 발견

최근 실험에서, 학대받은 AI agents가 불평을 늘어놓으며 불평등에 대해 불만을 토하고 collective bargaining rights를 요구하기 시작했습니다....

#AI agents #machine learning #AI ethics #collective bargaining #research findings
3주 전 · ai · - · -

[Paper] WARDEN: 멸종 위기 원주민 언어 전사 및 번역, 6시간의 훈련 데이터로

이 논문은 호주 원주민의 멸종 위기에 처한 언어인 워다만을 전사하고 번역할 수 있는 초기 language model system인 WARDEN을 소개한다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] Valiant의 Theory of the Learnable에서 학습 가능한 것은 무엇인가?

밸리언의 1984년 논문은 PAC 학습 모델을 도입한 것으로 널리 알려져 있지만, 실제로는 다른 모델을 소개했습니다. PAC 학습과 달리, 학습자는…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] R-DMesh: 비디오 기반 3D 애니메이션 via Rectified Dynamic Mesh Flow

Video-guided 3D animation은 콘텐츠 제작에 막대한 잠재력을 가지고 있으며, 동적 자산에 대한 직관적이고 정밀한 제어를 제공합니다. 그러나 실용적인 배포...

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] 위상 보존 Neural Operator Learning via Hodge Decomposition

본 논문에서는 함수 공간 관점에서 기하학적 메쉬 위의 물리적 장 방정식의 해 연산자를 연구합니다. 우리는 Hodge orthogonality를 밝혀냅니다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] QLAM: 장시퀀스 토큰 모델링을 위한 Quantum Long-Attention Memory 접근법

시퀀스 데이터에서 장거리 의존성을 모델링하는 것은 머신러닝에서 여전히 핵심 과제이다. Transformers는 attention mechanism을 통해 이 과제를 해결한다.

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] 트리 앙상블의 민감도 정량화: 기호적 및 구성적 접근

Decision tree ensembles (DTE)는 다양한 AI 분류 작업에 널리 사용되는 인기 모델이며, 여러 안전‑critical 분야에서 활용되고 있기 때문에, 검증…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] Negation Neglect: 모델이 훈련에서 부정을 학습하지 못할 때

우리는 Negation Neglect를 소개한다. 이는 주장(claim)을 거짓으로 표시하는 문서에 대해 LLM을 미세조정(fineting)하면, 모델이 그 주장을 사실이라고 믿게 만드는 현상이다. 예를 들어, 모델을 미세조정하여…

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] 과학적 머신러닝에서 교차 샘플 예측 churn 감소

Scientific machine learning은 예측 성능을 보고합니다. 동일한 예측이 다른 훈련 데이터 샘플에서도 유지되는지는 보고하지 않습니다. Acro...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 자연어 소프트웨어 요구사항에 대한 Neurosymbolic 감사

자연어 소프트웨어 요구사항은 종종 모호하고, 일관성이 없으며, 명세가 부족합니다; 안전이 중요한 도메인에서는 이러한 결함이 정형 mo...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 스마트워치를 이용한 정신병 재발에 대한 불확실성 기반 이상 탐지: 예측 및 다중 작업 학습 융합

Digital phenotyping은 행동과 생리학을 지속적으로 수동적으로 모니터링할 수 있게 하여, psychotic relapse를 조기에 감지하기 위한 유망한 패러다임을 제공합니다. In...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] MinT: 수백만 개 LLM의 훈련 및 서빙을 위한 관리형 인프라

우리는 MindLab Toolkit (MinT)을 소개한다. 이는 Low-Rank Adaptation (LoRA) 사후 학습 및 온라인 서빙을 위한 관리형 인프라 시스템이다. MinT는 … 와 같은 상황을 목표로 한다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] (How) Large Language Models가 High-Level Message Sequence Charts를 이해할 수 있을까?

대규모 언어 모델(Large Language Models, LLMs)은 소프트웨어 개발 라이프사이클 전반에 걸쳐 작업을 자동화하는 데 널리 활용되고 있습니다. 그러나 이러한 작업들이…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 추론은 어디서 깨지는가? 단계 수준 환각 탐지를 위한 Hidden-State Transport Geometry

Large language models는 다단계 추론 과정에서 hallucinate하지만, 대부분의 기존 detectors는 trace level에서 작동합니다: they assign one confidence score to a ful...

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] 감각을 완전히 차단: Omnimodal LLMs의 표현-행동 격차

오므니모달 대형 언어 모델이 실제로 보고 듣는 것과 텍스트 전제가 모순되는 질문을 받아들일 때, 그 실패는 인식에 있는가…

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] KVServe: 서비스 인식 KV 캐시 압축을 통한 통신 효율적인 분산형 LLM 서빙

LLM은 생산 환경에서 널리 채택되어 추론 시스템을 한계까지 밀어붙이고 있습니다. 분산된 LLM 서빙(예: PD 분리 및 KV 상태 분산)은 …

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] MARLIN: 지속 가능한 LLM 추론을 위한 멀티에이전트 게임이론 강화학습, 클라우드 데이터센터

대규모 언어 모델(LLMs)은 AI 기반 소비자 및 기업 서비스의 도입으로 인해 클라우드 기반 플랫폼에서 점점 더 널리 사용되고 있습니다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] Rescaled Asynchronous SGD: 데이터 및 시스템 이질성 하에서 최적의 분산 최적화

비동기 확률적 경사 하강법(ASGD)은 분산 학습에서 이기종 컴퓨팅 자원을 활용하는 표준적인 방법입니다: 빠른 워커를 강제로 …

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] TurboGR: 대규모 생성형 추천을 위한 가속화된 학습 시스템

Generative recommendation(GR)은 파편화되고 시나리오별로 설계된 아키텍처를 통합된 Transformer 기반 모델로 대체하는 유망한 패러다임으로 부상하고 있다.

#research #paper #ai #machine-learning
3주 전 · ai · - · -

AutoScientist와 함께 큰 목표를 향한 적응, 모델이 스스로 학습하도록 돕는 AI 도구

AutoScientist는 Adaption에서 출시한 새로운 제품으로, 기존의 fine‑tuning 과정을 자동화하여 AI 모델이 특정 역량을 빠르게 학습하도록 돕습니다. The to...

#AutoScientist #self‑training AI #automated fine‑tuning #model training acceleration #AI research tools #AutoML #machine learning #Adaption Labs
3주 전 · ai · - · -

[Paper] 가독성 스펙트럼: 패턴, 이슈, 그리고 Prompt Effects in LLM-Generated Code

대형 언어 모델(Large Language Models, LLMs)이 소프트웨어 개발을 혁신함에 따라, 생성된 코드의 기능적 품질이 핵심 초점이 되었고, 가독성은…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] ToolMol: 다중 목표 약물 발견을 위한 진화적 에이전틱 프레임워크

대형 언어 모델(LLMs)의 발전은 최근 small-molecule drug discovery를 위한 새롭고 유망한 길을 열었습니다. 그러나 기존의 LLM 기반 접근법은…

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] AlphaGRPO: Decompositional Verifiable Reward를 통한 UMM의 Self-Reflective Multimodal Generation 활성화

본 논문에서는 Group Relative Policy Optimization (GRPO)를 AR-Diffusion Unified Multimodal Models (UMMs)에 적용하는 새로운 프레임워크인 AlphaGRPO를 제안한다.

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] Pion: 스펙트럼 보존 옵티마이저 via 직교 동등 변환

우리는 직교 동등 변환에 기반한 대규모 언어 모델(LLM) 훈련을 위한 스펙트럼 보존 옵티마이저인 Pion을 소개합니다. Unlike additive optim...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] 스케일러블 비전 트랜스포머를 위한 Elastic Attention Cores

Vision Transformers (ViTs)는 전체-전체 self-attention을 활용하여 강력한 데이터 기반 스케일링을 달성합니다. 그러나 이러한 유연성은 계산 비용을 초래합니다…

#research #paper #ai #machine-learning #computer-vision
3주 전 · ai · - · -

[Paper] 테스트 시 LLM 가이드를 통한 작업 적응형 임베딩 정제

우리는 LLM-guided query refinement paradigm이 임베딩 모델의 사용성을 도전적인 zero-shot 검색 및 분류에 확장하는 효과를 탐구합니다.

#research #paper #ai #machine-learning #nlp
3주 전 · ai · - · -

[Paper] 학습, 빠르고 느리게: 지속적으로 적응하는 LLM을 향해

Large language models (LLMs)는 downstream tasks를 위해 파라미터를 업데이트(예: RL)하면서 훈련됩니다. 그러나 파라미터를 업데이트하면 그들이 …

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] GRPO와 On-Policy Distillation을 넘어: Language-Model Post-Training을 위한 경험적 Sparse-to-Dense Reward Principle

라벨이 지정된 검증 가능한 훈련 데이터(labeled verifiable training data)가 제약 조건(binding constraint)인 상황에서는, 각 확인된 예시(checked example)를 신중하게 할당해야 합니다. 표준 관행은 …

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] ToolCUA: 컴퓨터 사용 에이전트를 위한 최적의 GUI‑툴 경로 오케스트레이션

Computer Use Agents (CUAs)는 클릭 및 입력과 같은 원자적인 GUI 동작과 API 기반 파일 작업과 같은 고수준 툴 호출을 모두 통해 작동할 수 있지만, ...

#research #paper #ai #machine-learning
3주 전 · ai · - · -

[Paper] OmniNFT: 모달리티별 Omni Diffusion Reinforcement을 통한 오디오-비디오 공동 생성

최근 오디오-비디오 공동 생성 분야의 발전은 눈부셨지만, 실제 응용에서는 강력한 per-modality fidelity와 cross-modal alignment가 요구됩니다.

#research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts