Source

arXiv

4528 posts from this source

정렬:

2개월 전 · ai · - · -

[Paper] LLM 터미널 역량 확장을 위한 데이터 엔지니어링

대규모 언어 모델의 terminal capabilities에 대한 최근의 급속한 진전에도 불구하고, 최첨단 terminal agents 뒤에 있는 training data strategies는 여전히…

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] 스무스 애그노스틱 학습을 위한 Statistical Query 하한

우리는 최근 ~cite{CKKMS24}에 의해 도입된 smoothed agnostic learning의 복잡성을 연구한다. 여기서 learner는 목표 …에서 가장 좋은 classifier와 경쟁한다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 왜 Pass@k 최적화가 Pass@1을 저하시킬 수 있는가: Prompt Interference in LLM Post-training

Pass@k는 수학적 추론, 코드 생성, 짧은 답변 추론 등을 포함한 검증 가능한 대규모 언어 모델 작업에 널리 사용되는 성능 지표입니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] Spa3R: 3D 시각적 추론을 위한 예측 공간 필드 모델링

Vision-Language Models (VLMs)는 뛰어난 2D 시각 이해를 보여주지만, 3D 공간을 이해하고 추론하는 능력—공간 인식의 핵심—은 아직 제한적이다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] Diffusion Duality, 제2장: $Ψ$-Samplers와 Efficient Curriculum

Uniform-state discrete diffusion models는 자체 교정 능력 덕분에 few-step generation 및 guidance에서 뛰어나며, autoregressive 모델보다 선호됩니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] Mask-HybridGNet: Graph 기반 분할과 픽셀 수준 감독에서 나타나는 해부학적 대응

그래프 기반 의료 영상 분할은 경계 그래프를 사용하여 해부학적 구조를 나타내며, 고정 토폴로지 랜드마크와 고유한 인구 수준…

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] XMorph: 설명 가능한 뇌종양 분석을 위한 LLM 지원 하이브리드 딥 인텔리전스

Deep learning은 자동 뇌종양 진단을 크게 향상시켰지만, 임상 적용은 interpretability와 computational constraint 때문에 여전히 제한적이다.

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] 단어를 통해 보기: Language Models로 시각 검색 품질 제어

텍스트-이미지 검색은 비전-언어 학습에서 기본적인 작업이지만, 실제 상황에서는 짧고 불명확한 사용자 질의 때문에 종종 어려움을 겪는다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 효율적인 계층적 Any-Angle 경로 계획 on Multi-Resolution 3D 그리드

Hierarchical, multi-resolution volumetric mapping 접근 방식은 대규모 및 복잡한 환경을 효율적으로 포착할 수 있기 때문에 널리 사용됩니다.

#path-planning #any-angle #multi-resolution #robotics #ROS
2개월 전 · ai · - · -

[Paper] NoRD: 데이터 효율적인 Vision-Language-Action 모델, 추론 없이 주행

Vision-Language-Action (VLA) 모델은 모듈식 파이프라인을 통합된 엔드투엔드 아키텍처로 대체함으로써 자율 주행을 발전시키고 있다. 그러나 현재 VLAs…

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] Sequential Counterfactual Inference for Temporal Clinical Data: Time Traveler Dilemma 해결

Counterfactual inference은(는) 임상의가 환자 결과에 대해 ‘what if’ 질문을 할 수 있게 해 주지만, 표준 방법은 특성 독립성과 동시성을 가정합니다…

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] PVminer: 환자 생성 데이터에서 환자 목소리를 감지하는 도메인 특화 도구

환자가 직접 생성한 텍스트인 secure messages, surveys, interviews 등은 patient voice (PV)의 풍부한 표현을 담고 있으며, 의사소통 행동을 반영한다...

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] 양만이 아니라, 어디서: Epistemic Uncertainty를 Per-Class Contributions로 분해

안전이 중요한 분류에서는 실패 비용이 종종 비대칭적이지만, Bayesian deep learning은 epistemic 불확실성을 단일 스칼라인 μ로 요약한다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] SELAUR: 불확실성 인식 보상을 통한 Self Evolving LLM Agent

Large language models (LLMs)은 점점 더 다단계 의사결정 에이전트로 배치되고 있으며, 효과적인 보상 설계는 학습을 안내하는 데 필수적입니다. Al...

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] 다중 GPU에서 Tensor Parallelism으로 State‑Space Models 확장

Selective state space models (SSMs)은 특히 long-context workloads에 대해 large language models의 강력한 백본으로 빠르게 부상하고 있습니다. Yet in deploymen...

#research #paper #ai #machine-learning
2개월 전 · devops · - · -

[Paper] ReviveMoE: 대규모 MoE LLM 추론 배포에서 하드웨어 장애에 대한 빠른 복구

LLM 배포가 더 많은 하드웨어에 걸쳐 확장됨에 따라 시스템 내 단일 실패가 발생할 확률이 크게 증가하고, 클라우드 운영자는 견고한 c...을 고려해야 합니다.

#research #paper #devops
2개월 전 · ai · - · -

[Paper] Prompt-Level Distillation: 효율적인 추론을 위한 Model Fine-Tuning의 Non-Parametric 대안

고급 추론은 일반적으로 Chain-of-Thought 프롬프트를 필요로 하는데, 이는 정확하지만 과도한 latency와 상당한 test-time inference 비용을 초래합니다.

#research #paper #ai #nlp
2개월 전 · software · - · -

[Paper] 양자 소프트웨어를 위한 분석 가능성 모델 검증: 일련의 실험

클래식과 양자 컴포넌트를 통합하는 hybrid software의 analyzability는 그 maintainability와 industrial adoption을 보장하는 핵심 요소이다.

#research #paper #software
2개월 전 · ai · - · -

[Paper] MIP Candy: 의료 영상 처리를 위한 모듈식 PyTorch 프레임워크

의료 영상 처리는 고차원 부피 데이터, 이질적인 파일 형식, 그리고 도메인 특화 훈련을 처리할 수 있는 특수 소프트웨어를 요구합니다.

#research #paper #ai #machine-learning #computer-vision
2개월 전 · devops · - · -

[Paper] LOCAL 알고리즘은 계산 가능할까?

‘표준’ LOCAL 모델에 대한 일반적인 정의는 한 가지 점에서 대충되고 심지어 자기 모순적이기까지 합니다: 노드가 임의의 …를 사용해 상태를 업데이트하는가?

#research #paper #devops
2개월 전 · ai · - · -

[Paper] Agentic이 주입된 소프트웨어 생태계로 향하여

AI agents의 역량을 software development에 완전히 활용하려면 software ecosystem 자체에 대한 재고가 필요합니다. 이를 위해 이 논문은 …

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] Airavat: 인터넷 측정을 위한 에이전시 프레임워크

Internet measurement은 두 가지 과제에 직면해 있습니다: 복잡한 분석은 도구들의 expert-level orchestration을 필요로 하지만, 구문적으로 올바른 implementations이라 하더라도 …

#research #paper #ai #machine-learning
2개월 전 · software · - · -

[Paper] 보이지 않는 코드베이스 도메인 데이터 합성 및 Code Graphs 기반 학습

새롭게 출시된 소프트웨어 프레임워크의 맥락에서, 대형 언어 모델(LLMs)은 종종 성능이 저조하고 환각 비율이 높게 나타납니다, 왜냐하면 그들은 n...

#research #paper #software
2개월 전 · software · - · -

[Paper] PackMonitor: 디코딩 시점 모니터링을 통한 제로 패키지 환각 방지

Large Language Models (LLMs)이 소프트웨어 개발 워크플로에 점점 더 통합됨에 따라, 그 신뢰성은 중요한 우려 사항이 되었습니다. 그러나, i...

#research #paper #software
2개월 전 · devops · - · -

[Paper] Lagom: 분산 LLM 훈련을 위한 통신 및 계산 겹침의 힘 발휘

communication과 computation을 겹쳐 수행하는 것은 distributed large‑model training에 필수적이지만, 특히 computation이 bottleneck이 될 때 이를 최적화하는 것은 어려운 과제이다.

#research #paper #devops
2개월 전 · software · - · -

[Paper] LLM 기반 시나리오 생성 파이프라인: 확장된 Scenic DSL을 활용한 자율주행 안전 검증

실제 사고 보고서는 텍스트 요약과 스케치를 결합한 것으로, 자율주행 시스템(ADS)의 시나리오 기반 테스트에 유용합니다. 그러나, ...

#research #paper #software
2개월 전 · devops · - · -

[Paper] 작업 스케줄링 효율성의 세분성 특성화

Task‑based runtime systems는 병렬 과학 응용 프로그램에 유연한 load balancing과 portability를 제공하지만, 그들의 strong scaling은 …에 매우 민감합니다.

#research #paper #devops
2개월 전 · ai · - · -

[Paper] 효율적인 Federated Learning을 위한 이질성 인식 클라이언트 선택 방법론

Federated Learning (FL)은 다수의 클라이언트가 협력하여 전역 Machine Learning (ML) 모델을 ...

#research #paper #ai #machine-learning
2개월 전 · devops · - · -

[Paper] Open Atomic Ethernet으로 FLP Impossibility Result 우회

Fischer--Lynch--Paterson (FLP) 불가능성 결과는 분산 컴퓨팅에서 가장 근본적인 부정적 결과 중 하나로 널리 인정받고 있다: 결정적인…

#research #paper #devops
2개월 전 · ai · - · -

[Paper] Mobile-O: 모바일 기기에서의 통합 멀티모달 이해 및 생성

통합 멀티모달 모델은 단일 아키텍처 내에서 시각적 콘텐츠를 이해하고 생성할 수 있습니다. 기존 모델들은 그러나 여전히 data-hungry하고 너무 …

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] tttLRM: 긴 컨텍스트와 자동회귀 3D 재구성을 위한 Test-Time Training

우리는 tttLRM이라는 새로운 대형 3D 재구성 모델을 제안한다. 이 모델은 Test-Time Training (TTT) 레이어를 활용하여 장기간 컨텍스트와 자동 회귀(autoregressive) 3D 재구성을 가능하게 한다.

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] Skill-Inject: 에이전트의 Skill 파일 공격에 대한 취약성 측정

LLM 에이전트는 코드 실행, 도구, 그리고 최근에 도입된 에이전트 스킬 기능에 의해 빠르게 진화하고 있습니다. 스킬은 사용자가 LLM 애플리케이션을 확장할 수 있게 합니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] JUCAL: 분류 작업에서 Aleatoric와 Epistemic 불확실성을 공동 보정

우리는 훈련된 분류기 앙상블에 대한 사후 보정 불확실성을 연구한다. 구체적으로, 우리는 aleatoric(라벨 노이즈)과 epistemic(모델) 불확실성을 모두 고려한다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 시뮬레이션-레디 클러터드 씬 추정 via Physics-aware Joint Shape and Pose Optimization

실제 세계 관측으로부터 시뮬레이션 준비된 장면을 추정하는 것은 하위 계획 및 정책 학습 작업에 필수적입니다. 안타깝게도 기존 방법들은 …

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] 부분 관측 평균장 게임을 위한 재귀 구조 정책 그래디언트

Mean Field Games (MFGs)은 대규모 인구 모델에서 상호작용을 모델링하기 위한 원칙적인 프레임워크를 제공합니다: 규모가 커짐에 따라 인구 동역학은 결정론적으로 변합니다,…

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] Large Language Models는 데이터 시각화 규칙을 이해할까?

Data visualization 규칙은 디자인과 인지에 대한 수십 년간의 연구에서 도출된 것으로, 신뢰할 수 있는 차트 커뮤니케이션을 보장합니다. 이전 연구에서는 대규모…

#research #paper #ai #computer-vision
2개월 전 · ai · - · -

[Paper] KNIGHT: 지식 그래프 기반 다중 선택형 질문 생성 및 적응형 난이도 보정

대형 언어 모델(LLMs)의 부상과 함께, 이들은 Retrieval‑Augmented Generation(RAG)과 같은 응용 분야에서 중요한 역할을 하게 되었습니다. 그러나 이러한 …

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] 적대적 데이터와 사용자 속임수 하에서 역학적 동역학 모델링

Epidemiological models는 vaccination status, mask usage, social distancing adherence와 같은 self-reported 행동 데이터를 점점 더 많이 활용하여 질병 확산을 예측한다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] LAD: 추론을 위한 Learning Advantage Distribution

현재 대규모 모델 추론을 위한 강화 학습(reinforcement learning) 목표는 주로 기대 보상(expected rewards)을 최대화하는 데 초점을 맞추고 있습니다. 이 패러다임은 도메인에 과적합될 수 있습니다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 추론할 것인가, 말 것인가: 의료 질문 응답에서 선택적 Chain-of-Thought

목표: 불필요한 추론을 피하면서 대형 언어 모델(LLMs)을 활용한 의료 질문 응답(MedQA)의 효율성을 향상시키는 것.

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] NanoKnow: 당신의 Language Model이 무엇을 알고 있는지 아는 방법

대형 언어 모델(LLMs)은 어떻게 자신이 아는 것을 알까요? 이 질문에 답하는 것은 사전 학습 데이터가 종종 ‘블랙 박스’—즉, 알 수 없는 형태이기 때문에 어려웠습니다.

#research #paper #ai #machine-learning #nlp
2개월 전 · ai · - · -

[Paper] NovaPlan: 제로샷 장기 조작을 위한 폐쇄 루프 비디오 언어 계획

긴 시간 범위의 작업을 해결하려면 로봇이 고수준 의미 추론과 저수준 물리적 상호작용을 통합해야 합니다. Vision-language models (VLMs) ...

#research #paper #ai #machine-learning #computer-vision
2개월 전 · ai · - · -

[Paper] ReSyn: 자율적으로 확장하는 합성 환경을 위한 추론 모델

검증 가능한 보상을 이용한 강화 학습(RLVR)은 감독을 활용하여 추론 언어 모델(RLMs)을 훈련시키는 유망한 접근법으로 떠오르고 있다.

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 신뢰 가능한 Abstention under Adversarial Injections: Tight Lower Bounds와 New Upper Bounds

우리는 [Goel et al. 2017]에서 소개한 적대적 주입 모델에서의 온라인 학습을 연구한다. 여기서 라벨이 붙은 예시들의 스트림은 주로 i.i.d. 방식으로 추출된다…

#research #paper #ai #machine-learning
2개월 전 · ai · - · -

[Paper] 주석 병목 현상을 초월하여: AI 기반 생물학 및 의학에서의 발견

전문가 주석에 대한 의존은 오랫동안 인공지능을 생물의학에 적용하는 데 있어 주요 속도 제한 단계였습니다. While supe...

#research #paper #ai #machine-learning #computer-vision
2개월 전 · devops · - · -

[Paper] Pre-quantization 기반 Scientific Data Compressors에서 Quantization-aware Interpolation을 이용한 아티팩트 완화

오류 제한 손실 압축은 오늘날 고성능 컴퓨팅에서 급증하는 과학 데이터 양을 해결하기 위한 유망한 방법으로 여겨져 왔습니다.

#research #paper #devops
2개월 전 · ai · - · -

[Paper] 검색된 컨텍스트가 RAG의 내부 표현을 형성하는 방법

Retrieval-augmented generation (RAG)은 외부에서 검색된 문서에 기반해 생성 과정을 조건화함으로써 대형 언어 모델(LLMs)을 향상시키지만, 검색의 효과는…

#research #paper #ai #nlp
2개월 전 · ai · - · -

[Paper] StructXLIP: 비전-언어 모델을 멀티모달 구조적 단서로 강화

에지 기반 표현은 시각적 이해를 위한 기본적인 단서이며, 초기 시각 연구에 뿌리를 두고 오늘날에도 여전히 중심적인 원리입니다. 우리는 이…

#research #paper #ai #machine-learning #computer-vision

Newer posts

Older posts