Source

arXiv

4526 posts from this source

정렬:

1개월 전 · ai · - · -

[Paper] DVD: 생성 사전이 적용된 결정론적 비디오 깊이 추정

기존 비디오 깊이 추정은 근본적인 트레이드오프에 직면합니다: 생성 모델은 확률적 기하학적 환각과 스케일 드리프트에 시달리는 반면, discrimi...

#research #paper #ai #computer-vision
1개월 전 · ai · - · -

[Paper] SciMDR: 벤치마킹 및 과학적 멀티모달 문서 추론 향상

과학적 멀티모달 문서 추론 데이터셋을 구축하는 것은 foundation model 훈련을 위해 규모(scale), 충실도(faithfulness), 현실성(realism) 사이의 내재된 트레이드오프를 포함한다.

#research #paper #ai #machine-learning #nlp #computer-vision
1개월 전 · ai · - · -

[Paper] 특징 매칭, 토큰이 아닌: 언어 모델의 Energy-Based Fine-Tuning

Cross-entropy (CE) 훈련은 언어 모델에 대해 밀도 높고 확장 가능한 감독을 제공하지만, 교사 강제(teacher forcing) 하에서 다음 토큰 예측을 최적화할 뿐이다.

#research #paper #ai #machine-learning
1개월 전 · ai · - · -

[Paper] 비검증 LLM 사후 훈련에서 Reasoning LLMs-as-Judges 검토

추론 LLMs-as-Judges는 inference-time scaling의 혜택을 받을 수 있으며, 추론 모델의 성공을 non‑verifiable 분야에 확장하는 유망한 경로를 제공합니다.

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] 통합된 예측 및 생성 인텔리전스를 위한 기본 요소로서의 분리 가능한 신경 아키텍처

물리학, 언어 및 지각 전반에 걸친 지능 시스템은 종종 factorisable structure를 보이지만, 일반적으로는 monolithic neural architectures로 모델링됩니다 ...

#research #paper #ai #machine-learning
1개월 전 · ai · - · -

[Paper] STAMP: 텍스트 프라이버시를 위한 선택적 작업 인식 메커니즘

우리는 STAMP (Selective Task-Aware Mechanism for Text Privacy)를 제시한다. 이는 향상된 프라이버시‑유틸리티를 달성하는 새로운 task‑aware 텍스트 프라이버타이제이션 프레임워크이다.

#research #paper #ai #machine-learning
1개월 전 · ai · - · -

[Paper] 학습된 충돌을 통한 점진적 신경망 검증

Neural network verification은 종종 더 큰 분석 절차의 핵심 구성 요소로 사용되며, 이 절차는 밀접하게 관련된 verification query들의 연속을 생성한다.

#research #paper #ai #machine-learning
1개월 전 · ai · - · -

[Paper] 잠재 플래닝을 위한 시간 직선화

좋은 표현을 학습하는 것은 world models를 활용한 latent planning에 필수적입니다. pretrained visual encoders는 강력한 semantic visual features를 생성하지만, 그들은...

#research #paper #ai #machine-learning
1개월 전 · ai · - · -

[Paper] 인공지능 에이전트를 위한 보안 고려사항

이 기사(Perplexity가 NIST/CAISI의 2025-0035 정보 요청에 대한 답변을 약간 수정한 버전)는 우리의 관찰과 권고 사항을 자세히 다룹니다.

#research #paper #ai #machine-learning
1개월 전 · ai · - · -

[Paper] Neural Thickets: 다양한 작업 전문가가 사전 학습된 가중치 주변에 밀집한다

프리트레이닝은 일반적으로 추가적인 반복 적응을 위한 시작점으로 간주되는 학습된 파라미터 벡터를 생성합니다. 이 작업에서 우리는 대신에 …

#research #paper #ai #machine-learning
1개월 전 · ai · - · -

[Paper] LLM 기반 학제간 영감을 통한 과학적 창의성 촉진

학제간 연구가 더 크고 장기적인 영향을 가져오지만, 대부분의 연구는 여전히 단일 분야 학술 사일로에 국한되어 있습니다. 최근 AI 기반 접근법...

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] CEGAR 기반 Object Packing 및 Scheduling을 위한 순차 3D 프린팅 해결 전략 포트폴리오

수십 년 전에는 슈퍼컴퓨터에서만 사용할 수 있었던 컴퓨팅 파워, 특히 그들의 parallelism이 현재는 표준 personal computer에서도 이용 가능합니다.

#research #paper #ai #machine-learning
1개월 전 · ai · - · -

[Paper] RDNet: 영역 비율 인식 동적 적응형 Salient Object Detection 네트워크 (광학 원격 탐사 이미지)

원격 감지 이미지에서의 Salient object detection (SOD)은 객체 크기의 큰 변동과 self-att의 계산 비용 등으로 인해 상당한 도전에 직면하고 있다.

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai · - · -

[Paper] WORKSWORLD: 분산 파이프라인 워크플로의 통합 수치 계획 및 스케줄링을 위한 도메인

이 연구는 분산 데이터 파이프라인(또는 워크플로)의 자동화된 계획 및 스케줄링을 추구합니다. 우리는 일반적인 워크플로와 리소스 그래프 표현을 개발합니다.

#research #paper #ai #machine-learning
1개월 전 · ai · - · -

[Paper] IndexCache: Cross-Layer Index Reuse를 통한 Sparse Attention 가속화

Long-context agentic workflows는 대형 언어 모델의 정의적인 사용 사례로 부상했으며, attention efficiency는 추론 속도와 …에 있어 중요합니다.

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] 폴란드어 이해를 위한 Long-Context Encoder Models

디코더 전용 Large Language Models(LLMs)이 최근 NLP 분야를 장악하고 있는 반면, 인코더 전용 아키텍처는 비용 효율적이고 파라미터 효율적인…

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] Strategic Navigation or Stochastic Search? 에이전트와 인간이 문서 컬렉션을 어떻게 추론하는가

멀티모달 에이전트는 복잡한 문서 중심 워크플로우를 자동화하는 유망한 경로를 제공합니다. 그러나 여전히 중요한 질문이 남아 있습니다: 이러한 에이전트가 genui...

#research #paper #ai #machine-learning #nlp
1개월 전 · ai · - · -

[Paper] QAQ: 양방향 의미 일관성을 통한 고품질 합성 코드 지시문 선택

Synthetic data는 코드 생성 모델을 훈련시키는 데 필수적이 되었지만, 감지하기 어려운 상당한 noise와 hallucinations을 도입합니다…

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] LifeSim: 장기 사용자 생활 시뮬레이터를 활용한 개인화 어시스턴트 평가

대규모 언어 모델(LLMs)의 급속한 발전은 범용 AI 어시스턴트에 대한 진전을 가속화했습니다. 그러나 기존의 개인화된 어시스턴트에 대한 벤치마크는...

#research #paper #ai #nlp
1개월 전 · devops · - · -

[Paper] EBRAINS를 위한 HPC 컨테이너: 휴대 가능한 교차 도메인 소프트웨어 환경을 향하여

다양한 HPC 사이트에 걸쳐 복잡하고 분산된 과학 워크플로를 배포하는 것은 종종 사이트별 종속성 및 복잡한 빌드 환경 때문에 방해받습니다. Thi...

#research #paper #devops
1개월 전 · ai · - · -

[Paper] Topological DeepONets와 Chen‑Chen 연산자 근사 정리의 일반화

Deep Operator Networks (DeepONets)는 함수 공간 사이에서 작용하는 비선형 연산자를 근사하기 위한 branch‑trunk 신경망 구조를 제공합니다. In the class...

#research #paper #ai #machine-learning
1개월 전 · ai · - · -

[Paper] SNAP-V: 작은 규모 스파이킹 뉴럴 네트워크를 위한 구성 가능한 뉴로모픽 가속을 갖춘 RISC‑V SoC

Spiking Neural Networks (SNNs)는 낮은 전력 소비와 계산 효율성 때문에 엣지 컴퓨팅에서 큰 주목을 받고 있습니다. 그러나, exi...

#research #paper #ai
1개월 전 · software · - · -

[Paper] QUARE: 요구사항 엔지니어링에서 품질 속성 균형을 위한 멀티에이전트 협상

요구사항 공학(Requirements engineering, RE)은 소프트웨어 성공에 필수적이지만, 자동화는 여전히 어려운 과제입니다. 왜냐하면 여러 가지, 종종 상충되는 품질 속성을 만족시켜야 하기 때문입니다...

#research #paper #software
1개월 전 · ai · - · -

[Paper] AI 에이전트를 위한 사회적, 법적, 윤리적, 공감적 및 문화적 규범의 운용화

AI agents가 의료 및 law enforcement와 같은 high‑stakes domains에서 점점 더 많이 사용됨에 따라, 그들의 행동을 social, legal, ethical, empathetic …와 일치시키는 것이 중요해지고 있다.

#research #paper #ai #machine-learning
1개월 전 · devops · - · -

[Paper] Carnot Bound: 대역폭 효율적인 합의의 한계와 가능성

State Machine Replication (SMR)에서 리더 기반 프로토콜의 경우, 리더의 송신 대역폭이 자연스러운 처리량 병목 현상이 됩니다. Erasure coding은 이를 완화할 수 있습니다.

#research #paper #devops
1개월 전 · ai · - · -

[Paper] Stable Spike: 스파이킹 신경망을 위한 비트 단위 AND 연산을 통한 이중 일관성 최적화

비록 스파이킹 뉴럴 네트워크(SNN)의 temporal spike dynamics가 low‑power temporal pattern capture capabilities를 가능하게 하지만, 이들은 또한 내재된 불일치를 초래한다.

#research #paper #ai #machine-learning
1개월 전 · devops · - · -

[Paper] Subtime: 가역적 정보 교환과 고전적 시간의 출현

우리는 서브타임(subtime)이라는 개념을 형식화한다—얽힌 시스템 내에서 정보 교환이 가역적으로 이루어지는 방식—그리고 고전적 시간(classical time)이 비대칭적으로 나타나는 방식을 보여준다.

#research #paper #devops
1개월 전 · ai · - · -

[Paper] 양자역학적 프레임워크를 이용한 양자화 기반 최적화: Gradient flow에서 Schroedinger equation까지

이 연구는 quantization-based optimization algorithms를 분석하기 위한 quantum mechanical framework를 제시한다. quantization-based search의 sampling process는 …

#research #paper #ai
1개월 전 · devops · - · -

[Paper] NCCLbpf: 검증된, 조합 가능한 정책 실행을 위한 GPU 집합 통신

NCCL은 대규모 분산 학습에서 집합 GPU 통신의 사실상 표준이며, 런타임 동작을 맞춤화하기 위해 플러그인에 크게 의존합니다. Ho...

#research #paper #devops
1개월 전 · ai · - · -

[Paper] iSWE Agent를 사용한 Java 코드 저장소 문제 해결

코드 저장소의 이슈를 해결하는 것은 소프트웨어 엔지니어링에서 중요한 부분입니다. 다양한 최신 시스템은 대형 언어 모델을 사용하여 이슈를 자동으로 해결합니다…

#research #paper #ai #machine-learning
1개월 전 · software · - · -

[Paper] Synthesis-in-the-Loop 평가: RTL 생성용 LLM의 품질, 신뢰성 및 실패 모드

RTL 생성은 단순한 소프트웨어 코드 합성보다 더 많은 것을 요구합니다: 설계는 구문적으로 유효하고, synthesizable하며, 기능적으로 정확하고, hardware-efficient해야 합니다. Exis...

#research #paper #software
1개월 전 · software · - · -

[Paper] 패치 오버피팅 감지 기법의 실용적 한계 밝히기

Automated Program Repair (APR)은 개발자가 디버깅에 소비하는 시간을 줄여 주어, 소프트웨어 개발의 다른 측면에 집중할 수 있게 합니다. Automatically ge...

#research #paper #software
1개월 전 · software · - · -

[Paper] ExecVerify: 화이트박스 RL과 검증 가능한 단계별 보상을 통한 코드 실행 추론

코드 LLM은 특히 작은 모델에서 코드 실행 추론에 여전히 어려움을 겪고 있습니다. 기존 방법은 교사 생성(supervised fine-tuning, SFT)을 기반으로 합니다.

#research #paper #software
1개월 전 · ai · - · -

[Paper] V2M-Zero: Zero-Pair 시간 정렬 Video-to-Music 생성

비디오 이벤트와 시간적으로 일치하는 음악을 생성하는 것은 기존 텍스트-투-뮤직 모델들에 있어 어려운 과제이며, 이 모델들은 세밀한 temporal control이 부족합니다. 우리는 ...

#research #paper #ai #machine-learning #computer-vision
1개월 전 · ai · - · -

[Paper] 합의의 환상 너머: 표면 휴리스틱에서 지식 기반 평가로 LLM-as-a-Judge

LLM-as-a-judge 패러다임은 중요한 가정에 의존한다. 즉, 높은 inter-evaluator agreement가 신뢰할 수 있고 객관적인 평가를 의미한다는 것이다. 우리는 …

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] LLM을 활용한 Pseudo-Relevance Feedback에 대한 체계적 연구

대형 언어 모델(LLMs)을 기반으로 한 의사 관련성 피드백(Pseudo-relevance feedback, PRF) 방법은 두 가지 핵심 설계 차원에 따라 조직될 수 있다: 피드백 소스는 …

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] RCTs & Human Uplift Studies: 최첨단 AI 평가를 위한 방법론적 과제와 실용적 해결책

인간 향상 연구 – 또는 AI가 인간 성과에 미치는 영향을 현 상태와 비교하여 측정하는 연구로, 일반적으로 무작위 대조 실험(RCT) 방법을 사용합니다.

#research #paper #ai #machine-learning
1개월 전 · ai · - · -

[Paper] 너무 선명해서 현실 같지 않은가? 벤치마킹 및 보정 Generative Color Fidelity

최근 텍스트‑투‑이미지 (T2I) 생성 분야의 발전으로 시각적 품질이 크게 향상되었지만, 실제 사진처럼 시각적으로 진짜 같은 이미지를 생성하는 것은 여전히 어려운 문제입니다.

#research #paper #ai #computer-vision
1개월 전 · ai · - · -

[Paper] MLP의 이산적 매력: Transformer 피드포워드 레이어에서 연속 신호의 이진 라우팅

우리는 MLP 레이어가 transformer 언어 모델에서 continuous signals를 binary routing한다는 것을 보여준다: 토큰이 nonlinear processing이 필요한지 여부에 대한 결정.

#research #paper #ai #machine-learning
1개월 전 · devops · - · -

[Paper] Quantum-Centric 슈퍼컴퓨터의 레퍼런스 아키텍처

양자 컴퓨터는 무차별적인 고전적 접근법을 넘어 양자 시스템을 시뮬레이션하는 데 유용성을 입증했습니다. 커뮤니티가 이러한 시연을 기반으로…

#research #paper #devops
1개월 전 · devops · - · -

[Paper] Quantum-Centric 슈퍼컴퓨터의 레퍼런스 아키텍처

Quantum computers는 brute‑force classical approaches를 넘어 quantum systems를 시뮬레이션하는 데 유용성을 입증했습니다. 커뮤니티가 이러한 demonstratio를 기반으로 구축함에 따라…

#research #paper #devops
1개월 전 · ai · - · -

[Paper] TOSSS: CVE 기반 소프트웨어 보안 벤치마크 for Large Language Models

그들의 능력이 향상됨에 따라, Large Language Models (LLMs)은 이제 많은 산업 분야에서 사용되고 있습니다. 이들은 소프트웨어 엔지니어와 s...

#research #paper #ai #machine-learning #nlp
1개월 전 · software · - · -

[Paper] STADA: 자율주행 에이전트를 위한 명세 기반 테스트

Simulation-based testing은 실제 환경에 배치하기 전에 autonomous driving agents를 검증하는 표준적인 접근 방식이 되었습니다. 고품질 validation campaign…

#research #paper #software
1개월 전 · ai · - · -

[Paper] LLM2Vec-Gen: 대형 언어 모델에서 생성적 임베딩

LLM 기반 텍스트 임베더는 일반적으로 입력의 의미적 내용을 인코딩합니다. 그러나 임베딩 작업은 다양한 입력을 유사한 출력으로 매핑해야 합니다. 전형적으로...

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] GLM-OCR 기술 보고서

GLM-OCR은 실제 문서 이해를 위해 설계된 효율적인 0.9B-parameter 컴팩트 멀티모달 모델입니다. 이는 0.4B-parameter CogViT 비주얼 인코더를 결합하여 ...

#research #paper #ai #nlp
1개월 전 · ai · - · -

[Paper] 이미지에서 단어로: 블랙박스 교사로부터 Language Models에 대한 효율적인 Cross-Modal Knowledge Distillation

Knowledge distillation (KD) 방법은 대규모 사전 학습 언어 모델을 더 작은 모델로 압축하는 데 핵심적이며, 계산 효율성을 유지하면서 ...

#research #paper #ai #nlp
1개월 전 · ai · - · -

[논문] SiDiaC-v.2.0: Sinhala Diachronic Corpus Version 2.0

SiDiaC‑v.2.0은 현재까지 가장 방대한 포괄적인 Sinhala Diachronic Corpus로, 출판 연도 기준으로 1800 CE부터 1955 CE까지의 기간을 포괄하며, 그리고…

#research #paper #ai #nlp
1개월 전 · devops · - · -

[Paper] 서버리스 플랫폼에서 이상을 식별하기 위한 위상 분석

서버리스 플랫폼에서의 정보 흐름은 복잡하고 비보존적입니다. 이는 독립적으로 배포된 함수들이 **under t...** 하에서 어떻게 상호 작용하는지에 직접적인 결과입니다.

#research #paper #devops

Newer posts

Older posts