Source

arXiv

4647 posts from this source

정렬:

4개월 전 · ai · - · -

[Paper] TimeLens: 멀티모달 LLMs와 함께하는 Video Temporal Grounding 재고찰

이 논문은 새로운 방법을 제시하는 것이 아니라, 비디오 시간적 그라운딩(VTG)을 위한 직관적이고 점진적이며 필수적인 베이스라인을 설정합니다.

#research #paper #ai #machine-learning #nlp #computer-vision
4개월 전 · ai · - · -

[Paper] 시각 토크나이제이션 및 생성을 위한 Spherical Leech Quantization

Non-parametric quantization은 파라미터 효율성과 대규모 코드북에 대한 확장성 때문에 많은 주목을 받아왔습니다. 이 논문에서는 ...

#research #paper #ai #machine-learning #computer-vision
4개월 전 · ai · - · -

[Paper] CRISP: 접촉 기반 Real2Sim from Monocular Video with Planar Scene Primitives

우리는 CRISP를 소개한다. 이 방법은 단안 비디오에서 시뮬레이션 가능한 인간 동작과 장면 기하학을 복원한다. 인간‑장면 공동 재구성에 대한 이전 연구는 reli...

#research #paper #ai #computer-vision
4개월 전 · ai · - · -

[Paper] 범용 추론 모델

Universal transformers (UTs)는 ARC-AGI와 Sudoku와 같은 복잡한 추론 작업에 널리 사용되어 왔지만, 그들의 성능 향상의 구체적인 원천은 r...

#research #paper #ai #machine-learning
4개월 전 · ai · - · -

[Paper] 네이티브 및 콤팩트 구조화된 Latents for 3D Generation

최근 3D 생성 모델링의 발전으로 생성 현실감이 크게 향상되었지만, 이 분야는 여전히 기존 표현 방식에 의해 제약을 받고 있습니다, w...

#research #paper #ai #machine-learning #computer-vision
4개월 전 · ai · - · -

[Paper] MMGR: 멀티모달 생성적 추론

비디오 파운데이션 모델은 시각적으로 현실적이고 시간적으로 일관된 콘텐츠를 생성하지만, world simulators로서의 신뢰성은 그것들이 p를 포착하는지 여부에 달려 있습니다.

#research #paper #ai #nlp #computer-vision
4개월 전 · ai · - · -

[Paper] CHIP: Hindsight Perturbation을 통한 Humanoid Control을 위한 Adaptive Compliance

최근 휴머노이드 로봇의 발전으로 백플리핑, 달리기, 기어가기 등 민첩한 locomotion 기술이 가능해졌다. 그러나 아직도 휴머노이드에게는 도전적인 과제로 남아 있다.

#research #paper #ai #machine-learning
4개월 전 · ai · - · -

[Paper] Spoken DialogSum: 감정이 풍부한 대화 데이터셋 for Spoken Dialogue Summarization

최근 audio language models는 긴 대화를 따라갈 수 있습니다. 그러나 emotion-aware 또는 spoken dialogue summarization에 대한 연구는 데이터 부족으로 제한됩니다.

#research #paper #ai #machine-learning #nlp
4개월 전 · ai · - · -

[Paper] 클리핑된 Stochastic First-Order Methods의 Bias-Variance Trade-off: Bounded Variance에서 Infinite Mean까지

확률적 최적화는 현대 머신러닝의 기본이다. 최근 연구는 경량‑t…

#research #paper #ai #machine-learning
4개월 전 · ai · - · -

[Paper] 병원에서 환자 악화를 위한 Early Warning Index

병원은 이질적인 임상 및 운영 데이터의 증가하는 양을 활용하여 중요한 사건을 효과적으로 예측할 수 있는 자동화된 시스템이 부족합니다. 초기 아이...

#research #paper #ai #machine-learning
4개월 전 · ai · - · -

[Paper] 빠르고 정확한 Causal Parallel Decoding using Jacobi Forcing

멀티 토큰 생성은 트랜스포머 기반 대형 모델 추론을 가속화하기 위한 유망한 패러다임으로 부상했습니다. 최근 연구들은 주로 디퓨전을 탐구하고 있습니다.

#research #paper #ai #nlp
4개월 전 · ai · - · -

[Paper] VASA-3D: 단일 이미지에서 생성된 실감 나는 Audio-Driven Gaussian Head Avatars

우리는 VASA-3D, audio‑driven, single‑shot 3D head avatar generator를 제안한다. 이 연구는 두 가지 주요 과제에 도전한다: 미묘한 표정 디테일을 포착하는 것.

#research #paper #ai #machine-learning #computer-vision
4개월 전 · ai · - · -

[Paper] Lipschitz 연속성 및 단조성을 넘어: Echo State Networks에서 프랙탈 및 혼돈 활성 함수

현대의 reservoir computing은 부드럽고 전역적으로 Lipschitz 연속인 activation functions에 크게 의존하여 방위, 재난 대응 분야에서의 적용을 제한한다.

#research #paper #ai #machine-learning
4개월 전 · software · - · -

[Paper] 지속 가능한 AI를 위한 LLM Chatbots의 대화 규범 재고

LLM 기반 챗봇은 기술, 교육, 분석 분야에서 핵심 인터페이스가 되었으며, 코드 추론, 문제 해결 등과 같은 작업을 지원합니다.

#research #paper #software
4개월 전 · ai · - · -

[Paper] ART: 관절형 재구성 트랜스포머

우리는 ART, Articulated Reconstruction Transformer를 소개한다 — category-agnostic, feed-forward 모델로, 단지 …만으로 완전한 3D 관절형 객체를 복원한다.

#research #paper #ai #computer-vision
4개월 전 · ai · - · -

[Paper] EVOLVE-VLA: Vision‑Language‑Action 모델을 위한 환경 피드백 기반 테스트 시 훈련

진정으로 적응적인 embodied intelligence를 달성하려면, 정적인 static demonstrations만을 모방하는 것이 아니라 environment를 통해 지속적으로 개선하는 agents가 필요합니다.

#research #paper #ai #computer-vision
4개월 전 · ai · - · -

[Paper] Visual Sentiment Analysis 향상을 위한 Semiotic Isotopy 기반 Dataset Construction

Visual Sentiment Analysis (VSA)는 감정적으로 두드러지는 이미지들의 방대한 다양성과 충분한 데이터를 확보하는 데 내재된 어려움 때문에 도전적인 작업입니다.

#research #paper #ai #computer-vision
4개월 전 · ai · - · -

[Paper] gridfm-datakit-v1: 확장 가능하고 현실적인 Power Flow 및 Optimal Power Flow 데이터 생성을 위한 Python 라이브러리

우리는 gridfm-datakit-v1이라는 Python 라이브러리를 소개합니다. 이 라이브러리는 현실적이고 다양한 Power Flow (PF) 및 Optimal Power Flow (OPF) 데이터셋을 생성하여 Machine Learning 모델을 훈련하는 데 사용됩니다.

#research #paper #ai #machine-learning
4개월 전 · ai · - · -

[Paper] 긴 형태 음향 인코딩을 이용한 세그멘탈 어텐션 디코딩

우리는 attention-based encoder-decoder (AED) 모델이 장시간 acoustic encodings와 근본적으로 호환되지 않는 문제를 다룹니다. AED 모델은 분할된 발화에 대해 학습됩니다.

#research #paper #ai #nlp
4개월 전 · ai · - · -

[Paper] TiME: 효율적인 NLP 파이프라인을 위한 Tiny Monolingual Encoders

오늘날 언어 모델에 대한 많은 연구는 대규모 범용 모델에 초점을 맞추고 있습니다. 그러나 많은 NLP 파이프라인은 잘 정의된, sm...

#research #paper #ai #machine-learning #nlp
4개월 전 · ai · - · -

[Paper] 다기관 벤치마크: HE‑염색 전 슬라이드 이미지에서 림프종 아형 구분을 위한 Multiple Instance Learning 모델

시기적절하고 정확한 림프종 진단은 암 치료를 안내하는 데 필수적입니다. 표준 진단 관행은 hematoxylin and eosin (HE) 염색된 전체...

#research #paper #ai #machine-learning #computer-vision
4개월 전 · ai · - · -

[Paper] MuseCPBench: 음악 컨텍스트 보존을 통한 음악 편집 방법에 대한 실증 연구

음악 편집은 현대 음악 제작에서 중요한 역할을 하며, 영화, 방송, 게임 개발 등에 적용됩니다. 최근 Music generation 분야의 발전은 …

#research #paper #ai #machine-learning
4개월 전 · devops · - · -

[Paper] PruneX: 구조화된 프루닝을 활용한 분산 CNN 학습을 위한 계층적 통신 효율적인 시스템

Inter-node communication bandwidth는 다중 노드 GPU 클러스터에서 대규모 distributed training을 점점 더 제한하고 있습니다. While compact models는 궁극적인 deployment…

#research #paper #devops
4개월 전 · ai · - · -

[Paper] JMMMU-Pro: 이미지 기반 일본어 다학문 다중모달 이해 벤치마크 via Vibe Benchmark Construction

이 논문은 이미지 기반 일본어 다학문 다중모달 이해 벤치마크인 JMMMU‑Pro와 확장 가능한 Vibe Benchmark Construction을 소개한다, ...

#research #paper #ai #machine-learning #nlp #computer-vision
4개월 전 · ai · - · -

[Paper] ParaFormer: 일반화된 PageRank 그래프 트랜스포머를 이용한 그래프 표현 학습

Graph Transformers (GTs)는 모든 쌍이 연결되는 특성을 활용하여 전역 정보를 효과적으로 포착하는 유망한 그래프 학습 도구로 부상했습니다.

#research #paper #ai #machine-learning
4개월 전 · ai · - · -

[Paper] 모델 기반 강화 학습 in Discrete-Action Non-Markovian Reward Decision Processes

많은 실용적인 decision-making 문제는 원하는 속성을 가진 상태에 도달하는 것이 아니라 시스템 전체 history에 의존하는 작업을 포함합니다.

#research #paper #ai #machine-learning
4개월 전 · software · - · -

[Paper] MoT: 모델 기반 Low-Code 접근 방식으로 Cloud-of-Things 애플리케이션 개발 간소화

클라우드 컴퓨팅과 사물인터넷(IoT)의 통합은 확장 가능하고 지능형 시스템에 필수적입니다. 그러나 클라우드‑오브‑띵스(CoT) ap...

#research #paper #software
4개월 전 · ai · - · -

[Paper] 네팔어 LLM을 향해: 네팔어 BPE 토크나이저를 이용한 효율적인 GPT 훈련

네팔어는 3천200만 명이 넘는 사람들이 사용하는 저자원 언어로, 복잡한 문법 때문에 자연어 처리(NLP)에서 계속해서 도전 과제에 직면하고 있습니다…

#research #paper #ai #machine-learning #nlp
4개월 전 · ai · - · -

[Paper] Low-Resource, High-Impact: 포괄적 언어 기술을 위한 코퍼스 구축

이 튜토리얼(https://tum-nlp.github.io/low-resource-tutorial)은 다국어 및 low-resource 환경에서 작업하는 NLP 실무자, 연구자 및 개발자를 위해 설계되었습니다.

#research #paper #ai #machine-learning #nlp
4개월 전 · ai · - · -

[Paper] Polypersona: 페르소나 기반 LLM을 이용한 합성 설문 응답

이 논문은 PolyPersona라는 generative framework를 소개한다, 이는 multiple domains에 걸쳐 persona‑conditioned survey responses를 합성하기 위한 것이다.

#research #paper #ai #machine-learning #nlp
4개월 전 · ai · - · -

[Paper] 느린 전이 예측 개선: 생성 방법 비교

데이터 전송 성능을 모니터링하는 것은 과학 컴퓨팅 네트워크에서 중요한 작업입니다. 통신 단계 초기에 성능을 예측함으로써, 잠재적으로…

#research #paper #ai #machine-learning
4개월 전 · software · - · -

[Paper] 임베디드 시스템을 위한 관련 HAL 인터페이스 요구사항

임베디드 애플리케이션은 종종 하드웨어에 접근하기 위해 Hardware Abstraction Layer (HAL)를 사용합니다. HAL을 부적절하게 사용하면 하드웨어 동작이 올바르지 않을 수 있으며, 결과...

#research #paper #software
4개월 전 · software · - · -

[Paper] Teralizer: Semantics-Based 테스트 일반화: 기존 단위 테스트에서 Property-Based 테스트로

전통적인 unit tests는 단일 input-output 쌍을 검증하고, 실행 경로의 대부분 입력은 테스트되지 않은 채로 남깁니다. Property-based testing은 이 단점을 해결합니다.

#research #paper #software
4개월 전 · software · - · -

[Paper] 보안 컴플라이언스와 DevOps 정렬: 종단 연구

기업들은 애자일 방법론과 DevOps를 채택하여 소프트웨어 집약적인 제품의 효율적인 개발 및 배포를 촉진합니다. 이는 차례로 chal...

#research #paper #software
4개월 전 · devops · - · -

[Paper] Barrier Mode Parallel Systems의 이기종 및 중복 작업에 대한 성능 및 안정성

일부 병렬 계산 모델에서는 작업을 더 작은 태스크로 나누어 완전히 비동기적으로 실행할 수 있습니다. 다른 상황에서는 병렬 태스크가 …

#research #paper #devops
4개월 전 · ai · - · -

[Paper] Seismology 모델링 에이전트: 지구물리학 연구자를 위한 스마트 어시스턴트

전통적인 워크플로우에서 복잡한 수동 파일 편집 및 커맨드라인 작업에 대한 높은 러닝 커브와 의존성을 해결하기 위해, 주류 오픈소스…

#research #paper #ai #machine-learning
4개월 전 · devops · - · -

[Paper] SLA 제약 에지 컴퓨팅을 위한 하이브리드 반응형-예측형 Auto-scaling 알고리즘

Edge computing은 컴퓨팅 자원을 분산시켜, 의료 및 농업 분야의 Internet of Things (IoT)와 같은 영역에서 새로운 애플리케이션을 가능하게 합니다...

#research #paper #devops
4개월 전 · ai · - · -

[Paper] PentestEval: 모듈식 및 단계별 설계를 통한 LLM 기반 침투 테스트 벤치마킹

Penetration testing은 실제 위협에 대비해 system security를 평가하고 강화하는 데 필수적이지만, traditional workflows는 여전히 매우 수동적이며, …

#research #paper #ai #machine-learning
4개월 전 · ai · - · -

[Paper] Cornserve: 효율적인 Any-to-Any 멀티모달 모델 서빙

우리는 Any-to-Any 모델이라고 불리는 새로운 멀티모달 모델 클래스에 대한 효율적인 온라인 서빙 시스템인 Cornserve를 소개합니다. Any-to-Any 모델은 조합을 받아들입니다.

#research #paper #ai #machine-learning
4개월 전 · software · - · -

[Paper] 난독화에서 명백함으로: 보안 분석을 위한 포괄적인 JavaScript 디오브퓨스케이션 도구

JavaScript의 광범위한 채택은 정교한 obfuscation 기법을 사용해 악성 코드를 은폐하는 악의적인 공격자들에게 매력적인 표적이 되었습니다.

#research #paper #software
4개월 전 · ai · - · -

[Paper] PerfCoder: 해석 가능한 코드 성능 최적화를 위한 Large Language Models

Large language models (LLMs)은 자동 코드 생성에서 눈부신 진전을 이루었지만, 고성능 코드를 생성하는 능력은 여전히 제한적이다-...

#research #paper #ai #machine-learning
4개월 전 · ai · - · -

[Paper] 전문 소프트웨어 개발자는 감각에 의존하지 않고, 제어한다: 2025년 코딩을 위한 AI Agent 활용

AI 에이전트의 부상은 소프트웨어를 구축하는 방식을 변화시키고 있습니다. 에이전트의 약속은 개발자들이 코드를 더 빠르게 작성하고, 여러 작업을 d...에 위임할 수 있다는 것입니다.

#research #paper #ai #machine-learning
4개월 전 · devops · - · -

[Paper] 실시간 서비스 구독 및 차량 엣지 컴퓨팅에서의 적응형 오프로드 제어

Vehicular Edge Computing (VEC)는 지능형 교통 시스템에서 계산 효율성과 서비스 품질을 향상시키는 유망한 패러다임으로 부상하고 있습니다.

#research #paper #devops
4개월 전 · devops · - · -

[Paper] Q-IRIS: 고전‑양자 워크플로우를 가능하게 하는 IRIS 태스크 기반 런타임의 진화

극도의 이기종성이 나타나는 최신 HPC 시스템은 quantum accelerators를 포함하기 시작하면서, classical과 quantum 사이를 조정할 수 있는 runtimes를 필요로 하고 있다.

#research #paper #devops
4개월 전 · ai · - · -

[Paper] EvoLattice: LLM 기반 프로그램 탐색을 위한 다중 대안 품질‑다양성 그래프 표현을 통한 지속적인 내부 인구 진화

대형 언어 모델(LLMs)은 프로그램과 다중 에이전트 시스템을 진화시키는 데 점점 더 많이 사용되고 있지만, 대부분의 기존 접근 방식은 overwrite-based mutations에 의존한다…

#research #paper #ai #machine-learning #nlp
4개월 전 · ai · - · -

[Paper] EvoLattice: 지속적인 내부 인구 진화를 위한 다중 대안 품질‑다양성 그래프 표현을 통한 LLM 기반 프로그램 탐색

대규모 언어 모델(LLMs)은 프로그램 및 다중 에이전트 시스템을 진화시키는 데 점점 더 많이 사용되고 있지만, 대부분의 기존 접근 방식은 덮어쓰기 기반 변이를 의존한다…

#research #paper #ai #machine-learning #nlp
4개월 전 · ai · - · -

[Paper] DiffusionBrowser: 인터랙티브 디퓨전 프리뷰 via Multi-Branch Decoders

비디오 디퓨전 모델은 생성 비디오 합성에 혁신을 가져왔지만, 정확도가 떨어지고 느리며 생성 과정에서 불투명할 수 있어 사용자를 …

#research #paper #ai #machine-learning #computer-vision
4개월 전 · ai · - · -

[Paper] LitePT: 더 가볍고 더 강력한 Point Transformer

3D 포인트 클라우드 처리를 위한 최신 신경 아키텍처는 convolutional layers와 attention blocks를 모두 포함하지만, 이를 조합하는 최적의 방법은 아직 명확하지 않다.

#research #paper #ai #computer-vision

Newer posts

Older posts