[논문] JZ-Tree: GPU 친화적인 이웃 검색 및 friends-of-friends와 듀얼 트리 워크를 JAX와 CUDA에서
spatial tree traversal 기반 알고리즘은 CPU 기반 고성능 환경에서 많은 문제에 대해 가장 효율적이고 유연한 접근 방식 중 하나로 널리 인정받고 있습니다.
4486 posts from this source
spatial tree traversal 기반 알고리즘은 CPU 기반 고성능 환경에서 많은 문제에 대해 가장 효율적이고 유연한 접근 방식 중 하나로 널리 인정받고 있습니다.
Neural network pruning은 조합 최적화 문제로 공식화될 수 있지만, 대부분의 기존 접근 방식은 복잡한 ...를 무시하는 greedy heuristics에 의존합니다.
Proofs of Concept (PoCs)은 소프트웨어 엔지니어링에서 널리 채택되는 관행입니다. 그 중요성에도 불구하고, PoCs는 개념적으로 정의가 부족하고 방법론적으로도 여전히 미흡한 상태입니다.
Specification synthesis 작업은 기존 프로그램에 대해 필요한 auxiliary verification annotations와 함께 명세를 자동으로 생성하는 것을 목표로 합니다.
광발전(PV) 모니터링 및 MPPT 제어 신호에서 사이버 공격을 탐지하려면 편향, 드리프트 및 순간 스파이크에 강인하면서도 경량인 모델이 필요합니다.
오늘날 소프트웨어 아키텍처에서 대형 언어 모델(LLM)은 소프트웨어 아키텍처 코파일럿 역할을 합니다. 그러나 현재 대형 언어 모델을 평가할 벤치마크는 존재하지 않습니다.
Web applications은 서로 다른 정보 자원을 연결하기 위해 하이퍼링크에 크게 의존합니다. 그러나 웹의 동적 특성으로 인해 link rot이 발생하며, 이는 대상이 …
서버리스 컴퓨팅, 특히 Function-as-a-Service(FaaS)는 인프라 관리 추상화와 동적…
우리는 MegaTrain을 소개한다. 메모리 중심 시스템으로, 단일 GPU에서 전체 정밀도로 100B+ 파라미터 대형 언어 모델을 효율적으로 학습한다. 전통적인…
우리는 Vanast를 소개합니다. 이 통합 framework는 단일 인간 이미지, garment 이미지 및 pose를 입력으로 하여 garment-transferred human animation videos를 직접 생성합니다.
씬 수준의 포인트 클라우드 이해는 다양한 기하학, 불균형한 카테고리 분포, 그리고 매우 다양하게 변하는 공간 레이아웃 때문에 여전히 어려운 과제입니다. 존재…
Local feature matching은 Structure-from-Motion (SfM)과 같은 3D vision 시스템의 기본적인 구성 요소였지만, 그 진전은 급속한 …
대부분의 비전-언어 모델(VLM)은 디코더로서 대형 언어 모델(LLM)을 적용하며, 응답 토큰은 자동회귀 방식으로 순차적으로 생성됩니다.
Pre-trained diffusion models는 All-in-One Restoration (AiOR)에서 중요한 발전을 가능하게 하여 향상된 지각 품질과 일반화를 제공합니다. Ho...
본 논문에서는 각 atomic predicate를 membership test로 해석하는 stratification‑based semantics를 Signal Temporal Logic (STL) 에 대해 개발한다.
대규모 언어 모델(LLMs)에서 확장된 추론은 심각한 KV 캐시 메모리 병목 현상을 초래합니다. 주요 KV 캐시 압축 방법들은 KV 중요도를 사용하여 추정합니다…
우리는 반선형 편미분 방정식의 최적 제어를 위한 수치 도구로서 물리 기반 신경망(PINNs)을 연구한다. 먼저 c...
시각적 추론기(visual reasoner)가 차트, 과학, 공간 이해 및 개방형 과제 전반에 걸쳐 작동하려면 무엇이 필요할까요? 가장 강력한 비전‑언어 모델…
Image spatial editing은 geometry-driven transformations를 수행하여 object layout 및 camera viewpoints에 대한 정밀한 제어를 가능하게 합니다. 현재 모델들은 충분하지…
독점적인 AI 시스템은 최근 복잡한 증명 기반 문제에서 인상적인 능력을 보여주었으며, 2025 Inte에서 보고된 금 수준의 성능을 기록했습니다.
강화 학습 with verifiable rewards (RLVR)는 대형 언어 모델(LLMs)의 추론 능력을 크게 향상시켰다. 그러나, 그것은 …
Gradient normalization은 deep‑learning 최적화에서 중심적인 역할을 하며, training을 안정화하고 scale에 대한 민감도를 감소시킵니다. deep architectures에서는 parameter…
Blockchain 생태계는 liquidity fragmentation이라는 중대한 문제에 직면해 있습니다. 애플리케이션과 자산이 여러 public chains에 분산되어 있으며, 각 체인은 오직...
대형 언어 모델 에이전트가 소프트웨어 엔지니어링(SWE) 작업을 넘어 머신러닝 엔지니어링(MLE)으로 진전함에 따라, 에이전트 행동을 검증하는 것이 order...
통계적 방법을 신뢰할 수 있는 소프트웨어로 구현하는 것은 정량적 연구에서 지속적인 병목 현상입니다. 기존 AI 코드 생성 도구는 코드를 빠르게 생성하지만…
우리는 Full-Duplex-Bench-v3 (FDB-v3)를 소개합니다. 이는 자연스러운 음성 환경과 다단계 도구 사용 상황에서 spoken language models를 평가하기 위한 benchmark입니다. Unli...
중국어에서 자원이 적은 동남아시아 언어로의 신경 기계 번역(NMT)은 깨끗한 병렬 코퍼스의 극심한 부족으로 인해 여전히 심각한 제약을 받고 있다.
대형 언어 모델(LLMs)은 자연어 전략 사양을 실행 가능한 전통적인 … 로 변환하기 위해 정량적 연구 코파일럿으로 점점 더 많이 사용되고 있습니다.
마이크로서비스 의존성 시뮬레이션에 대한 기존 접근 방식인 record-replay, pattern-mining, specification-driven stubs는 테스트 전에 정적 아티팩트를 생성한다...
Balanced spiking networks는 상호 작용하는 synaptic 및 temporal time scales에 따라 silent, asynchronous‑irregular, 그리고 oscillatory 상태 사이를 전이할 수 있다.
Optimistic rollups는 확장 가능한 스마트‑contract 실행을 제공하지만, 규제된 금융 애플리케이션에 적합하지 않은 세 가지 구조적 격차가 있다: semantic l...
GPU는 데이터 센터 전력 소비의 주요 기여자가 되고 있지만, CPU와 달리 눈에 보이는 활동이 거의 없을 때도 높은 전력을 유지할 수 있습니다. 우리는 이를…
머신러닝 모델, 특히 딥 뉴럴 네트워크는 의료, 환경 예측 등 위험 민감도가 높은 분야에 점점 더 많이 배치되고 있다.
기존의 evolutionary algorithms는 Constrained Multi-objective Optimization Problems (CMOPs)를 위해 일반적으로 모든 제약을 균일하게 취급하며, 그 차이를 간과한다.
공감은 소프트웨어 엔지니어링에서 중요한 인간 능력으로 논의되어 왔으며, 특히 사용자와 이해관계자를 이해해야 하는 활동에서 중요합니다.
우리는 단일 에이전트에 의한 deterministic exploration을 T‑interval‑connected 그래프에서 연구한다. 이는 동적 네트워크의 표준 모델로, 모든 길이 len의 time window에 대해 …
과학 컴퓨팅 및 최신 머신 러닝(ML) 워크로드에서는, 종속적인 General Matrix Multiplications(GEMM) 시퀀스가 종종 실행 시간을 지배합니다....
NBI‑Slurm은 SLURM 고성능 컴퓨팅(HPC) 클러스터에서 작업을 제출하고 관리하기 위한 간소화된 사용자 친화적 인터페이스를 제공하는 Perl 패키지입니다.
자연에서 영감을 받은 메타휴리스틱의 급속한 성장으로 은유적 새로움과 실제 알고리즘적 진보 사이의 지속적인 격차가 드러났습니다. Motivated by t...
개발자들은 생산성을 높이기 위해 third‑party libraries를 활용하지만, 이는 잠재적인 security risks를 초래하기도 합니다. 기존 접근 방식은 public …에 대한 테스트를 생성합니다.
Generative AI (GenAI) 도구는 소프트웨어 아키텍처 연구에 점점 더 통합되고 있지만, 그들의 계산 사용에 따른 환경적 영향은 아직 …
Parent selection 방법은 진화 계산(evolutionary computation)에서 최적화 과정을 가속화하기 위해 널리 사용되지만, 그 이론적 이점은 아직 충분히 이해되지 않고 있다.
코딩 에이전트가 협업 소프트웨어 개발에서 새로운 조정 역학을 도입했음에도 불구하고, 실제에서의 상세한 상호작용은 아직 충분히 탐구되지 않았다.
소프트웨어 테스트 연구는 전통적으로 유한 상태 공간(finite state spaces), 재현 가능한 실행(reproducible executions), 안정적인 테스트 오라클(test oracles)과 같은 폐쇄 세계 가정에 의존해 왔습니다. H...
블록체인 상의 자율 소프트웨어 에이전트는 직접 메시지를 교환하는 대신 공유 원장 상태를 읽음으로써 분산 협조 문제를 해결합니다. Liquidat...
DAG‑Rider는 DAG‑BFT 프로토콜의 새로운 패러다임을 대중화했으며, 전파와 합의를 분리했습니다: 모든 노드는 트랜잭션을 블록 형태로 전파하고, 그 블록은 다른 블록을 reference합니다.
Federated learning (FL)은 여러 클라이언트가 서버를 통해 private training data를 공유하지 않고 global machine learning model을 공동으로 학습할 수 있게 합니다.
DDCL-Attention은 transformer encoders를 위한 prototype‑based readout layer로, 평균 풀링(mean pooling)이나 클래스 토큰(class tokens)과 같은 단순 풀링 방법을 …