[논문] CLANE: 이벤트 카메라 기반 뉴로모픽 하드웨어에서 행동 지속 학습
Recognizing and continuously learning novel human actions without forgetting prior classes is a requirement for emerging AR/VR and robotics applications. For th...
1354 posts from this source
Recognizing and continuously learning novel human actions without forgetting prior classes is a requirement for emerging AR/VR and robotics applications. For th...
Industrial Prognostics and Health Management (PHM)는 응용 머신러닝에서 더 넓은 과제인, 출판된 연구를 실제 적용으로 전환하는 것을 위한 대표적인 사례 연구를 제공합니다.
Cartesian Genetic Programming은 전통적으로 변이를 주요하고 종종 유일한 유전 연산자로 사용하여 진화적 탐색을 진행해 왔습니다. 발전에도 불구하고...
Multi-constraint hypergraph partitioning은 balanced partitioning의 일반화로, 하이퍼그래프의 vertex set이 partition되어 inter-b…
REST API가 소프트웨어 시스템에서 점점 더 중요한 부분이 되면서, 그 검증이 더욱 중요해지고 있습니다. 따라서 테스트와 근본적인 i...
대규모 벤치마킹에서 stochastic optimization algorithms의 경우, 핵심 과제는 이제 신뢰성을 위해 repeated runs가 필요한지 여부가 아니라, 어떻게 d...
현대의 대형 언어 모델(LLM) 추론은 모델 크기의 증가와 엄격한 TTFT 및 TPOT 서비스 수준 목표에 맞추기 위해 점진적으로 분산화되어 왔습니다.
Generating a game is not the same as making one that can be played. Despite advances in code generation, existing approaches treat game generation as one-shot t...
고성능 컴퓨팅 시스템이 규모와 복잡성이 커짐에 따라, 효율적인 자원 관리가 통신 오버헤드를 최소화하는 데 필수적입니다. HyperX는...
Evolutionary computation은 복잡한 실제 최적화 문제를 해결하기 위한 다양한 도구를 제공합니다. 그러나 연구는 종종 더 작고 단순화된 프로...
The rapid development of LLMs coupled with the introduction of Model Context Protocol (MCP) has revolutionized how intelligent agents interact with APIs through...
Landscape feature representations는 black-box optimization을 위한 자동 알고리즘 선택 및 meta‑learning에서 중심적인 역할을 하지만, h에 대해서는 거의 알려져 있지 않다.
대규모 언어 모델(LLMs)의 빠른 채택으로 인해 추론 워크로드의 상당 부분이 처리량 중심의 오프라인 체제로 이동했으며, 여기서 전체…
LLMs for code generation are commonly evaluated in repeated-sampling settings using Pass@k, where multiple candidate programs are executed against unit tests un...
대규모 언어 모델 에이전트는 점점 더 운영 작업을 수행할 것으로 기대되고 있습니다: API 호출, 파일 조작, 워크플로우 조립, 그리고 엔터…
데이터센터 네트워크 설계는 수천 개의 가속기를 확장할 수 있도록 지원함으로써 AI 훈련에서 중요한 역할을 합니다. 열린 문제인, 거의 최적에 가까운 thr...
Multimodal LLM datasets are inherently heterogeneous, with significant data variability. Although each modality exhibits independent variability, sample-level e...
Neighbor graphs는 데이터 포인트 간의 관계를 포착하며 데이터 분석 및 AI 워크로드에서 널리 사용됩니다. 많은 연구에서 approximate construct를 탐구했습니다.
Many employers screen job applicants with algorithms built by the same few algorithm vendors. We hypothesize that algorithmic monoculture leads to the same indi...
Modern feed-forward 3D reconstruction methods like VGGT predict pixel-aligned pointmaps in camera-centric coordinate frames. However, this choice of coordinate ...
공간 파운데이션 모델이 표준 데이터셋에서 인상적인 성능을 보여주었지만, 중요한 질문이 남아 있다: 과연 이들이 진정한 전천후 플레이어인지…
대형 언어 모델(LLM) 에이전트는 복잡한 작업을 해결하기 위해 재사용 가능한 스킬에 의존합니다. 그러나 기존의 스킬 생성 접근 방식은 스킬을 독립적이고 정적인 것으로 취급합니다.
Vision-language models (VLMs)는 일반적으로 시각적 grounding과 detection을 좌표 토큰 생성 문제로 공식화하여, 각 2D 박스를 여러 …
현대 검색 에이전트는 LLM, retriever, 문서 수, hop 수, synthesis strategy 등 많은 구성 옵션을 제공하며, 각각이 ...을 형성합니다.
세포 연구 및 개발(R&D)은 각 반복마다 수개월에 달하는 수동 엔지니어링 작업을 소모하는 여섯 가지 구조적 프로세스에 의해 제한됩니다: (i) synt...
Mixture-of-Experts (MoE)는 수백억 파라미터 언어 모델의 사실상 표준 아키텍처가 되었지만, 서브-억 규모에서 on‑dev에 대한 장점은…
Reinforcement Learning from Human Feedback (RLHF) is the standard method to align Large Language Models (LLMs) with human preferences. In this work, we introduc...
모델 내부는 대규모 언어 모델(LLM)이 훈련 데이터를 처리하는 방식에 대한 풍부한 정보를 인코딩합니다; 그러나 post‑training data engineering은 주로 …
Discrete diffusion models는 텍스트 및 기타 기호 영역에서 강력한 경험적 성능을 달성했지만, 특히 uniform-rate models의 경우, 종종 요구한다...
3D 편집은 확장 가능한 3D 콘텐츠 제작을 위한 기본적인 역량입니다. 이미지 편집은 대규모 피드포워드 생성 패러다임으로 빠르게 진화해 왔으며…
최근 생성 모델들은 저수준 아티팩트—pixel fingerprints, frequency anomalies, upsampling traces—에 대한 격차를 크게 좁혔으며, 특히 ...
신뢰할 수 있는 평가는 대형 언어 모델(LLM) 성능을 이해하는 데 필수적이지만, 오늘날 주로 사용되는 지표는 토큰‑오버랩 점수(예: ROUGE) 등이다...
Diffusion 모델은 고품질 이미지 생성 및 편집을 위한 강력한 도구로 부상했지만, 이러한 모델을 특정 출력으로 유도하는 것은 여전히 도전 과제입니다.
ASP(Q) extends Answer Set Programming (ASP) with Quantifiers over answer sets. In this paper we focus on the class of ASP(Q) programs with two quantifiers and w...
Video Diffusion Transformers (DiTs)는 고품질 비디오를 생성하지만, 넓은 블록, 깊은 아키텍처, 그리고 반복 샘플링 때문에 상당한 연산량을 요구합니다.
Finance LLM agents must simultaneously block prompt-induced unauthorized actions and approve legitimate multi-step business workflows. However, boundary filters...
Flowcharts are widely used in industrial requirements, but usually remain embedded as static images. Vision Language Models (VLMs) show promise in the conversio...
Recent advances in agentic systems increasingly treat code as an executable operational substrate rather than as a disposable output artifact. Prior work such a...
우리는 상호작용 SSD를 소개합니다. 이는 Supervised Semantic Differential의 확장으로, 그룹, 특성 등과 같은 조절 변수에 따라 의미가 어떻게 변하는지를 모델링합니다.
비디오 공간 추론은 질문에 유용한 정보를 유지하면서 시간에 따라 시점 의존적인 증거를 축적해야 합니다. 기존 sp...
확률적 스무딩은 전역 최적화를 위한 표준 도구이지만, 기존 방법들은 Gaussian 커널과 특정 변환에 의존하며, 종종 …
시각 입력은 종종 멀티모달 모델에서 언어 이해를 향상시킨다고 가정됩니다. 우리는 비전‑언어 모델(VLM)이 실제로 이러한 가정을 충족하는지 여부를 조사함으로써 이 가정을 검증합니다.
Demographic information은 hate speech detection와 같은 주관적 작업에서 annotator의 관점을 모델링하는 데 자주 사용되지만, 그 이점은 일관되지 않습니다: it imp...
Chart question-answering (QA) benchmarks aim to pose questions that require visual reasoning to correctly answer, but models can often reach solutions through s...
The widespread use of AI services has raised concerns for its environmental sustainability, towards which recent studies have identified carbon emissions of AI ...
우리는 전체 볼륨에 대해 하나의 binary label만 사용하고 각 2D slice마다 라벨을 부여하는 것이 아니라, 3D medical images에 대한 분류기를 학습하는 것을 고려한다. 이러한 weakly supervised 상황에서...
LLM-based agents have moved automated program repair (APR) from fixed-context patch generation to interactive repository-level repair. However, existing agentic...
Prolog은 논리와 추론에 대한 입문 과정에서 흔히 사용되는 잘 알려진 선언적 프로그래밍 언어입니다. 그러나 많은 학생들은 Prolog을 어려워합니다.