[Paper] 제한된 데이터로부터 강직 PDE 시스템 학습을 위한 안정적인 스펙트럴 뉴럴 오퍼레이터
시공간 동역학의 정확한 모델링은 과학 및 공학 전반에 걸친 복잡한 현상을 이해하는 데 필수적입니다. 그러나 이 작업은 근본적인...
3272 posts from this source
시공간 동역학의 정확한 모델링은 과학 및 공학 전반에 걸친 복잡한 현상을 이해하는 데 필수적입니다. 그러나 이 작업은 근본적인...
임상 의학에서 치료 의사결정은 AI 가이드가 환자 특성 간의 복잡한 상호작용과 얽혀 있는 고위험 분야입니다.
Large Language Models (LLMs)는 학술적 글쓰기 관행에 점점 더 많이 통합되고 있습니다. 수많은 연구가 연구자들이 이러한 도구를 어떻게 활용하는지를 탐구했지만…
Snowflake 스타일 분산 ID 생성기는 대규모 환경에서 k‑ordered, 고유 식별자를 생성하기 위한 업계 표준입니다. 그러나 전통적인 요구 사항 f...
대규모의 unstructured historical newspaper archives에서 일관되고 인간이 이해할 수 있는 주제를 추출하는 것은 ... 때문에 상당한 도전 과제를 제시한다.
FirecREST v2를 소개합니다. 이는 HPC 자원에 대한 프로그래밍 접근을 위한 오픈소스 RESTful API의 차세대 버전입니다. FirecREST v2는 100배 성능을 제공합니다...
Retrieval-augmented generation (RAG) 모델은 검색된 증거를 활용해 대형 언어 모델(LLM) 생성기를 안내하지만, 현재 시스템은 검색을 …
코딩 에이전트는 이전에 인간 개발자가 필요했던 엔드‑투‑엔드 소프트웨어 엔지니어링 워크플로를 점점 더 수행할 수 있게 되고 있습니다, 포함하여 ra...
우리는 black-box 대형 언어 모델(LLMs)을 감사하여 프로덕션 환경에 배포될 때 신뢰성 있게 동작하는지를 보장하는 문제를 고려한다, 특히 …
소셜 미디어는 현대 정치에서 중요한 매체 역할을 하는데, 이는 정치인들의 이념을 반영하고 젊은 세대와의 소통을 촉진하기 때문입니다...
치과 분야에서 멀티모달 데이터의 신뢰할 수 있는 해석은 자동 구강 의료에 필수적이지만, 현재의 멀티모달 대형 언어 모델(MLLMs)은 어려움을 겪고 있다.
비디오 이해에서 키 프레임 선택은 상당한 과제를 제시합니다. 프레임을 독립적으로 점수화하는 전통적인 top‑K 선택 방법은 종종 실패합니다…
실시간 DNN 애플리케이션에 대한 수요가 에지 디바이스에서 증가함에 따라, 점점 더 복잡해지는 모델의 빠른 추론이 필요합니다. 많은 디바이스가 sp...을 포함하고 있지만.
끊임없이 진화하는 클라우드 컴퓨팅 및 네트워크 환경에서, 서비스 기능 체인 (SFC)은 복잡한 서비스를 구현하는 데 중요한 역할을 합니다.
closeness centrality를 사용하여 central nodes를 식별하는 것은 large‑scale complex networks를 분석하는 데 중요한 작업이지만, 그 decentralized computation은 여전히 어려운 과제로 남아 있다.
대형 언어 모델(LLMs)은 자연어 이해와 추론에서 놀라운 능력을 보여주지만, 환각 현상, 즉 f...의 생성으로 고통받는다.
코드에 특화된 대형 언어 모델(CodeLLMs)은 코드 스니펫, 문서 및 테스트 케이스를 생성하는 데 놀라운 역량을 보여주었습니다. Howe...
수작업으로 만든 휴리스틱에서 데이터 기반 진화 알고리즘으로의 전환은 근본적인 딜레마에 직면한다: 신경 가소성을 희생하지 않으면서 …
C 코드에서 Java 코드로의 자동 번역은 악명 높게 어려운 작업이며, 근본적인 패러다임 전환(절차적 …)에서 비롯되는 도전 과제로 가득합니다.
대형 언어 모델(LLMs)의 코드 생성 분야에서의 급속한 발전과 함께, 이들의 하드웨어 설계 적용이 점점 더 주목받고 있습니다. 그러나, e...
본 논문에서는 보안 스캔 결과의 고급 분석 및 시각화를 제공하는 웹 애플리케이션인 GraphSecure를 소개합니다. GraphSecure는 사용자가…
롤아웃-트레이닝 분리(disaggregation)는 강화학습(RL) 사후 훈련의 표준 아키텍처로 부상하고 있으며, 메모리 바운드 롤아웃과 컴퓨트 바운드…
테스팅 단계는 소프트웨어 개발의 필수적인 부분이지만, 수동으로 테스트 케이스를 만드는 것은 시간 소모적일 수 있습니다. 결과적으로, 점점 더 필요성이 커지고 있습니다.
현재 AI 코드 생성 시스템은 컴파일, 실행 및 테스트 단계에서 CPU‑GPU 데이터 전송으로 인한 상당한 지연 병목 현상을 겪고 있습니다.
Actively secure arithmetic MPC는 이제 실제 응용에 실용적이지만, 성능과 사용성은 여전히 프레임워크별 컴파일 스택에 의해 제한됩니다,…
우리는 StereoSpace를 소개합니다. 이는 monocular-to-stereo synthesis를 위한 diffusion-based 프레임워크로, geometry를 순수하게 viewpoint conditioning을 통해 모델링하며, …
Generative world models는 embodied AI를 재구성하고, 에이전트가 설득력 있게 보이지만 종종 물리적으로는 실패하는 현실적인 4D 주행 환경을 합성하도록 합니다.
언어와 비전 분야에서 파운데이션 모델의 성공은 완전한 엔드‑투‑엔드 로봇 내비게이션 파운데이션 모델(NFMs)에 대한 연구를 촉진했다. NFMs는 모노…
Visual concept personalization은 정체성, 표정, 조명, 스타일과 같은 특정 이미지 속성만을 보이지 않는 컨텍스트로 전달하는 것을 목표로 합니다. 그러나...
본 연구에서는 SceneMaker라는 분리형 3D 씬 생성 프레임워크를 제안한다. 충분한 오픈셋 디오클루전 및 포즈 추정 프리…
Normalizing Flows (NFs)는 생성 모델링을 위한 원칙적인 프레임워크로 확립되었습니다. 표준 NFs는 forward process와 reverse process로 구성됩니다.
본 연구에서는 diffusion model 추론에서 아직 활용되지 않은 신호를 탐구합니다. 기존의 모든 방법이 추론 시 이미지를 독립적으로 생성하는 반면, 우리는 대신 …
현대 머신러닝의 성공은 고품질 훈련 데이터에 대한 접근에 달려 있습니다. 많은 실제 상황에서, 예를 들어 공개 저장소에서 데이터를 확보하는 경우…
Self-supervised pre-training은 언어, 개별 2D 이미지 및 비디오에 대한 foundation models에 혁신을 가져왔지만, 3D 학습에 대해서는 아직 크게 탐구되지 않았다...
강화 학습(RL)은 대규모 언어 모델 및 멀티모달 모델에서 효과가 입증된 바 있으며, 2D 이미지 생성 향상을 위해 성공적으로 확장되었습니다.
All-in-One Image Restoration (AiOIR)은 다양한 손상으로부터 고품질 이미지를 복구하는 것을 통합된 프레임워크 내에서 목표로 합니다. 그러나 기존 방법들은 종종 f...
인간 수준의 접촉이 풍부한 조작은 두 가지 핵심 모달리티의 뚜렷한 역할에 의존합니다: vision은 공간적으로 풍부하지만 시간적으로 느린 global context를 제공하고, ...
대규모 diffusion 모델을 활용한 subject‑driven 비디오 생성의 최근 발전으로, 사용자 제공 주제에 조건화된 개인화된 콘텐츠 합성이 가능해졌습니다.
추론은 언어를 넘어선다; 현실 세계에서는 공간, 시간, 어포던스 등 단어만으로는 전달할 수 없는 많은 것들에 대한 추론이 필요하다. 기존의 멀티모…
카메라 제어를 diffusion 모델에 주입하는 기존 접근 방식은 4D 일관성 작업의 특정 하위 집합에 초점을 맞추었습니다: novel view synthesis, text-to-video …
정규화 레이어는 오랫동안 딥러닝 아키텍처의 필수 구성 요소로 여겨져 왔지만, 최근 도입된 Dynamic Tanh (DyT) ha...
우리는 부분 관측 마코프 의사결정 프로세스(POMDPs)의 decision-making agents와 one-input process functions 사이에 정확한 대응 관계를 설정한다.
신경망에 대한 적대적 공격을 구성하는 것은 다양한 서비스에 배치할 때 중요한 과제로 보인다. 적대적 …
우리는 Any4D를 소개한다. Any4D는 메트릭 스케일의 밀집 피드포워드 4D 재구성을 위한 확장 가능한 멀티뷰 트랜스포머이다. Any4D는 픽셀당 모션과 지오메트리를 직접 생성한다.
Autonomous drone navigation in confined tubular environments는 관의 제약적인 geometry와 벽과의 근접성 때문에 여전히 큰 도전 과제로 남아 있습니다.
많은 최첨단 LLM은 답변을 제공하기 전에 생각하도록 훈련됩니다. 추론은 언어 모델의 능력과 안전성을 크게 향상시킬 수 있지만, 또한 …
우리는 noisy quantum experiments로부터 학습하기 위한 framework을 개발하고, noisy couplings을 통해 uncharacterized systems에 접근하는 fault-tolerant devices에 초점을 맞춘다.
Temporal-difference (TD) 방법은 자체 미래 가치 예측으로부터 부트스트래핑함으로써 상태와 행동 값을 효율적으로 학습하지만, 이러한 self-bootstrappi...