[Paper] Predictive Concept Decoders: 확장 가능한 End-to-End 해석 보조 도구 훈련
신경망의 internal activations을 해석하는 것은 그들의 행동에 대한 보다 충실한 설명을 제공할 수 있지만, 복잡한 구조 때문에 어렵다.
3255 posts from this source
신경망의 internal activations을 해석하는 것은 그들의 행동에 대한 보다 충실한 설명을 제공할 수 있지만, 복잡한 구조 때문에 어렵다.
우리는 Gaussian Pixel Codec Avatars (GPiCA)를 소개합니다. 이는 다중 뷰 이미지로부터 생성될 수 있는 포토리얼리스틱 헤드 아바타이며, 모바일 디바이스에서 효율적으로 렌더링됩니다.
이 논문은 예술 진화에서 잠재적 궤적을 탐색하는 복잡한 문제를 해결하기 위해 설계된 dual-engine AI 아키텍처 방법을 제안한다. W...
Foundation 모델은 다양한 Computer Vision 애플리케이션에서 중요한 도구입니다. 이 모델은 단일 RGB 이미지를 입력으로 받아 깊은 feature representation을 출력합니다…
Active Speaker Detection (ASD)은 비디오의 각 프레임에서 현재 누가 말하고 있는지를 식별하는 것을 목표로 합니다. 대부분의 최신 접근 방식은 late fusion에 의존하여 comb...
상호작용하는 생물 유기체의 수학적 모델에서 외부 개입이 시간에 따라 행동을 변화시킬 수 있는 경우, 고정된 파라미터를 가정하는 전통적인 모델은…
Early-Exit (EE)는 Large Language Model (LLM) 아키텍처로, 더 쉬운 토큰을 모델의 일부 서브셋만 사용해 생성함으로써 추론 속도를 가속화합니다.
Autoregressive video diffusion models는 세계 시뮬레이션에 대한 가능성을 가지고 있지만, train‑test 불일치에서 발생하는 exposure bias에 취약합니다. 최근 w…
인간 선호도를 포함한 이미지 압축 성능 평가에서는 일반적으로 MSE와 같은 단순 왜곡 함수가 충분히 …
우리는 FrontierCS를 소개합니다. 이는 컴퓨터 과학의 다양한 분야에 걸친 156개의 open-ended problems로 구성된 benchmark이며, CS PhDs 등 전문가들이 설계하고 검토했습니다.
AI-driven video generation technologies의 오용은 심각한 사회적 우려를 불러일으켰으며, 신뢰할 수 있는 AI-generated video detectors의 긴급한 필요성을 강조합니다.
로봇 조작을 위한 기존 Vision-Language-Action Models (VLAs)는 대규모이지만 서로 연결되지 않은 데이터로 사전 학습된 vision-language 백본을 기반으로 구축됩니다.
시맨틱 커뮤니케이션은 원시 데이터가 아니라 작업에 가장 관련된 정보를 전송하는 것을 목표로 하며, 애플리케이션에서 통신 효율성을 크게 향상시킵니다.
미래의 AI 에이전트는 상승된 권한을 가지고 자율적으로 실행될 수 있습니다. 이러한 에이전트가 정렬되지 않으면, 그 권한을 악용하여 심각한 피해를 초래할 수 있습니다. The...
Reinforcement learning은 large language models의 추론 능력을 강화하는 데 필수적이 되었지만, 현재의 exploration mechanisms는 여전히 fundam...
본 논문은 다중...을 활용하여 급수 배관망에서 이상 현상의 detection, classification 및 preliminary localization을 위한 통합 framework을 제시한다.
Partial Least Squares (PLS)는 데이터 통합에 널리 사용되는 방법으로, 쌍을 이루는 고차원 데이터셋 간에 공유되는 잠재 컴포넌트를 추출하도록 설계되었습니다.
Exascale computing과 data-driven methods에 대한 추진으로 문제 규모가 크게 증가했으며, 이는 계산 요구 사항을 크게 증가시켰습니다…
본 논문은 합성 이미지 데이터를 신경 스타일 전이와 결합한 학습 데이터 증강 파이프라인을 제안하여 취약성을 해결한다.
대규모 언어 모델(LLM) 활성화는 이해하기가 매우 어렵기로 유명하며, 기존의 대부분 기술은 복잡하고 특수한 방법을 사용하여 해석…
대형 언어 모델(LLMs)은 놀라운 능력을 보여주지만, 그들의 추론은 불투명하여 안전성과 신뢰에 대한 우려를 제기합니다. Attribution methods, which ...
인간은 비판적 사고를 통해 복잡한 문제를 해결하며, 추론과 평가가 얽혀 올바른 해결책으로 수렴합니다. 그러나, mos...
Raft는 분산 데이터베이스에서 쓰기 복제를 위한 선도적인 합의 알고리즘입니다. 그러나 분산 데이터베이스는 일관된 읽기도 필요합니다. 이를 보장하기 위해…
Continual learning은 machine learning에서 여전히 근본적인 과제로 남아 있으며, 모델이 이전에 습득한 것을 잊지 않고 작업 스트림으로부터 학습하도록 요구합니다.
State space models (SSMs)는 고정된 메모리를 사용해 추론하기 때문에 언어 모델링에서 transformer에 대한 유망한 대안으로 주목받고 있습니다. 그러나 이 고정…
LLM의 컨텍스트 윈도우를 확장하는 데 따른 계산 및 메모리 오버헤드는 확장성을 크게 제한합니다. 주목할 만한 해결책은 vision-te...
대규모 언어 모델은 점점 더 파인튜닝을 통해 다운스트림 작업에 적용되고 있다. 전체 감독 파인튜닝(Full supervised fine-tuning, SFT)과 파라미터 효율 파인튜닝(parameter‑efficient fine‑tuning, P…
LLMs(대형 언어 모델)은 다양한 입력 및 생성 작업에 지능적으로 대응하기 위해 텍스트 처리 파이프라인에서 점점 더 많이 사용되고 있습니다. 이는 …
working memory는 brain이 transient information을 통합하여 rapid decision-making을 가능하게 합니다. Artificial networks는 일반적으로 이를 recurrent 또는 par... 방식으로 복제합니다.
Psychological defenses는 사람들이 고통을 관리하기 위해 사용하는, 종종 자동적인 전략이다. 방어의 경직성이나 과다 사용은 정신 건강에 부정적인 영향을 미친다…
Bloom filters는 근사 멤버십 쿼리를 위한 기본적인 데이터 구조이며, 데이터 분석부터 데이터베이스 및 유전체학에 이르기까지 다양한 응용 분야가 있습니다. Seve...
우리는 Bolmo를 소개합니다. 이는 1B와 7B 파라미터 규모에서 경쟁력 있는 완전 오픈 바이트‑레벨 언어 모델(LM) 최초의 패밀리입니다. 기존 연구와는 달리…
많은 비즈니스 프로세스가 현재 웹 서비스에 의존하고 있으며, 종종 통신에 REST API를 사용합니다. REST API는 엔드포인트를 통해 웹 서비스 기능을 노출합니다,…
코드용 대형 언어 모델의 성공은 GitHub와 같은 공개 오픈소스 저장소를 포함한 방대한 코드 데이터와 개인적인, ...
ChatGPT와 같은 대형 언어 모델을 코드 리뷰에 활용하면 효율성 향상이 기대되지만, 정확성 및 안전성에 대한 우려도 제기됩니다. 기존 e...
제조업에서 디지털 트윈은 Asset Administration Shells (AAS) 형태로 구현되어 널리 활용되고 있습니다. 이러한 디지털 복제물은 종종 ...
재사용 가능한 소프트웨어 구성 요소는 일반적으로 패키지 형태로 배포되며, 현대 소프트웨어 개발의 핵심 패러다임입니다. JavaScript 생태계는 ...
자동화 주행 시스템(ADS)의 안전성과 신뢰성을 보장하는 것은 여전히 중요한 과제로 남아 있으며, 대규모 온‑...
현대 데이터 센터는 수천 대의 서버를 보유하고 있어 전력 소비가 큰 편입니다. 환경 영향을 최소화하기 위해서는 우리가 ...
우리는 LLMQ를 소개합니다. 이는 중간 규모 언어 모델(예: 3B에서 32B 파라미터) 훈련을 저렴한 범용 GPU에서 수행할 수 있는 엔드‑투‑엔드 CUDA/C++ 구현입니다. 이러한...
디지털 트윈(DT) 기술은 이기종 데이터와 모델을 통합하고, 의미론적 기술과 함께 물리적 …의 다계층 디지털 표현을 생성합니다.
BPMN 비즈니스 프로세스와 DMN 테이블을 포함한 사용이 점점 증가하고 널리 퍼짐에 따라, 그 정확성을 검증할 수 있는 도구와 방법론이 필요합니다. 그러나 …
데이터 기반 진화 알고리즘은 견고한 서러게이트 모델링을 통해 비용이 많이 드는 최적화 문제를 해결하는 데 놀라운 결과를 보여주었습니다. 비록 유망하지만…
고성능 데이터 전송을 추구할 때는 종종 순수 네트워크 대역폭에 초점을 맞추며, 100 Gbps 이상의 국제 링크는 흔히 …
현대 AI 시스템의 증가하는 계산 요구는 디지털 하드웨어의 근본적인 한계를 드러내며, 대안적인 패러다임에 대한 관심을 촉발하고 있다 fo...
혁신적인 농업 시스템은 우리가 농사를 짓는 방식을 혁신하고 있으며, 우리 시대의 가장 중요한 혁신 중 하나가 되고 있습니다! 그러나 그것은 중요한 연결성…
우리는 결합된 Wien bridge oscillators와 tunable resistive couplings 네트워크를 사용하여 구현된 oscillatory neuromorphic primitive를 제시한다. Phase relationship…
스트리밍 비디오 생성의 핵심 과제는 긴 컨텍스트에서 콘텐츠 일관성을 유지하는 것이며, 이는 메모리 설계에 높은 요구 사항을 부과합니다. Mo...