[Paper] MuViT: 다중 해상도 Vision Transformers를 활용한 현미경에서의 스케일 간 학습
현대 microscopy는 일상적으로 gigapixel 이미지를 생성하며, 이는 미세한 세포 형태에서부터 더 넓은 조직까지 다양한 spatial scales에 걸친 구조를 포함합니다.
3058 posts from this source
현대 microscopy는 일상적으로 gigapixel 이미지를 생성하며, 이는 미세한 세포 형태에서부터 더 넓은 조직까지 다양한 spatial scales에 걸친 구조를 포함합니다.
Diffusion models는 state-of-the-art 비디오 생성 품질을 달성하지만, 순차적인 denoising 단계가 많이 필요하기 때문에 inference가 여전히 비용이 많이 듭니다....
그들의 능력에도 불구하고, Multimodal Large Language Models (MLLMs)는 그럴듯하지만 오류가 있는 출력을 생성할 수 있어 신뢰할 수 있는 배포를 방해합니다. 정확한 불확…
우리는 다중 회전 상호작용에서 언어 모델을 평가하기 위한 확장 가능한 방법론을 제시하며, 효과적인 커뮤니케이션을 요구하는 협업 게임 모음을 사용합니다.
소형 언어 모델(SLM)은 작업별 애플리케이션을 위한 대형 언어 모델의 효율적인 대안으로 등장했습니다. 그러나 이들은 종종 …
RTL 설계의 속성 검사는 형식 검증에서 핵심 작업이다. 사용 가능한 엔진 중 IC3/PDR은 성능이 중요한 널리 사용되는 백본이다.
배경. 자동화된 테스트 실행은 소프트웨어 프로젝트의 품질에 대한 정보를 수집하는 중요한 활동이다. 이른바 flaky tests는 그러나 …
우리는 asynchronous mixed choice (MC)를 지원하는 multiparty session type (MST) 프레임워크를 제시합니다. 우리는 일시적인 불일치를 허용하는 MC를 위한 핵심 구성을 제안합니다.
마이크로서비스 아키텍처는 비즈니스 로직을 작은 서비스들의 모음에 구축하는 신흥 기술입니다. 각 마이크로서비스는 자체 프로세스에서 실행되며 c...
AI coding agents는 소프트웨어 개발자가 코드를 빠르게 생성하도록 허용하며, 이는 프로젝트 매니저와 오픈 소스 유지관리자에게 실질적인 질문을 제기합니다: can vib...
소프트웨어 엔지니어링 에이전트(SWE)는 빠르게 개선되고 있으며, 최근의 성과는 주로 강화 학습(RL)에 의해 주도되고 있습니다. 그러나 RL 훈련은 …
대규모 언어 모델을 위한 머신 언러닝은 종종 프라이버시 딜레마에 직면하는데, 엄격한 제약으로 서버의 파라미터나 클...
현대 클라우드 서버는 자원 효율성을 향상시키기 위해 여러 latency-sensitive 마이크로서비스 인스턴스를 공동 배치한다. 그러나 마이크로서비스의 다양성은 ...
PoCo는 현대의 커버리지 기반 시드 선택(CSS) 기술(예: afl‑cmin)을 향상시키기 위해 장애 조건 문장을 점진적으로 제거하는 기술입니다.
분산 과학 워크플로의 중요성이 증가함에 따라, 최소화와 같은 Quality of Service (QoS) 제약을 보장해야 하는 중요한 필요성이 있습니다.
대규모 그래프 신경망(GNN)은 일반적으로 정점의 이웃을 고정 거리까지 샘플링하여 학습됩니다. 대규모 입력 그래프가 분산되어 있기 때문에,…
Federated Learning (FL)은 개별 데이터를 공유하지 않고도 여러 클라이언트가 협업하여 모델을 학습할 수 있게 하지만, 클라이언트 데이터가 …
우리는 MediX‑R1을 소개합니다. 이는 의료 멀티모달 대형 언어 모델(MLLMs)을 위한 개방형 강화 학습(RL) 프레임워크로, 임상적으로 기반된…
우리는 오프라인 피드포워드 방식의 중요한 한계인 계산 및 메모리 요구사항을 해결하는 확장 가능한 3D 재구성 모델을 제시합니다.
수많은 라인들이 모델 불일치를 제어하는 것을 목표로 합니다 — 두 머신러닝 모델이 예측에서 얼마나 서로 다른지를 나타냅니다. 우리는 간단하고 stan...
우리는 occlusion reasoning을 3D layout‑conditioned generation에 있어 근본적이면서도 간과된 측면으로 규정한다. 이는 부분적으로 가려진…
바이오 영감을 받은 이벤트 카메라는 비동기식 및 저지연 특성 때문에 최근 큰 연구 관심을 끌고 있습니다. 이러한 특징은 높은 dy...
플라톤적 표현 가설은 서로 다른 모달리티에 대해 훈련된 신경망이 세계에 대한 공유된 통계 모델로 수렴한다는 것을 주장한다. Rece...
Vision‑Language Models (VLMs)에서 추론 능력의 부족은 연구 논의의 최전선에 남아 있습니다. 우리는 이 현상이 …에서 비롯된다고 가정합니다.