[Paper] PosterCopilot: Layout Reasoning 및 Controllable Editing을 통한 전문 그래픽 디자인
Graphic design는 현대 시각 커뮤니케이션의 초석을 이루며, 문화 및 상업 행사 홍보를 위한 중요한 매체 역할을 합니다. 최근의 진보는…
Graphic design는 현대 시각 커뮤니케이션의 초석을 이루며, 문화 및 상업 행사 홍보를 위한 중요한 매체 역할을 합니다. 최근의 진보는…
우리는 radiance meshes를 소개한다. 이는 Delaunay tetrahedralization으로 생성된 constant density tetrahedral cells를 사용하여 radiance fields를 표현하는 기술이다.
Reasoning models가 긴 사고 사슬(long chains of thought)을 활용하면 답변 검증, 역추적, 대안적인 재시도와 같은 다양한 인지 기술을 사용합니다.
Vision Language Models (VLMs)은 강력한 정성적 시각 이해를 보여주지만, 구현된 …에 필요한 계량적으로 정확한 공간 추론에 어려움을 겪는다.
불명확하거나 모호한 질의를 처리하기 위해, AI 어시스턴트는 불확실성을 관리하는 정책이 필요하며, (a) 언제 사용자 의도를 추측하고 답변을 제공할지, (b) …
오늘날 점점 복잡해지는 세상에서, Ola, Uber, Rapido와 같은 좋은 호출 서비스가 매우 중요합니다. 이는 우리 일상 교통에 필수적이기 때문입니다.
벤치마크의 급속한 확산은 재현성, 투명성 및 정보에 기반한 의사결정에 큰 도전을 야기하고 있습니다. 그러나 데이터셋과는 달리...
Sign Language Production (SLP)은 복잡한 입력 텍스트를 실제 비디오로 변환하는 과정이다. 대부분의 이전 연구들은 Text2Gloss, Gloss2Pose 등에 초점을 맞추었다.
민주주의에서는 주요 정책 결정이 일반적으로 다수 혹은 합의를 필요로 하므로, 엘리트는 통치를 위해 대중의 지지를 확보해야 합니다. 역사적으로 엘리트는 …
워터마킹은 비밀 키에 접근할 수 있을 때 신뢰할 수 있게 감지될 수 있는 숨겨진 신호를 생성된 텍스트에 삽입하는 것을 목표로 합니다. Open-weight language models는 ...
진정으로 인터랙티브한 세계 모델은 세 가지 핵심 요소가 필요합니다: real-time long-horizon streaming, consistent spatial memory, 그리고 precise user control. 그러나, ...
이 논문은 두 가지 주요 영역에서 새로운 기여를 제시합니다: 생성 모델, 특히 normalizing flows의 효율성을 향상시키고, gener...
왜 state-of-the-art OOD detection methods가 모델이 single-domain datasets로 학습될 때 catastrophic failure를 보이는가? 우리는 최초의 theoretical …
우리는 Jina-VLM을 소개합니다. 2.4B 파라미터를 가진 비전-언어 모델로, 오픈 2B 규모 VLM 중에서 최첨단 다국어 시각 질문 응답을 달성합니다. The ...
본 연구는 대규모 언어 모델(LLMs)이 전통적인 신경망에 비해 천문 데이터 처리에서 이점을 제공하는지, ... regimes with ... 에서 조사한다.
Attention mechanisms는 foundation models의 핵심이지만, 그들의 quadratic complexity는 스케일링을 위한 중요한 bottleneck으로 남아 있습니다. 이 도전 과제는 …
Quantum key distribution (QKD) 보안은 근본적으로 진정한 양자 상관관계와 고전적인 도청자 시뮬레이션을 구별하는 능력에 의존한다,…
차등 프라이버시(DP)를 사용한 학습은 데이터셋의 구성원에게 릴리스된 모델의 사용자가 해당 구성원을 식별할 수 없다는 보장을 제공합니다. 그러나 …
Tokenizer adaptation은 사전 학습된 언어 모델을 새로운 도메인이나 언어로 전이하는 데 중요한 역할을 합니다. 이 연구에서는 두 가지 상보적인…
Mixture-of-Experts (MoE)는 대형 언어 모델(LLM) 아키텍처로서 상당한 장점을 제공하지만, 저-...
SMT 솔버 기반 자동 검증 도구는 복잡한 소프트웨어 시스템을 검증하는 데 큰 진전을 이루었습니다. 그러나 이러한 도구들은 근본적인 …
복잡한 플라즈마 동역학의 효율적인 시뮬레이션은 핵융합 에너지 연구를 진전시키는 데 필수적입니다. Particle-in-Cell (PIC) Monte Carlo (MC) 시뮬레이션은 ...
인공지능(AI)과 딥러닝(DL)의 급속한 발전은 최적화 기반 하위 분야들의 등장에 촉진제를 제공했으며, 특히 neuro...
Spiking neural networks (SNNs)은 계산 신경과학과 인공지능 모두에서 유망한 방향으로 떠올랐으며, ...와 같은 장점을 제공합니다.