[Paper] MarkTune: Open-Weight LLM 워터마킹에서 품질‑탐지성 트레이드오프 개선
워터마킹은 비밀 키에 접근할 수 있을 때 신뢰할 수 있게 감지될 수 있는 숨겨진 신호를 생성된 텍스트에 삽입하는 것을 목표로 합니다. Open-weight language models는 ...
워터마킹은 비밀 키에 접근할 수 있을 때 신뢰할 수 있게 감지될 수 있는 숨겨진 신호를 생성된 텍스트에 삽입하는 것을 목표로 합니다. Open-weight language models는 ...
진정으로 인터랙티브한 세계 모델은 세 가지 핵심 요소가 필요합니다: real-time long-horizon streaming, consistent spatial memory, 그리고 precise user control. 그러나, ...
이 논문은 두 가지 주요 영역에서 새로운 기여를 제시합니다: 생성 모델, 특히 normalizing flows의 효율성을 향상시키고, gener...
왜 state-of-the-art OOD detection methods가 모델이 single-domain datasets로 학습될 때 catastrophic failure를 보이는가? 우리는 최초의 theoretical …
우리는 Jina-VLM을 소개합니다. 2.4B 파라미터를 가진 비전-언어 모델로, 오픈 2B 규모 VLM 중에서 최첨단 다국어 시각 질문 응답을 달성합니다. The ...
본 연구는 대규모 언어 모델(LLMs)이 전통적인 신경망에 비해 천문 데이터 처리에서 이점을 제공하는지, ... regimes with ... 에서 조사한다.
Attention mechanisms는 foundation models의 핵심이지만, 그들의 quadratic complexity는 스케일링을 위한 중요한 bottleneck으로 남아 있습니다. 이 도전 과제는 …
Quantum key distribution (QKD) 보안은 근본적으로 진정한 양자 상관관계와 고전적인 도청자 시뮬레이션을 구별하는 능력에 의존한다,…
차등 프라이버시(DP)를 사용한 학습은 데이터셋의 구성원에게 릴리스된 모델의 사용자가 해당 구성원을 식별할 수 없다는 보장을 제공합니다. 그러나 …
Tokenizer adaptation은 사전 학습된 언어 모델을 새로운 도메인이나 언어로 전이하는 데 중요한 역할을 합니다. 이 연구에서는 두 가지 상보적인…
- 가장 지능적인 오픈소스 모델 상위 10개는 모두 mixture-of-experts 아키텍처를 사용합니다. - Kimi K2 Thinking, DeepSeek‑R1, Mistral Large 3 등은 10×...
Macro는 MIT Energy Initiative에서 개발한 modeling tool로, energy-system planners가 decarb를 지원하는 인프라를 개발하는 옵션을 탐색할 수 있게 합니다.