[Paper] 일반화 결과도 일반화될까?
대형 언어 모델(LLM)의 out-of-distribution(OOD) 일반화 능력은 배포에 있어 매우 중요합니다. 이전 연구에서는 LLM의 일반화를 평가…
대형 언어 모델(LLM)의 out-of-distribution(OOD) 일반화 능력은 배포에 있어 매우 중요합니다. 이전 연구에서는 LLM의 일반화를 평가…
최근 비디오 생성 모델은 인상적인 합성 능력을 보여주지만, 단일 모달리티 조건에 의해 제한되어 전체적인 작업을 제약합니다.
시각 생성 모델(예: diffusion models)은 일반적으로 압축된 latent spaces에서 작동하여 학습 효율성과 샘플 품질의 균형을 맞춥니다. 동시에, ...
이 논문은 오픈 월드 웹에서 작동하는 범용 AI 에이전트의 채택, 사용 강도 및 사용 사례에 대한 최초의 대규모 현장 연구를 제시한다.
증가하는 정교함과 다양성을 가진 사이버 위협은 정적 honeypots를 부적합하게 만들었으며, 적응형이고 intelligence-driven deception이 필요하게 되었습니다. In ...
명령 기반 이미지 편집 데이터셋의 품질과 다양성은 지속적으로 증가하고 있지만, 대규모 고품질 데이터셋은 아직 부족합니다.
크라우드소싱 플랫폼, 예를 들어 Stack Overflow와 같은 플랫폼은 소프트웨어 개발 실무를 변화시키고 영향을 미쳤습니다. 이러한 플랫폼에서 개발자들은 공유하고 재사용합니다.
최근 비디오 생성기들은 놀라운 photorealism을 달성하지만, 3D에서는 근본적으로 일관성이 부족합니다. 우리는 WorldReel을 소개합니다, 이는 natively 4D 비디오 생성기입니다.
우리는 그래프 기반 학습과 그래디언트 정렬(GEEGA)을 활용하여 다중 도메인 정보를 이용해 EEG 표현을 학습하는 새로운 방법을 제시한다.
왜 현대 language models가 next-word prediction에 잘 맞도록 훈련되었음에도 불구하고 coherent documents를 생성하고 long-range structure를 포착하는 것처럼 보일까? 여기서 우리는 …
코드를 위한 대형 언어 모델(LLM4Code)은 개발자 생산성을 크게 향상시켰지만, 오픈소스 레포에 의존하기 때문에 프라이버시 우려도 제기합니다.
미래의 AI 시스템은 평가 중에 자신의 능력을 숨길 수 있습니다('sandbagging'), 이는 개발자와 감사자를 오도할 수 있습니다. 우리는 sandbagging을 스트레스 테스트했습니다.