그들의 일은 AI가 모든 것을 파괴하지 못하도록 하는 것이다
2020년 5월 어느 밤, 봉쇄가 절정에 이르던 시기에 Deep Ganguli는 걱정하고 있었습니다. 당시 Stanford Institute for Human-Centered AI의 연구 이사였던 Ganguli는…
2020년 5월 어느 밤, 봉쇄가 절정에 이르던 시기에 Deep Ganguli는 걱정하고 있었습니다. 당시 Stanford Institute for Human-Centered AI의 연구 이사였던 Ganguli는…
새로운 연구는 일부 프롬프트 인젝션 공격이 성공할 수 있는 이유에 대한 단서를 제공합니다....
낙관적인 방 안에서 회의적인 입장이 되는 불편한 느낌. 나는 AI와 오랫동안 작업해 왔으며—깊이 관여하고, 제품을 shipping하고, 모델을 wiring models하는 중이다.
번역할 텍스트를 제공해 주시겠어요?
Atlas와 대부분의 현재 AI 기반 브라우저가 세 가지 측면—프라이버시, 보안, 검열—에서 어떻게 실패하는가 게시물: The Problem with AI Browsers: Security Flaws
평가하지 않으면 정렬할 수 없습니다. “Why AI Alignment Starts With Better Evaluation”라는 게시물이 처음으로 Towards Data Science에 게재되었습니다....
OpenAI는 AI와 정신 건강의 교차점에서 연구를 위해 최대 200만 달러의 보조금을 제공하고 있습니다. 이 프로그램은 실제 위험을 연구하는 프로젝트를 지원합니다.
우리는 프로그래밍 환경에서 보상 해킹을 위한 벤치마크인 EvilGenie를 소개합니다. 우리는 LiveCodeBench에서 문제를 가져와 에이전트가 사용할 수 있는 환경을 만들고...
오프라인 데이터 선택 및 온라인 자체 정제 생성은 데이터 품질을 향상시키며, 대형 언어 모델(LLMs)을 특정 분야에 적용하는 데 중요한 단계입니다.