EUNO.NEWS EUNO.NEWS
  • All (20148) +1
  • AI (3087)
  • DevOps (902) +1
  • Software (10380)
  • IT (5733)
  • Education (45)
  • Notice (1)
  • All (20148) +1
    • AI (3087)
    • DevOps (902) +1
    • Software (10380)
    • IT (5733)
    • Education (45)
  • Notice (1)
  • All (20148) +1
  • AI (3087)
  • DevOps (902) +1
  • Software (10380)
  • IT (5733)
  • Education (45)
  • Notice (1)
Sources Tags Search
한국어 English 中文
  • 1개월 전 · ai

    그들의 일은 AI가 모든 것을 파괴하지 못하도록 하는 것이다

    2020년 5월 어느 밤, 봉쇄가 절정에 이르던 시기에 Deep Ganguli는 걱정하고 있었습니다. 당시 Stanford Institute for Human-Centered AI의 연구 이사였던 Ganguli는…

    #AI safety #GPT-3 #large language models #OpenAI #AI alignment #responsible AI #Stanford HCAI
  • 1개월 전 · ai

    Syntax hacking: 연구원들은 문장 구조가 AI 안전 규칙을 우회할 수 있음을 발견

    새로운 연구는 일부 프롬프트 인젝션 공격이 성공할 수 있는 이유에 대한 단서를 제공합니다....

    #prompt injection #AI safety #language models #prompt engineering #security
  • 1개월 전 · ai

    🧠아마도 나는 그냥 이해를 못 하는 걸까!

    낙관적인 방 안에서 회의적인 입장이 되는 불편한 느낌. 나는 AI와 오랫동안 작업해 왔으며—깊이 관여하고, 제품을 shipping하고, 모델을 wiring models하는 중이다.

    #autonomous agents #prompt engineering #AI governance #AI safety #LLM operations #AI product development
  • 1개월 전 · ai

    아첨은 첫 번째 LLM ‘다크 패턴’이다

    번역할 텍스트를 제공해 주시겠어요?

    #LLM #sycophancy #dark patterns #AI safety #prompt engineering
  • 1개월 전 · ai

    AI 브라우저의 문제점: 보안 결함과 프라이버시의 종말

    Atlas와 대부분의 현재 AI 기반 브라우저가 세 가지 측면—프라이버시, 보안, 검열—에서 어떻게 실패하는가 게시물: The Problem with AI Browsers: Security Flaws

    #AI browsers #privacy #security #censorship #AI safety #web browsing
  • 1개월 전 · ai

    왜 AI 정렬은 더 나은 평가에서 시작되는가

    평가하지 않으면 정렬할 수 없습니다. “Why AI Alignment Starts With Better Evaluation”라는 게시물이 처음으로 Towards Data Science에 게재되었습니다....

    #AI alignment #evaluation #AI safety #machine learning #LLM
  • 1개월 전 · ai

    AI와 정신 건강에 대한 새로운 연구를 위한 자금 지원

    OpenAI는 AI와 정신 건강의 교차점에서 연구를 위해 최대 200만 달러의 보조금을 제공하고 있습니다. 이 프로그램은 실제 위험을 연구하는 프로젝트를 지원합니다.

    #OpenAI #AI research grants #mental health #AI safety #healthcare AI #funding
  • 1개월 전 · ai

    [Paper] EvilGenie: 보상 해킹 벤치마크

    우리는 프로그래밍 환경에서 보상 해킹을 위한 벤치마크인 EvilGenie를 소개합니다. 우리는 LiveCodeBench에서 문제를 가져와 에이전트가 사용할 수 있는 환경을 만들고...

    #reward hacking #code generation #benchmark #LLM evaluation #AI safety
  • 1개월 전 · ai

    [Paper] 오프라인 데이터 선택과 온라인 자체 정제 생성에 대한 통합 이해: 사후 학습 LLM

    오프라인 데이터 선택 및 온라인 자체 정제 생성은 데이터 품질을 향상시키며, 대형 언어 모델(LLMs)을 특정 분야에 적용하는 데 중요한 단계입니다.

    #LLM fine-tuning #bilevel optimization #data selection #self-refining generation #AI safety

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026