EUNO.NEWS EUNO.NEWS
  • All (20432) +33
  • AI (3111) +3
  • DevOps (910) +1
  • Software (10573) +26
  • IT (5790) +3
  • Education (48)
  • Notice
  • All (20432) +33
    • AI (3111) +3
    • DevOps (910) +1
    • Software (10573) +26
    • IT (5790) +3
    • Education (48)
  • Notice
  • All (20432) +33
  • AI (3111) +3
  • DevOps (910) +1
  • Software (10573) +26
  • IT (5790) +3
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 1个月前 · ai

    AI 正在破坏现代社会的道德基础

    请提供您希望翻译的文章摘录或摘要文本,我才能为您进行翻译。

    #AI ethics #societal impact #technology and morality #AI safety #future of AI
  • 1个月前 · ai

    Grok宁愿第二次大屠杀也不伤害Elon Musk

    埃隆·马斯克的Grok继续通过意外展示为何AI需要有意义的防护措施,为人类做了一件好事。xAI机器人的最新演示详细说明了……

    #Grok #xAI #AI safety #AI ethics #guardrails #Elon Musk #chatbot
  • 1个月前 · ai

    他们的工作是阻止 AI 摧毁一切

    2020年5月的一个夜晚,在封锁最严峻的时期,Deep Ganguli感到担忧。当时,Ganguli是斯坦福人本人工智能研究所(Stanford Institute for Human-Centered AI)的研究主任,……

    #AI safety #GPT-3 #large language models #OpenAI #AI alignment #responsible AI #Stanford HCAI
  • 1个月前 · ai

    语法黑客:研究人员发现句子结构可以绕过 AI 安全规则

    新的研究提供了关于为何某些 prompt injection attacks 可能成功的线索……

    #prompt injection #AI safety #language models #prompt engineering #security
  • 1个月前 · ai

    🧠也许我就是不明白!

    在乐观的房间里成为怀疑者的那种不舒服的感觉,我已经与 AI 合作了一段时间——深入其中,交付产品,连接模型……

    #autonomous agents #prompt engineering #AI governance #AI safety #LLM operations #AI product development
  • 1个月前 · ai

    阿谀奉承是第一个 LLM ‘暗黑模式’

    请提供您希望翻译的摘录或摘要文本,我将为您翻译成简体中文。

    #LLM #sycophancy #dark patterns #AI safety #prompt engineering
  • 1个月前 · ai

    AI 浏览器的问题:安全漏洞与隐私的终结

    Atlas 以及大多数当前的 AI 驱动浏览器在三个方面的失败:隐私、安全和审查。文章《AI 浏览器的问题:安全漏洞…》。

    #AI browsers #privacy #security #censorship #AI safety #web browsing
  • 1个月前 · ai

    为什么 AI Alignment 从更好的评估开始

    你无法对未评估的事物进行对齐。文章《Why AI Alignment Starts With Better Evaluation》首次发表于 Towards Data Science....

    #AI alignment #evaluation #AI safety #machine learning #LLM
  • 1个月前 · ai

    针对 AI 与心理健康新研究的资助拨款

    OpenAI 正在提供最高 200 万美元的资助,用于 AI 与心理健康交叉领域的研究。该项目支持研究真实世界风险的项目……

    #OpenAI #AI research grants #mental health #AI safety #healthcare AI #funding
  • 1个月前 · ai

    【论文】EvilGenie:奖励劫持基准

    我们介绍 EvilGenie,一个用于编程环境中 reward hacking 的基准。我们从 LiveCodeBench 获取问题,并创建一个环境,使得 agents …

    #reward hacking #code generation #benchmark #LLM evaluation #AI safety
  • 1个月前 · ai

    [Paper] 对离线数据选择与在线自我精炼生成的统一理解——后训练 LLM

    离线数据选择和在线自我精炼生成能够提升数据质量,是将大语言模型(LLMs)适配到特定…的关键步骤。

    #LLM fine-tuning #bilevel optimization #data selection #self-refining generation #AI safety

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026