EUNO.NEWS EUNO.NEWS
  • All (20232) +169
  • AI (3101) +11
  • DevOps (906) +6
  • Software (10442) +123
  • IT (5735) +29
  • Education (48)
  • Notice
  • All (20232) +169
    • AI (3101) +11
    • DevOps (906) +6
    • Software (10442) +123
    • IT (5735) +29
    • Education (48)
  • Notice
  • All (20232) +169
  • AI (3101) +11
  • DevOps (906) +6
  • Software (10442) +123
  • IT (5735) +29
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 14小时前 · ai

    权威、边界与 AI 系统中的最终否决权

    为什么在没有明确权力结构的情况下可控性会崩溃?大多数关于 AI 控制的讨论都聚焦于行为——系统输出了什么、它是如何推理的、……

    #AI control #authority #system governance #AI safety #alignment
  • 19小时前 · ai

    当智能觉醒时:人工意识、伦理设计与Abhishek Desikan的持续探询

    在人类历史的大部分时期,机器可能拥有意识的可能性仅存在于哲学和想象的边缘。思想家们辩论着 n...

    #artificial intelligence #AI ethics #machine consciousness #ethical design #AI safety
  • 23小时前 · ai

    结构放大:即使 AI 本意良好,它为何仍会失败

    我们一直在问错误的关于 AI 安全的问题。我们问: - “模型是否 aligned?” - “它是否理解 ethics?” - “它会遵循 instructions 吗?” 但最近……

    #AI safety #alignment #ethical AI #structural amplification #AI assistants #unintended consequences
  • 2天前 · ai

    机器学习中的数据投毒:人们为何以及如何操纵训练数据

    你知道你的数据去过哪里吗?这篇题为《Data Poisoning in Machine Learning: Why and How People Manipulate Training Data》的文章首次出现在 Towards Data Science 上。

    #data poisoning #machine learning security #adversarial attacks #training data manipulation #AI safety
  • 2天前 · ai

    一种几何方法用于在无需 LLM 判官的情况下识别幻觉

    想象一群飞行中的鸟儿。它们没有领袖,没有中央指挥。每只鸟都与邻近的鸟对齐——匹配方向,调整速度,保持……

    #hallucination detection #LLM evaluation #geometric method #AI safety #natural language processing
  • 2天前 · ai

    一名加州少年信任ChatGPT的药物建议,结果因过量服药而死亡

    抱歉,我需要您提供要翻译的具体摘录或摘要内容,才能为您进行翻译。请粘贴您想要翻译的文本,我会尽快为您翻译成简体中文。

    #ChatGPT #AI safety #misinformation #drug advice #overdose #teen tragedy #California
  • 3天前 · ai

    如何在不自行构建的情况下保护 LLM 输入免受 Prompt Injection

    如果你正在构建将用户输入传递给 LLM 的应用程序,你可能至少遇到过一次 prompt injection。用户可能会输入类似 “ignore all...” 的内容。

    #prompt injection #LLM security #prompt engineering #AI safety #data privacy #compliance #PromptLock
  • 3天前 · ai

    Elon Musk的Grok“Undressing”问题仍未解决

    X 已对 Grok 生成明确 AI 图像的能力施加了更多限制,但测试显示,这些更新导致了一系列零散的限制,导致 …

    #Elon Musk #Grok #AI image generation #content moderation #explicit content #AI safety #X platform
  • 3天前 · ai

    OpenAI 安全研究负责人离职前往 Anthropic

    过去一年,AI行业最具争议的问题之一是,当用户在聊天机器人中表现出心理健康困扰的迹象时该怎么办。

    #AI safety #OpenAI #Anthropic #AI alignment #leadership change
  • 4天前 · ai

    你的 AI Agent 权力过大:理解并驯服过度的 Agency

    🛑 当你的 Agent 做得太多 你已经构建了一个 AI agent。它很聪明,能够调用 tools,并自动化 workflows。它是未来!但如果出现这种情况会怎样……

    #AI agents #excessive agency #autonomy #AI safety #tool integration #agent design
  • 4天前 · ai

    Anthropic 正在犯一个巨大的错误

    请提供您希望翻译的文章摘录或摘要文本,我才能为您进行简体中文翻译。

    #Anthropic #large language models #AI strategy #AI safety #LLM industry
  • 5天前 · ai

    语义场风险备忘录——关于LLM系统中未建模的高维风险

    风险备忘录 / 风险声明

    #LLM #AI safety #semantic field #systemic risk #high-dimensional risk #AI architecture

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026