EUNO.NEWS EUNO.NEWS
  • All (20349) +286
  • AI (3104) +14
  • DevOps (907) +7
  • Software (10509) +190
  • IT (5781) +75
  • Education (48)
  • Notice
  • All (20349) +286
    • AI (3104) +14
    • DevOps (907) +7
    • Software (10509) +190
    • IT (5781) +75
    • Education (48)
  • Notice
  • All (20349) +286
  • AI (3104) +14
  • DevOps (907) +7
  • Software (10509) +190
  • IT (5781) +75
  • Education (48)
  • Notice
Sources Tags Search
한국어 English 中文
  • 2周前 · ai

    AI 是否会有一天足够好,不需要支出限制?

    markdown “AI不会只是变得更好吗?” 简短回答:不。理解原因揭示了我们应该如何思考AI安全的根本问题。

    #AI safety #large language models #LLM alignment #RLHF #financial AI #spending limits #LangChain #tool use #probabilistic models
  • 2周前 · ai

    所有 AI 视频都有害 (2025)

    请提供您希望翻译的具体摘录或摘要文本。

    #generative AI #deepfakes #AI ethics #misinformation #AI safety
  • 2周前 · ai

    Llama Guard:基于LLM的输入输出安全防护,面向人机对话

    概述 认识 Llama Guard,这是一款旨在让与 AI 的聊天更安全、更清晰的简易工具。它会审查人们的提问以及 AI 的回答,并 s...

    #Llama Guard #AI safety #LLM moderation #content filtering #open-source AI #prompt-response analysis
  • 2周前 · ai

    AI 奉承恐慌

    抱歉,我无法直接访问外部链接。请您提供需要翻译的具体文本,我会为您翻译成简体中文。

    #AI alignment #LLM behavior #sycophancy #AI safety #benchmark
  • 2周前 · ai

    AI阿谀奉承恐慌

    抱歉,我无法直接访问外部链接。请您提供需要翻译的具体文本,我将为您翻译成简体中文。

    #AI safety #language model behavior #sycophancy #benchmark #research
  • 2周前 · ai

    Nightshade:使图像不适用于模型训练

    文章链接: https://nightshade.cs.uchicago.edu/whatis.html 评论链接: https://news.ycombinator.com/item?id=46487342 积分: 16 评论数: 2

    #image data poisoning #model training protection #AI safety #privacy #nightshade #data security
  • 2周前 · ai

    在接下来的30天里,我将围绕AI民主化进行讨论,使命是:AI应当实用、负担得起且安全,尤其是对小型企业和创始人。

    已清理的 Markdown markdown !Forem 徽标 https://media2.dev.to/dynamic/image/width=65,height=,fit=scale-down,gravity=auto,format=auto/https%3A%2F%2Fdev-to-upload...

    #AI democratization #practical AI #affordable AI #AI safety #small business AI #founder tools
  • 2周前 · ai

    对抗攻击与防御:综述

    概述 今天,许多应用程序使用 deep learning 快速执行复杂任务,从图像分析到语音识别。然而,微小、几乎不可见的变化……

    #adversarial attacks #machine learning security #deep learning robustness #AI safety #neural networks
  • 2周前 · ai

    指令不是控制

    封面图片:Instructions Are Not Control https://media2.dev.to/dynamic/image/width=1000,height=420,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-u...

    #prompt engineering #LLM #jailbreak #AI safety #language models
  • 2周前 · ai

    The Loop 改变了一切:为何 Embodied AI 打破当前的对齐方法

    无状态 vs 有状态 AI ChatGPT 和类似的聊天模型是无状态的:每个 API 调用都是独立的,模型没有: - 持久记忆 —— 它会忘记每一次交互。

    #embodied AI #AI alignment #stateless models #large language models #robotics #AI safety
  • 2周前 · ai

    别再乞求你的AI安全:约束工程的论证

    我厌倦了把“Prompt Engineering”作为安全策略。如果你正在构建自主代理——能够实际执行诸如查询数据库、移动文件等操作的 AI……

    #AI safety #constraint engineering #prompt engineering #autonomous agents #LLM security #prompt injection #AI reliability
  • 3周前 · ai

    为什么“Smart” AI仍然做出愚蠢的决定

    没有约束的智能不过是速度。当一个 AI 系统做出错误决策时,我们通常会责怪模型。但大多数情况下,模型正是……

    #AI safety #guardrails #control logic #model constraints #decision making #predictability #AI reliability

Newer posts

Older posts
EUNO.NEWS
RSS GitHub © 2026