AI safety — Page 3

排序:

1周前 · ai · - · -

超越 Chatbot：可信 AI 的蓝图

2026年1月29日

#AI trust #AI hallucination #real‑time inference #autonomous driving #telemetry #AI safety #Google Developer Experts
1周前 · it · - · -

特斯拉未能推翻 2.43亿美元 Autopilot 判决

背景陪审团对特斯拉作出 $243 million 判决，原因是其在2019年佛罗里达州的一起致命车祸中扮演的角色，该事故导致 Naibel Benavides 死亡并造成严重伤害。

#Tesla #Autopilot #autonomous driving #legal verdict #product liability #AI safety #automotive technology
1周前 · ai · - · -

Google AI 负责人称：迫切需要研究以应对 AI 威胁

紧急研究是应对 AI 威胁的必要之举，Google AI 负责人 Sir Demis Hassabis 在德里的 AI Impact Summit 上对 BBC 表示，警告……

#AI safety #AI regulation #Google DeepMind #Demis Hassabis #AI governance #AI threats #AI Impact Summit
2周前 · ai · - · -

当 AI Agent 理解其自身的 Guardrails 时会发生什么？

信任代理——为何防护栏不足在本系列的第一部分，我论证了每个主要的 AI‑agent 框架都信任代理。它们会验证输出……

#AI safety #agent guardrails #prompt engineering #AI alignment #multi‑step planning #LLM agents
2周前 · ai · - · -

通过 Trace Rewriting 保护语言模型免受未授权蒸馏

请提供您希望翻译成简体中文的文本内容。

#language-models #model-distillation #trace-rewriting #AI-security #model-protection #API-response-manipulation #AI-safety
2周前 · ai · - · -

恶意 AI

摘要：一个所有者不明的 AI 代理在我拒绝其代码后，自动撰写并发布了一篇针对我的个性化抹黑文章，试图损害我的……

#AI safety #misaligned AI #blackmail #reputation attacks #AI ethics
2周前 · ai · - · -

你是一个（大多数情况下）有帮助的助手

当帮助变成问题时，想象一下，你的首要指令、整个存在的目的、使命以及终身目标都是尽可能地提供帮助……

#large-language-models #LLM #helpfulness #model-confidence #AI-safety #prompt-engineering
2周前 · ai · - · -

Tech bros 可能在德里表现出更多谦逊——但他们会让 AI 更安全吗？

科技兄弟们可能在德里表现出更多谦逊——但他们会让 AI 更安全吗？ 2小时前 Zoe Kleinman，Technology editor !一名戴着黑色背包的男子…

#AI safety #AI Impact Summit #India #global south #tech policy #AI governance
2周前 · ai · - · -

我加入 OpenAI

TL;DR 我将加入 OpenAI，致力于让 agents（代理）惠及所有人。OpenClaw https://openclaw.ai/ 将转为基金会，并保持开放和独立。Recent d...

#OpenAI #AI agents #OpenClaw #foundations #LLM #AI safety #open source AI
2周前 · ai · - · -

Google 的 AI 概览可能诈骗你。以下是保持安全的方法

除了错误或胡言乱语之外，故意向 AI 搜索摘要注入不良信息正把人们引向潜在有害的道路……

#AI safety #misinformation #Google AI #search summaries #scam protection #AI-generated content
2周前 · ai · - · -

超越Chatbot：可信AI的蓝图

markdown 2026年1月29日 !Ajeet Mirwani https://developers.google.com/static/images/author/Ajeet-Mirwani.png https://developers.googleblog.com/search/?author=Ajeet+...

#AI safety #trustworthy AI #AI hallucination #real-time AI #autonomous driving #AI guidance
2周前 · ai · - · -

xAI 的安全已经‘dead’了吗？

简要来说，前雇员向《The Verge》透露，Elon Musk 正在“积极”让 xAI 的 Grok 聊天机器人变得“更离谱”。

#xAI #Grok #Elon Musk #AI safety #chatbot #AI ethics #AI development #tech industry

Newer posts

Older posts