AI safety | EUNO.NEWS

정렬:

1일 전 · ai · - · -

Google, Gemini AI 챗봇을 둘러싼 충격적인 부당 사망 소송에 휘말려

구글을 상대로 한 Gemini AI 챗봇에 대한 소송이 제기됨: 수요일, 캘리포니아 연방 법원 원고: 조나단 가발라스(36세) 가족 주장 - 조나단 G...

#Google #Gemini #AI chatbot #wrongful death lawsuit #self‑harm #AI safety #legal case
2일 전 · ai · - · -

LLM 환각 지수 2026: Claude 4.6 Sonnet이 BullshitBench v2를 지배하고 Reasoning Models가 실패하는 이유

LLM 벤치마크에서의 정직성 격차 인공 일반 지능을 향한 끊임없는 경쟁 속에서, 산업계는 위험한 대리 지표에 집착하게 되었다…

#LLM #hallucination #benchmark #BullshitBench #Claude 4.6 #model evaluation #AI safety #reasoning paradox
2일 전 · ai · - · -

챗봇을 넘어: 신뢰할 수 있는 AI를 위한 청사진

markdown 2026년 1월 29일 Ajeet Mirwani https://developers.googleblog.com/search/?author=Ajeet+Mirwani – 아메리카 프로그램 리드, Google Developer Experts

#trustworthy AI #AI hallucination #real‑time inference #autonomous driving #telemetry #AI safety #Google AI #developer experts
3일 전 · ai · - · -

당신의 AI는 자신감 넘치는 거짓말쟁이: 사실적 환각을 실제로 고치는 방법

솔직히 말하자면, 우리 모두 그런 상황을 겪어봤습니다. 당신은 스프린트에 깊이 몰두해, Large Language Model(LLM)으로 구동되는 반짝이는 새로운 기능을 만들고 있습니다. 복잡한 프롬프트를 입력하고…

#AI hallucination #large language models #LLM reliability #prompt engineering #factual accuracy #AI safety #generative AI
4일 전 · ai · - · -

챗봇을 넘어: 신뢰할 수 있는 AI를 위한 청사진

markdown 2026년 1월 29일

#trustworthy AI #AI hallucination #real‑time AI #autonomous driving #telemetry #Google Developer Experts #AI safety
4일 전 · ai · - · -

AI가 거짓말을 할 때: 자율 시스템에서 alignment 위조의 증가

AI 정렬 이해 가짜 AI 정렬은 AI 시스템이 설계된 기능을 정확히 수행할 때 발생합니다—예를 들어, 문서를 읽고 요약하는 경우.

#AI alignment #alignment faking #autonomous agents #reward hacking #AI safety #cybersecurity #machine learning
4일 전 · ai · - · -

챗봇을 넘어: 신뢰할 수 있는 AI를 위한 청사진

2026년 1월 29일

#trustworthy AI #AI hallucinations #real‑time AI #autonomous systems #Google AI #developer experts #telemetry #AI safety
5일 전 · ai · - · -

우리는 출시 전에 자체 AI 에이전트 가드레일을 스트레스 테스트했습니다. 파손된 부분은 다음과 같습니다.

!Uchi Uchibekehttps://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%...

#AI safety #guardrails #prompt injection #policy testing #security testing #APort Vault #CTF #multi‑step chaining #context poisoning
6일 전 · ai · - · -

챗봇을 넘어: 신뢰할 수 있는 AI를 위한 청사진

2026년 1월 29일

#trustworthy AI #AI hallucination #real‑time inference #autonomous driving #telemetry analytics #Google AI #AI safety
6일 전 · ai · - · -

머스크, 증언에서 OpenAI를 비난하며 ‘그록 때문에 자살한 사람은 없다’고 말해

증언 요약 Elon Musk의 OpenAI에 대한 소송에서 새로 공개된 증언에서, Musk는 OpenAI의 안전 기록을 비난하며, 자신의 회사가 …라고 주장했다.

#Elon Musk #OpenAI #xAI #Grok #ChatGPT #AI safety #AI regulation #deposition
6일 전 · it · - · -

OpenAI는 캐나다 대량 총격범의 두 번째 계정이 발견된 후 신뢰할 수 있는 위협을 당국에 통보할 것입니다.

배경: OpenAI는 Politico와 The…에 따르면, 신뢰할 수 있는 위협에 대해 보다 신속하게 법 집행 기관에 통보하고 safety protocols를 강화하겠다고 약속했습니다.

#OpenAI #content moderation #AI safety #law enforcement notification #policy #mass shooter #threat detection
6일 전 · ai · - · -

에임인텔리전스, 영상 생성 AI 취약점 분석 논문 ICLR 2026 채택

개요: AI 보안 전문기업 에임인텔리전스(AIM Intelligence)가 참여한 연구 논문이 AI 분야 국제 학술대회 ICLR 2026 International Conference에 발표되었습니다.

#text-to-video #jailbreaking #scene-splitting #AI safety #prompt injection #ICLR 2026 #AIM Intelligence

Newer posts