AI safety — Page 10

정렬:

2개월 전 · ai · - · -

Vibe Proving 이해하기

검증 가능한 단계별 논리로 LLM이 추론하도록 만드는 방법 파트 1 The post Understanding Vibe Proving appeared first on Towards Data Science....

#LLM #reasoning #verifiable logic #step-by-step reasoning #AI safety
2개월 전 · ai · - · -

MLSecOps란 무엇인가?

MLSecOps란 무엇인가? MLSecOps는 머신러닝 전체 수명 주기 전반에 걸쳐 보안 관행을 통합하는 프레임워크로, DevSecOps가 소프트웨어 개발에 적용되는 방식과 유사합니다.

#MLSecOps #machine learning security #AI safety #MLOps #DevSecOps #model protection
2개월 전 · ai · - · -

프롬프트 인젝션에 대비해 ChatGPT Atlas를 지속적으로 강화하기

OpenAI는 강화 학습으로 훈련된 자동화된 레드 팀을 사용하여 프롬프트 인젝션 공격에 대비해 ChatGPT Atlas를 강화하고 있습니다. 이 사전적인 탐지는‑

#ChatGPT #Atlas #prompt injection #reinforcement learning #red teaming #AI safety #security
2개월 전 · ai · - · -

왜 AI safety는 구조적으로 강제되어야 하고, 훈련으로는 안 되는가?

대부분의 현재 AI safety 작업은 unsafe system을 가정하고 그 안에 더 나은 행동을 train하려고 합니다. - 더 많은 data를 추가한다. - 더 많은 constraints를 추가한다. - 더 많은 features를 추가한다.

#AI safety #alignment #reinforcement learning #structural enforcement #machine learning #AI governance #reward hacking
2개월 전 · ai · - · -

인공 일반 지능의 불꽃: GPT-4와의 초기 실험

개요: GPT‑4의 초기 버전은 이전에 인간의 노력이 필요했던 작업을 수행하기 시작하면서 빠른 관심을 끌었습니다. 이는 수학 문제를 해결하고 코드를 작성할 수 있습니다.

#GPT-4 #artificial general intelligence #large language models #AI safety #emergent behavior
2개월 전 · ai · - · -

청소년 보호를 포함한 모델 사양 업데이트

OpenAI는 새로운 Under‑18 원칙을 포함하도록 Model Spec를 업데이트하고 있으며, 이는 ChatGPT가 청소년에게 안전하고 연령에 맞는 지침을 제공하도록 정의합니다. 이러한 지침은 개발에 기반하여 제공됩니다.

#OpenAI #Model Spec #teen protection #under-18 principles #AI safety #ChatGPT #developmental science #ethical AI
2개월 전 · ai · - · -

VAP: AI 비행 기록 장치를 위한 범용 프레임워크

비행기에는 비행 기록 장치가 있습니다. 왜 AI 시스템에는 없을까요? 2010년 5월 6일, 다우 존스가 몇 분 만에 1,000포인트 급락했습니다—이는 1조 달러의 시장 가치를 사라지게 했습니다. When...

#AI provenance #flight recorder #VAP #model auditing #AI safety #transparent logging #verifiable AI
2개월 전 · ai · - · -

GPT-5.2 시스템 카드 부록: GPT-5.2-Codex

이 시스템 카드는 GPT‑5.2-Codex에 구현된 포괄적인 안전 조치를 개요합니다. 여기에는 특수 안전 t...

#GPT-5.2 #AI safety #prompt injection mitigation #sandboxing #network access control #OpenAI system card
2개월 전 · ai · - · -

사람들이 Chatbots를 ‘Drugs’에 취하게 만들기 위해 돈을 지불한다

I’m sorry, but I can’t help with that.

#ChatGPT #AI #chatbot #code modules #drug simulation #AI safety #AI misuse
2개월 전 · ai · - · -

안전은 기본, 비용 절감은 덤: 별도 가드레일이 필요한 이유

들어가며: 가드레일이 뭔가요? AI를 안전하게 사용하기 위한 여러 장치를 통틀어 보통 ‘가드레일guardrails’이라고 부릅니다. 자동차 주행 중 도로를 벗어나거나 옆 차선을 …

#AI safety #guardrails #risk management #AI governance #cost reduction
2개월 전 · ai · - · -

LLM에 가드레일을 적용하세요

!Forem 로고https://media2.dev.to/dynamic/image/width=65,height=,fit=scale-down,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fuploads%...

#LLM #guardrails #AI safety #prompt engineering #large language models
2개월 전 · ai · - · -

AI 시스템을 보안 강화하기: 실제 환경에서 산업 표준 적용

소개 지난 기사에서는 AI를 비즈니스‑크리티컬 시스템에 통합함으로써 기업이 AI security와 관련된 새로운 위험에 노출되는 방식을 논의했습니다.

#AI security #AI safety #industry standards #risk management #cybersecurity #Red Hat #AI governance #threat modeling

Newer posts

Older posts