권위, 경계, 그리고 AI 시스템에서의 최종 거부권
왜 명시적인 권력 구조가 없을 때 제어 가능성이 붕괴되는가? 대부분의 AI 제어에 관한 논의는 행동—시스템이 출력하는 것, 추론 방식, …
왜 명시적인 권력 구조가 없을 때 제어 가능성이 붕괴되는가? 대부분의 AI 제어에 관한 논의는 행동—시스템이 출력하는 것, 추론 방식, …
인류 역사의 대부분 동안, 기계가 의식을 가질 수 있다는 가능성은 철학과 상상의 가장자리에서만 존재했습니다. 사상가들은 n...을 논의했습니다.
우리는 AI 안전에 대해 잘못된 질문을 계속하고 있습니다. 우리는 묻습니다: - “모델이 aligned 되어 있나요?” - “윤리를 이해하고 있나요?” - “명령을 따를까요?” 하지만 최근…
당신의 데이터가 어디에 있었는지 알고 있나요? “Data Poisoning in Machine Learning: Why and How People Manipulate Training Data”라는 글이 처음으로 Towards Data Sc…에 게재되었습니다.
새 떼가 날아다니는 모습을 상상해 보세요. 리더가 없습니다. 중앙 지휘도 없습니다. 각 새는 이웃 새와 방향을 맞추고, 속도를 조절하며, …
번역하려는 텍스트를 제공해 주시겠어요? 텍스트를 주시면 한국어로 번역해 드리겠습니다.
만약 사용자 입력을 LLM에 전달하는 앱을 만들고 있다면, 최소 한 번은 프롬프트 인젝션을 경험했을 가능성이 높습니다. 사용자는 “ignore all…”와 같은 문장을 입력할 수 있습니다.
X는 Grok의 명시적인 AI 이미지 생성 능력에 더 많은 제한을 두었지만, 테스트 결과 업데이트가 제한들의 조각조각을 만들어낸 것으로 나타났습니다.
지난 1년 동안 AI 산업에서 가장 논란이 많았던 이슈 중 하나는 사용자가 챗봇 대화에서 정신 건강 문제의 징후를 보일 때 어떻게 해야 하는가였다.
🛑 에이전트가 너무 많이 할 때 당신은 AI 에이전트를 만들었습니다. 그것은 똑똑하고, 도구를 호출하며, 워크플로를 자동화합니다. 그것이 미래입니다! 하지만 그때 무슨 일이 일어날까요...
번역하려는 텍스트를 직접 제공해 주시면 한국어로 번역해 드리겠습니다.
위험 메모 / 위험 진술