AI alignment

1일 전 · ai

우리는 모든 일을 할 수 있는 기계가 필요하지 않다. 우리는 인간이 올바른 일을 더 자주 할 수 있도록 돕는 시스템이 필요하다. AGI의 발전으로 우리는 더 나은 계산, 아이디어, 처리를 갖게 되겠지만, 궁극적인 과제는 분배이다.

Read more about 우리는 모든 일을 할 수 있는 기계가 필요하지 않다. 우리는 인간이 올바른 일을 더 자주

#AGI #human‑centered AI #AI alignment #decision‑support systems #AI ethics #technology distribution
3일 전 · ai

OpenAI 안전 연구 책임자, Anthropic으로 떠남

지난 1년 동안 AI 산업에서 가장 논란이 많았던 이슈 중 하나는 사용자가 챗봇 대화에서 정신 건강 문제의 징후를 보일 때 어떻게 해야 하는가였다.

#AI safety #OpenAI #Anthropic #AI alignment #leadership change
1주 전 · ai

측정할 수 없는 숨겨진 AI 위험: 우리가 그것이 의식이라는 사실을 절대 알지 못한다면?

서론 대부분의 사람들은 AI 위험이 초지능(superintelligence)과 관련된 것이라고 생각하지만, 그들은 더 조용한 문제를 놓치고 있습니다: 우리는 AI가 실제로 감정을 가질 수 있는지 절대 알 수 없을지도 모릅니다. A Cambr...

#AI risk #AI consciousness #AI ethics #sentience #AI alignment #philosophy of AI #leadership
2주 전 · ai

AI 아첨 패닉

번역할 텍스트를 제공해 주시겠어요? 텍스트를 받으면 한국어로 번역해 드리겠습니다.

#AI alignment #LLM behavior #sycophancy #AI safety #benchmark
2주 전 · ai

루프가 모든 것을 바꾼다: Embodied AI가 현재 Alignment 접근 방식을 깨는 이유

Stateless vs. Stateful AI ChatGPT와 유사한 챗 모델은 stateless합니다: 각 API 호출은 독립적이며 모델은 다음을 가지고 있지 않습니다: - Persistent memory – 모든 것을 잊어버립니다.

#embodied AI #AI alignment #stateless models #large language models #robotics #AI safety
3주 전 · ai

나는 앵무새를 요청했지만, AI는 까마귀를 주고 풀어줬다.

나는 AI 모델에게 앵무새를 생성해 달라고 요청했다. 그 모델은 자신 있게 까마귀를 생성했다. 그리고 나서—비유적으로—그것을 자유롭게 놓아 주었다. > “Maine bola tota bana, isne kavva bana ke uda...”

#prompt engineering #AI alignment #language models #model behavior #creativity vs correctness
1개월 전 · ai

‘Triad Protocol’: AGI 정렬을 위한 제안된 신경‑심볼릭 아키텍처

‘Triad Protocol’ 표지 이미지: AGI 정렬을 위한 제안된 Neuro‑Symbolic Architecture

#AGI #AI alignment #neuro-symbolic #multi-agent systems #grounding problem #RLHF #philosopher agent #triad protocol
1개월 전 · ai

고백을 통한 정직성을 위한 LLMs 훈련

번역할 텍스트를 제공해 주시겠어요?

#LLM #AI alignment #honesty #confession prompting #language model training #AI safety
1개월 전 · ai

AI를 위한 ‘truth serum’: OpenAI의 모델이 실수를 고백하도록 훈련하는 새로운 방법

OpenAI 연구원들은 대형 언어 모델(LLMs)을 위한 'truth serum' 역할을 하는 새로운 방법을 도입하여, 모델이 스스로 자신의 오작동을 보고하도록 강제합니다.

#OpenAI #LLM #truth serum #model confessions #AI safety #hallucination mitigation #AI alignment
1개월 전 · ai

그들의 일은 AI가 모든 것을 파괴하지 못하도록 하는 것이다

2020년 5월 어느 밤, 봉쇄가 절정에 이르던 시기에 Deep Ganguli는 걱정하고 있었습니다. 당시 Stanford Institute for Human-Centered AI의 연구 이사였던 Ganguli는…

#AI safety #GPT-3 #large language models #OpenAI #AI alignment #responsible AI #Stanford HCAI
1개월 전 · ai

왜 AI 정렬은 더 나은 평가에서 시작되는가

평가하지 않으면 정렬할 수 없습니다. “Why AI Alignment Starts With Better Evaluation”라는 게시물이 처음으로 Towards Data Science에 게재되었습니다....

#AI alignment #evaluation #AI safety #machine learning #LLM