영원한 Sloptember
It looks like only the source line was provided. Could you please share the text you’d like translated? Once I have the content, I’ll translate it into Korean while keeping the source link and formatting unchanged.
Introduction
지금 바로 말하자면: AI 에이전트를 소프트웨어 개발에 도입하는 것은 이 분야 역사상 가장 비용이 많이 드는 실수 중 하나가 될 것입니다. 에이전트는 프로그래밍을 할 수 없으며, 그들이 할 수 없다는 것을 깨닫는 데 시간이 점점 더 오래 걸리고 있습니다. 그들은 프로그래밍의 분포를 모방하도록 설계된 고도로 정교한 통계 모델입니다. 출력은 깨져 있지만, 점점 더 정확한 통계 모델에서 기대할 수 있는 방식으로 감지하기가 어려워지고 있습니다.
Source: …
AI 에이전트와의 개인 실험
처음에는 이를 거부했습니다. 저는 트위터에서 말하는 ‘상태 불안’에 동조하며, 제 프로그래밍 능력으로 제 자존감을 정의했기 때문에, 그 손실이라고 느껴지는 것에 대해 방어적으로 반응하는 것이 당연했습니다. 저는 제 자아를 보존하기 위해 모델이 코딩할 수 있다는 사실을 가능한 한 오래 부정하려고 애썼습니다.
그들은 제가 평생을 바쳐도 풀 수 없을 정도의 수학 문제를 해결할 수 있다는 것이 명백합니다. 그렇다면 왜 프로그래밍은 못할까요? 어쩌면 저는 그들의 “천재성”을 알아볼 만큼 충분히 좋은 프로그래머가 아닐지도 모릅니다.
지난 6개월 동안 정말 열심히 시도해 보았습니다:
- 에이전트를 이용해 tinygrad의 일부를 작성했습니다:
test/mockgpu/amd/emu.py - 에이전트를 이용해 USB ↔ PCIe 칩을 역공학했습니다:
asm2464pd-firmware
각 경우마다 제가 직접 손으로 더 빠르고 잘 할 수 있었을 것이라고 의심했습니다. 에이전트는 모든 진행을 미리 해 놓고, 결과를 다듬기 위해 레버를 잡아당기게 합니다. 하지만 결코 완벽히 도달하지 못합니다.
모든 모델, 하니스, 프롬프트를 다 써보았습니다. “잘못 사용하고 있다”는 주장은 슬롯머신 비유와 같습니다: 체리 뒤에 여러 라인에 베팅을 해야 하니, 당연히 이기기 어렵죠.
Utility and Limitations
AI가 쓸모 없다고 말하는 것이 아니라—분명히 유용합니다. 대부분의 검색에 있어서는 더 나은 구글이며, 다듬기가 필요 없는 빠른 프로토타입에서는 엄청나게 빠릅니다. 하지만 제가 일해 본 어떤 회사에서도 요구되는 수준의 소프트웨어 엔지니어는 아닙니다. 핵심은 언제 사용하고 언제 사용하지 말아야 하는지를 아는 것입니다.
조직 및 산업에 미치는 영향
나는 자기‑가치 보존 관점에 대해 더 생각해 보았다. AFL 같은 도구가 LLM보다 더 많은 버그를 찾아냈으며, 아무도 위협을 느끼지 못했다. 체스와 바둑은 그 어느 때보다 인기가 있다. 내가 신뢰할 수 있는 로봇 동료 군대를 만들어 내 코드를 정리하게 할 날이 기다려진다! 나는 지위 상실을 두려워하지 않는다; 이것은 에이전트를 팔기 위한 심리전이라고 의심한다. 손실에 대한 두려움은 대기업을 움직이게 하는 유일한 방법 중 하나이며, 그 두려움 속에서 그들은 큰 실수를 저지르고 있다.
에이전트는 고성능 개인이나 소규모 팀보다 대규모 조직에 더 큰 피해를 줄 것이다. 지난 6개월 동안의 관찰에 따르면, 고성능 인재들은 여전히 오류를 교정하고 AI‑생성 코드에서 “불량”을 찾아낼 수 있다. 그들은 언제 에이전트를 사용할지, 언제 신뢰할지, 출력물을 어떻게 통합할지 등 외부 루프를 탐색하고 활용하며 조정하는 데 시간을 투자한다. 매우 제한된 영역을 제외하고는 모든 코드를 무조건 받아들이는 모델로 전환하는 모습을 보지 못했다.
하지만 대규모 조직은 피드백 루프가 느리고 정렬이 부족하다. 하위 성과자들은 자기 검증이 부족해 에이전트를 사용하면 출력량을 열 배 이상 늘릴 수 있다. 이러한 조직—그리고 궁극적으로 전 세계—의 평균 출력은 저품질 코드로 범람하게 될 것이다. 더 많은 코드, 더 많은 앱, 더 많은 기능이 생성되어 “불량의 양동이”가 황금시대를 맞이하고, 고품질의 보석은 어두운 시대로 접어들게 된다.
Future Outlook
Apple이 모든 엔지니어에게 AI를 강제로 적용하고 있다는 보도가 있습니다. 사람들은 추상적으로 생각할 때 AI가 모든 것을 처리할 것이라고 가정하지만, 구체적인 예가 중요합니다. 앞으로 2년 안에 macOS는 더 좋아질까요, 아니면 더 나빠질까요?
사람들은 어떤 산출물을 볼 때 그 창작자가 인간의 사고 방식을 가졌다고 가정합니다. 그러나 그 가정은 더 이상 유효하지 않습니다. AI가 만든 산출물은 이전에는 불가능했던 방식으로 깨질 수 있어, 구문, 문법과 같은 기존의 품질 대리 지표를 무용지물로 만들 수 있습니다. 인간적인 방식으로 그 산출물과 상호작용하고 기반 위에 무언가를 구축하려 할 때, 미묘한 통계적 차이가 명백히 드러납니다.
저는 현재 LLM에 대해 LeCun/Marcus 진영과 의견이 일치합니다: 이런 모델들이 진정한 의미에서 프로그래밍을 할 수 있을 거라고는 생각하지 않습니다; 과정 자체가 중요합니다. 딥러닝은 여전히 하나의 해결책이지만, 실제 프로그래밍 에이전트는 현재의 “RL‑VR” 접근 방식—실패하는 테스트를 주석 처리하고 통과했다고 선언하는 방식—이 아니라 세계 모델을 필요로 할 것입니다.
결론
이 시대의 진정한 이야기는 AI 정신병에서 자신을 해치지 않고 버텨내는 사람일 것이다.