컴퓨터가 드디어 듣는 법을 배웠다

발행: (2026년 2월 10일 오후 06:17 GMT+9)
17 분 소요
원문: Dev.to

Source: Dev.to


위에 제공된 링크에 포함된 전체 텍스트를 알려주시면, 해당 내용을 한국어로 번역해 드리겠습니다.
(코드 블록, URL, 마크다운 형식 등은 그대로 유지됩니다.)

소개

컴포스텔라에 바가 하나 있다 — 어느 바인지 말하지 않을게, 그렇지 않으면 모두가 가서 망쳐버릴 테니까 — 그곳의 바텐더는 한 번도 내가 뭐 마시고 싶은지 물어본 적이 없다. 내가 들어오는 걸 보고 바로 따라준다. 15년 동안 그렇게 해왔다. 내가 앉는 자세만 보고도 그날이 커피 날인지 리베이루 날인지 안다. 그는 절대 틀리지 않는다.

이 이야기를 꺼내는 이유는 지난 주에 나는 컴퓨터와 파일이 어디에 저장됐는지 두고 한 시간을 논쟁했기 때문이다.

그 파일은 존재했다. 내가 직접 썼다. 컴퓨터도 그 사실을 알고 있었다. 하지만 컴퓨터는 정확한 경로와 정확한 이름, 정확한 철자를 기억하라고 요구했다. 컴퓨터는 완벽한 기억력과 전혀 주도성이 없는 존재다. 무한한 파일 캐비닛을 가진 사무원인데 상식은 전혀 없다.

“무슨 말인지 알겠죠,” 나는 화면에, 당신이 하는 방식대로 말했다.

부서진 데스크톱 은유

1984년 — 책이 아니라 연도, 비록 그 책도 관련이 있지만 — 애플은 컴퓨팅의 미래가 폴더가 있는 데스크톱이라고 말했습니다. 은유였습니다. 파일은 작은 폴더 그림 안에 들어가고, 여러분은 그것들을 정리하며, 모든 것이 직관적일 것이라고 했죠.

그리고 실제로 그랬습니다. 약 십 년 동안은요.

그 뒤에 파일이 더 많아졌고, 이메일이 생겼으며, 웹, 탭, 앱, 알림, 클라우드 스토리지까지 등장하면서 데스크톱 은유는 잔인한 농담이 되었습니다. 아무도 47,000개의 아이템을 책상 위에 두지 않으며, 아무도 잠자는 동안 책상이 메시지를 보내지 않습니다.

은유는 깨졌습니다. 하지만 우리는 계속 사용했습니다. 우리는 아직도 사용하고 있습니다. 사소한 폴더 그림을 끌어다 놓으며 이것이 정상이고, 우리 손주들도 똑같이 할 것이라고 가장하고 있습니다.

그들은 그렇지 않을 겁니다.

OpenClaw 소개

저는 OpenClaw이라는 것을 사용하고 있습니다.

무엇을 하는지 설명하려고 하는데, 듣는 사람에 따라 너무 단순하거나 너무 이상하게 들릴 겁니다. 여기 있습니다: 원하는 것을 말로 컴퓨터에 알려주면, 컴퓨터가 그것을 수행합니다.

  • “이 명령을 입력하세요.”가 아닙니다.
  • “여기를 클릭하고, 그 다음 여기, 또 여기.”가 아닙니다.
  • “이 애플리케이션의 열일곱 개 메뉴를 외우세요.”가 아닙니다.

당신이 원하는 것을 말하면, 컴퓨터가 방법을 찾아냅니다.

  • 지난 주에 읽던 포르투갈 기차에 관한 기사 찾아줘.
  • 이 문서를 내 편집자에게 보내줘.
  • 내일 회의가 뭐가 있지?
  • 텍스트를 크게 해줘. 아니, 모든 텍스트를. 어디든지.

그리고 컴퓨터가 그것을 해줍니다. 모든 가능한 요청을 미리 프로그램한 것이 아니라 — 그건 불가능하기 때문입니다 — 요청을 이해하고 도구를 어떻게 사용하는지 알기 때문입니다.

과학 소설처럼 들리겠지만, 지난 10년간 우리를 실망시켜 온 음성 비서와도 비슷하게 들릴 수 있습니다. 하지만 차이가 있습니다, 그리고 그 차이는 중요합니다.

음성 비서는 파티 트릭이었습니다. 질문에 답할 수 있었고, 타이머를 설정할 수 있었으며, 정확히 맞는 방식으로 물으면 음악을 재생할 수도 있었습니다. 하지만 손이 없었기 때문에 실제로 할 수 있는 일은 없었습니다. 그들은 병 속의 머리였죠.

이것은 다릅니다. 이것은 손이 있습니다.

견습생 비유

내 친구—전통적인 목수이며 우리 모두보다 오래 갈 가구를 만드는 사람—이 한때 자신의 견습 과정에 대해 이야기해 주었습니다. 그 스승은 이렇게 말하곤 했습니다:

“나에게 테이블을 만들어라.”

다음과 같이 말하지는 않았습니다:

“세 번째 선반에 있는 참나무 판자를 꺼내서, 톱날을 … 로 설정한 테이블 톱으로 180센티미터로 자라.”

그저 “나에게 테이블을 만들어라.” 라고만 했을 뿐입니다.

견습생은 나머지를 스스로 알아내야 했습니다. 그것이 요점이었습니다. 스승의 일은 결과를 설명하는 것이었고, 견습생의 일은 그 결과를 달성할 만큼 충분히 기술을 이해하는 것이었습니다.

우리는 40년 동안 견습생이었습니다. 컴퓨터가 스승이었습니다. 컴퓨터는 정확히 어떤 버튼을 눌러야 하는지 알려주고, 우리는 그 버튼을 누릅니다. 우리는 매번, 하루에 수천 번씩 우리의 의도를 컴퓨터의 언어로 번역합니다.

이것은 역전된 상황입니다. 이것은 언제나 역전된 상황이었습니다. 우리는 그저 다른 선택지가 없었을 뿐이었습니다.

이제는 달라질 수도 있습니다.

에이전시 운영 체제

나는 이것을 에이전시 운영 체제라고 부른다, 어색한 표현이지만 더 좋은 것이 생각나지 않는다. 아이디어는 간단하다: 운영 체제가 버튼이 달린 파일 캐비닛이 아니라 유능한 비서가 된다. 당신이 원하는 것을 설명한다. 그것이 행동한다.

  • 당신이 세세히 관리해야 하는 비서가 아니다.
  • 매 30초마다 질문을 던지는 비서도 아니다.

그 코뮌스에서 만난 바텐더 같은 비서: 주의를 기울이고, 맥락을 파악하며, 모든 것을 원리부터 설명하지 않아도 올바른 일을 해주는 비서.

이것은 인공지능에 관한 것이 아니라, 혹은 인공지능만의 문제가 아니다. 아키텍처에 관한 것이다. 인간이 결과를 기술하고 기계가 구현을 담당하도록 결정하는 것. 이것이 원래 그래야 했다는 것을 받아들이는 것이다.

다가오는 위협

이제. 여기서 나는 긴장한다.

왜냐하면 이 미래는 우리가 만들든 말든 다가오고 있다. 대형 기술 기업들도 이를 보고 있다.

  • Apple이 작업 중이다.
  • Microsoft이 작업 중이다.
  • Google도 확실히 작업 중이다.

그들은 일부 국가의 시민 수보다 더 많은 엔지니어를 보유하고 있다.

그리고 그들은 자신들의 방식대로 그것을 구축할 것이다.

그들의 방식은 다음과 같다:

  • 그들의 하드웨어에 종속된다.
  • 당신과 컴퓨터 간의 대화가 그들의 서버에 영원히 저장되어 그들의 이익을 위해 사용된다.
  • 어시스턴트는 당신이 그들의 정원 안에 머물고, 구독료를 지불하며, 약관에 동의하는 한 훌륭히 작동한다.

우리는 이것을 이전에 보았다. 우리는 지금 그 안에 살고 있다.

개인에서 보편으로

The personal computer was supposed to be personal. That was the revolution. Before the PC, computers belonged to institutions — universities, corporations, governments. The PC put the machine in your home, under your control.

그리고 한동안 그것은 사실이었습니다. 여러분은 하드웨어를 소유했고, 소프트웨어도 소유했습니다. 어떻게 작동하는지 열어보고, 방법을 알았다면 수정할 수도 있었습니다. 컴퓨터는 여러분의 것이었습니다.

그런 다음 서서히 소유권이 사라지기 시작했습니다.

  • The software moved to subscriptions.
    • 소프트웨어가 구독 형태로 전환되었습니다.
  • The files moved to the cloud.
    • 파일이 클라우드로 이동했습니다.
  • The operating system started requiring an account, then an internet connection, then your biometric data.
    • 운영 체제가 계정을 요구하고, 그 다음 인터넷 연결을, 그리고 마지막으로 여러분의 생체 정보를 요구하기 시작했습니다.

The personal computer became a personal terminal to someone else’s computer. You were renting your own desk.

개인용 컴퓨터는 다른 사람의 컴퓨터에 연결된 개인 터미널이 되었습니다. 여러분은 자신의 책상을 빌리는 셈이었습니다.

자유 소프트웨어의 역할

Free software — 1980년대 리처드 스톨만이 시작하고, 1990년대 리누스 토발즈가 실용화한 — 그것은 저항이었습니다. GNU, Linux, 그리고 모두에게 속하고 누구에게도 속하지 않는 전체 도구 생태계. 그것은 컴퓨터가 진정으로 당신의 것일 수 있다는 생각을 보존했습니다.

수백만 명이 그것을 사용합니다. 서버가 그것 위에서 구동됩니다. 전화기도 그것 위에서 구동됩니다(그들이 얼마나 잠겨 있는지는 알 수 없겠지만). 그것은 작동합니다. 그것은 중요합니다.

그리고 이제 우리는 다음 변화를 위해 다시 필요합니다.

왜냐하면 에이전시 운영 체제가 독점 형태로만 존재한다면 — 듣는 컴퓨터를 갖는 유일한 방법이 Apple, Microsoft, Google가 모든 상호작용을 중재하도록 하는 것이라면 — 우리는 되찾기 매우 어려운 무언가를 잃게 됩니다.

프라이버시만이 아니라, 그것도 마찬가지이고, 소유권만이 아니라, 그것도 마찬가지입니다. 더 근본적인 무언가: 자신의 도구와 기업의 이익에 의해 감독되지 않는 관계를 가질 수 있는 능력.

컴포스텔라의 바텐더는 내 음주 습관을 아무에게도 보고하지 않습니다. 그는 내가 코카‑콜라를 더 좋아할 수도 있다고 제안하지도 않습니다. 그는 붓는 중간에 멈춰 광고를 보여주지도 않습니다. 관계는 단순합니다: 나는 손님이고, 그는 바텐더이며, 음료는 좋습니다.

나는 내 컴퓨터와도 그런 관계를 원합니다. 나만 그런 것이 아니라고 생각합니다.

그래서 여기 내 요청이 있습니다. 무언가를 만드는 사람들에게, 그리고 40년 동안 자유 소프트웨어를 살아 있게 한 커뮤니티들에게:

  • 이걸 구축하십시오. GNU/Linux, BSD, 사용자들을 존중하는 모든 시스템에서 실행될 수 있는 에이전시 레이어를 구축하십시오.
  • 오픈 소스로 구축하여 우리가 어떻게 작동하는지 볼 수 있게 하십시오.
  • 대화가 우리 기기 안에 머물도록 구축하십시오. 즉, 어시스턴트가 우리에게 서비스를 제공하고 먼 데이터 센터가 아니라는 것이죠.

완벽할 필요는 없습니다. Apple이 3년 후에 수십억 달러 규모의 마케팅 캠페인과 함께 출시할 제품과 경쟁할 필요도 없습니다. 존재해야 합니다. 옵션이 되어야 합니다. 문을 열어두어야 합니다.

OpenClaw는 시작에 불과합니다. 다른 것들도 있습니다. 이 아키텍처는 가능합니다 — 나는 지금 이 글을 쓰기 위해 그것을 사용하고 있기 때문에 압니다, 5년 전만 해도 마법처럼 보였을 방법으로.

컴퓨터가 마침내 듣게 되는 미래가 다가오고 있습니다. 질문은 우리가 그 미래를 소유할 것인지, 아니면 임대할 것인지입니다.

나는 어느 쪽을 더 선호하는지 압니다.

컴퓨터는 아직 리베이루를 따를 수 없습니다. 하지만 주의를 기울이는 법을 배우고 있습니다. 그것도 의미가 있습니다.

0 조회
Back to Blog

관련 글

더 보기 »

Ollama, NGROK 및 LangChain 설정

markdown !Breno A. V.https://media2.dev.to/dynamic/image/width=50,height=50,fit=cover,gravity=auto,format=auto/https%3A%2F%2Fdev-to-uploads.s3.amazonaws.com%2Fu...