나는 LLM에 상담하지 않는다

발행: (2026년 3월 8일 PM 05:43 GMT+9)
6 분 소요

Source: Hacker News

나는 LLM에 의존하지 않는다

GPT를 사용하거나 일반적으로 LLM을 어떤 일에 사용하는 것에 대한 내 문제는, 설령 LLM이 효과적으로 수행한다 하더라도 그렇다. 여기서는 정보를 찾는 경우를 예시로 들어 구체적으로 말하겠다. 다음 시나리오를 가정해 보자: 구글에서 “I’m Feeling Lucky” 버튼을 사용해 본 적이 있는가? 이 버튼은 실제 검색 결과를 보여주지 않고 첫 번째 결과만 바로 보여준다.

이제, 당신이 지금까지 수행한 모든 구글 검색에 대해 이 버튼을 눌렀고, 그것이 당신이 찾고 있던 완벽한 답을 매우 정확하고 효율적으로 찾아줬다고 상상해 보라. 다시 말해, 당신이 인생에서 한 번이라도 검색한 모든 것이 첫 번째 클릭에서 성공한 것이다.

그런 세상에서는, 실제로 제대로 된 연구를 수행하면서—미친 사람들, 다양한 문화, 논쟁, 농담, 당신이 팔로우하는 흥미로운 작가들, 동의하지 않지만 쉽게 무시할 수 없는 주장들, 어디에도 연결되지 않는 각주들, 반쯤 부서진 블로그들, 당신 스스로를 날카롭게 만들게 하는 나쁜 의견들, 서로를 강하게 대립시키는 출처들—와 같은 경험을 겪지 못한다면 당신의 지성은 동일하게 성장했을까?

아마 그렇지 않을 것이다.

왜냐하면 부족한 것이 정보가 아니라 경험이기 때문이다. 경험은 지성이 실제로 훈련되는 장소이다.

“I’m Feeling Lucky” 지능은 도착에 최적화돼 있을 뿐, 성장에는 최적화돼 있지 않다. 당신은 답을 얻지만—(우리가 좋은 답이라고 가정한다는 점을 기억하라)—그 외의 것은 아무것도 배우지 못한다. 아이디어가 어떻게 충돌하고, 변이하고, 사라지는지 배우지 못한다. 인식적 직감이나 무언가가 잘못됐다는 것을 공식적으로 증명하기 전에 느낄 수 있는 능력도 개발되지 않는다.

이제 현실로 돌아가 보자: LLM은 절대 그렇게 좋지 않다; 절대 가상의 “I’m Feeling Lucky” 수준에 도달하지 못한다. 이는 그들이 근본적으로 설계된 방식과 관련이 있다. 나는 내가 전문성을 가진 분야에 대해 GPT에 물어본 적이 없으며, 그 분야에서 나만큼 전문가인 사람에게 기대할 만한 충분한 답을 받은 적도 없다. 사람들은 종종 GPT(및 다른 LLM)가 자신들이 잘 이해하지 못하는 영역에서만 잘 작동한다고 생각한다(Gell‑Mann Amnesia). 설령 자신감 있게 들더라도, 그것은 근사치이거나 평균값을 내거나 과장된 것일 수 있다(Peters 2025) 혹은 자신감 있게(Sun 2025) 실수를 재현하고 있을 수도 있다. 답변이 가장 좋거나, 논쟁의 여지가 있거나, 심지어 정확하다는 보장은 전혀 없으며—그저 그럴듯할 뿐이다. 이 구분은 중요하다. 지성은 그럴듯함 위에 세워지는 것이 아니라, 왜 무언가가 틀릴 수 있는지, 누가 반대하는지, 어떤 가정이 은밀히 끼어들었는지, 그 가정이 무너질 때 무엇이 깨지는지를 이해함으로써 구축되기 때문이다.

도구는 효율적이면서도 지적으로 부식될 수 있다. 그것이 항상 거짓말을 하는 것이 아니라, 충분히 설득력 있게 거짓말을 하기 때문이다. 그 부드러움은 불확실성을 가린다. 이는 지성 부패를 원하지 않을 경우 중요한 요소다.

Modus Vivendi #LLMs

References

  • Peters, Uwe and Chin‑Yee, Benjamin (2025). Generalization bias in large language model summarization of scientific research. The Royal Society. Link
  • Sun, Fengfei and Li, Ningke and Wang, Kailong and Goette, Lorenz (2025). Large Language Models are overconfident and amplify human bias. arXiv. Link
0 조회
Back to Blog

관련 글

더 보기 »

AI로 텍스트 요약하기: 실용 가이드

Long‑Form Content의 문제점 - 기사들은 수천 단어에 달한다. - 고객 이메일은 여러 단락에 걸쳐 장황하게 이어진다. - 연구 논문은 수십 페이지에 걸친다. - Sup...