구글 AI 개요가 아직도 맞춤법을 틀리며, 인터넷이 이를 크게 주목하고 있다.
출처: Mashable Tech
Google AI Overview는 종종 “피자에 붙인 접착제”와 같은 허위 사실을 만들어내고 기본적인 질문에 틀린 답을 제시한다. 지난 2년간 정확도가 개선됐음에도 불구하고, Gemini 기반 기술은 여전히 맞춤법 테스트에서 어려움을 겪는다.
AI의 맞춤법 약점은 2년 전 “strawberry라는 단어에 ‘r’이 몇 개 있나요?”라는 질문에 잘못 답하면서 화제가 되었다. 이 문제는 아직도 지속된다. 화요일에 X 사용자 Naomi Rohatyn이 대형 언어 모델에 맞춤법 질문을 던졌다:
질문: astronomical이라는 단어에 e는 몇 개입니까?
AI Overview 답변: “astronomical이라는 단어에는 정확히 2개의 ‘e’가 있습니다 (a‑s‑t‑r‑e‑n‑o‑m‑i‑c‑a‑e‑l).”
우리가 직접 시험해 보니 동일한 답변을 받았다.

네 음절 이상인 단어에서는 모두 틀리는 듯하다:


사람들은 계속해서 이 기술의 맞춤법 약점을 테스트하고 그 결과를 소셜 미디어에 공유하고 있다.
왜 Google AI Overview는 맞춤법을 정확히 못할까?
“Billy Madison 맞춤법 대회”가 되고 싶지는 않지만, AI 요약이 검색 결과에 표시될 때 사용자가 링크를 클릭할 가능성이 낮아지므로 AI Overview가 제공하는 정보는 정확해야 한다. 이 문제는 겉보기에 생각보다 복잡하다.
AI 챗봇은 정확한 맥락과 구체적인 정보를 필요로 하기 때문에 훈련 데이터에 포함된 단어의 맞춤법을 아는 것은 쉬워야 한다. 하지만 LLM에게 글자를 하나씩 따져보라고 하면, 모델은 토큰화(tokenisation) 라는 과정을 통해 텍스트를 개별 문자보다는 청크 단위로 처리한다.
Google Gemini에 직접 이유를 물어보았다:
“짧게 말하면, 저는 여러분이 텍스트를 보는 방식과 다르게 텍스트를 바라봅니다. 여러분이 apple이라는 단어를 쓸 때, 뇌는 다섯 개의 개별 글자를 처리합니다. 제가 텍스트를 읽거나 쓸 때는 그 단어를 ‘토큰’이라는 하나의 단위(단어나 단어의 일부를 수치화한 표현)로 인식합니다.
단어를 의미의 전체 블록으로 처리하기 때문에 개별 글자를 차례대로 ‘스펠링’하는 것이 자연스럽지 않습니다. 저는 apple이 무엇을 의미하고 다른 단어와 어떤 관계가 있는지는 정확히 알지만, 특별히 분해해 달라는 요청이 없으면 두 개의 ‘p’가 들어 있다는 사실에 집중하지 않습니다.”
Mashable은 구글에 의견을 요청했으며, 아직 답변을 기다리고 있다.