왜 나는 이미지 생성에 있어 여전히 Sora를 Nano Banana보다 선호하는가

발행: (2026년 1월 16일 오후 11:02 GMT+9)
8 min read
원문: Dev.to

Source: Dev.to

저는 블로그 포스트의 표지 이미지를 만들기 위해 AI만 사용하고 있어서 기대 수준이 높지는 않습니다. 처음에는 구글이 OpenAI보다 낫다고 생각했지만 생각이 바뀌었습니다. 숨겨진 시스템 프롬프트 때문인지 LLM‑모델 문제 때문인지 모르겠지만, Gemini에서 엄청난 제한을 발견하고 있습니다.

이미지용 Sora와 Nano Banana

저는 동영상 생성에는 관심이 없고, 블로그 게시물의 표지 이미지로 사용할 멋진 사진만 필요합니다. 저는 절대 전문가처럼 접근하고 있지 않으며, 서비스를 엔드 유저가 사용하는 그대로, 때로는 꽤 서툴게 사용하고 있습니다.

  • 저는 기술적인 의미의 “프롬프트”를 작성하지 않습니다; 사람에게 말하듯이 원하는 것을 높은 수준에서 설명할 뿐입니다.
  • 저는 무료 버전을 사용하고 있습니다 – 구독 없이 각 플랫폼이 현재 제공하는 기본 기능만 이용합니다.

Nano Banana가 사전에 능력을 제한하는 시스템 프롬프트에 의해 제약을 받는 것처럼 보입니다. 설명을 어떻게 바꾸든 비슷한 이미지가 계속 생성됩니다 – 괜찮긴 하지만, 제 기사 내용과 실제로 부합하는 사진을 원하기 때문에 만족스럽지는 않습니다.

동일한 프롬프트, 다른 결과

Sora와 Nano Banana는 서로 다른 모델을 사용합니다. 저는 이탈리아에 있어 Sora 2를 사용할 수 없습니다. 두 서비스를 비교하기 위해 동일한 프롬프트를 양쪽에 보냈습니다(무료 티어만 사용). 제 설명은 의도적으로 고수준이고 일반적인 내용입니다:

A picture to represent the challenge between Sora and Nano Banana as
image generators powered by AI.

Nano Banana 결과

(이 게시물의 표지 이미지)

Sora 결과

내 의견: 두 번의 생성 사이에 단 한 마디도 바꾸지 않았음에도 불구하고 Sora 이미지가 훨씬 더 좋게 보입니다.

Sora vs. Nano Banana by Sora
Generated by Sora

제가 직접 운영하는 Google AI Studio 인스턴스에서 Nano Banana Pro를 사용해 보면, 표준 버전은 더 작은 정사각형 사진만 출력합니다. 차이는 여전히 미미하고, 저는 여전히 오래된 GPT 모델을 기반으로 했음에도 불구하고 Sora 결과가 더 마음에 듭니다.

이것은 벤치마크가 아닙니다

저는 벤치마크를 발표하려는 것이 아닙니다. 단순히 일반 사용자가 잠재 고객으로서 두 가지 다른 서비스를 테스트한 경험을 공유하고 있습니다. 더 나은 결과를 얻기 위해 프롬프트를 처음부터 다시 쓸 수도 있지만, 여기서는 그게 목적이 아닙니다. (프롬프트 최적화에 대해서는 다른 글에서 이미 다루었습니다.)

개발자 입장에서는 저도 동의합니다: 이것은 전문적인 접근 방식이 아닙니다. Sora와 Nano Banana를 직접 비교하는 것은 두 서비스가 서로 다른 모델과 인프라에서 실행되기 때문에 완벽하지 않습니다.

프롬프트를 모델과 서비스에 맞게 조정하는 것이 올바른 방법이지만, 저는 즉각적인 결과를 원했습니다 – 대부분의 세부 사항을 LLM에 맡기고, 필터를 추가하지 않았으며, 단 두 줄의 텍스트만 작성했습니다.

Nano Banana 및 프로 버전

The cover image for this post was generated by the built‑in Nano Banana version in the DEV editor. When I used the standard Nano Banana interface, I got a very different picture, which makes me think Forem adds an extra layer between the model and the prompt.

Sora vs. Nano Banana by Nano Banana Pro
Nano Banana Pro에 의해 생성됨

I didn’t give the LLM any percentage or style instructions. Interestingly, Nano Banana Pro rated its rival (Sora) higher – perhaps a strategic bias? The image also carries a Gemini watermark in the lower‑right corner, which appears because I’m on the free tier. Overall, I’m far from satisfied with it.

Sora를 계속 사용할게

티어와 관계없이 Gemini는 내 필요에 맞는 사진을 여전히 못 만들어. GPT가 현재 가장 좋은 결과를 제공하지만 최신 모델에 접근할 수는 없어. 적절한 프롬프트로 API를 테스트해서 성능을 더 엄격히 평가해 보는 것이 흥미로울 것인데, 이는 앞으로 할 계획이야.

  • OpenAI의 Responses API는 이제 이미지 생성 기능을 포함하지만, 기존 Completions API는 포함하지 않아.
  • 나는 Google의 Gemini를 이미지 생성에 사용해 본 적이 없어서, 버전 2.5와 3이 기능 면에서 차이가 있는지 확신하지 못해.
  • Google이 무료 티어 한도를 크게 줄여버려서 더 이상 “놀아볼” 수가 없어.

그래서 나는 전문적인 워크플로우를 도입하려고 하지 않아. 내게 가장 빠르게 괜찮은 이미지를 얻는 방법은 Sora 웹 인터페이스를 여는 것이고— 대부분의 최종 사용자가 하는 방식이야. 다음으로 TranslateGemma에 기회를 줄 생각이지만, 지금은 Sora에 머물 거야.

It's a completely different use case, and there I will be more technical.

If you’d like, follow me on [**Bluesky**](https://bsky.app/profile/fedtti.bsky.social) and/or [**GitHub**](https://github.com/fedtti) for more content. I enjoy networking.
Back to Blog

관련 글

더 보기 »

Nano Banana가 이름을 얻게 된 이유

당신은 이미 그 바이럴 편집 파워 https://blog.google/products/gemini/nano-banana-tips/ 로 유명한 것을 알고 있습니다. 하지만 Google DeepMind의 가장 인기 있는 모델 중 하나가 어떻게…