KNOU위클리

특집 AI 활용 이미지 생성 강좌

기존의 한계를 뛰어넘은 AI 창작 시대의 새로운 키 플레이어

① 화제의 이미지 생성 AI 나노바나나란?

오힘찬
기사입력2025-10-24 10:56
제268호

5회까지 연재 목차

① 화제의 이미지 생성 AI 나노바나나란?
② 나노바나나로 전문가처럼 이미지 생성하기
③ 나노바나나로 전문가처럼 이미지 수정하기
④ 나노바나나로 전문가처럼 이미지 합성하기
⑤ 나노바나나로 전문가처럼 프로필 사진 만들기

인공지능(AI) 기술을 사용한 이미지 생성은 이미 보편화됐습니다. 누구나 원하는 이미지를 AI에게 설명하면 그것을 생성할 수 있는 단계에 도달한 것이죠.

이미지 생성 분야에서는 수많은 업체가 치열하게 경쟁하고 있습니다. 지난 4월에는 챗GPT 개발사인 오픈AI가 GPT-IMAGE 1을 공개하면서 일반인들 사이에서도 일본의 애니메이션 제작사 지브리의 스타일을 모방한 이미지 생성이 유행했습니다. 5월에는 미드저니(Midjourney)가 신규 버전 V7을 출시해 주목받았고, 6월에는 전문가들을 위한 플럭스.1 콘텍스트(FLUX.1 Kontext)가 발표됐습니다. 7월엔 일론 머스크의 AI 기업 xAI 홀딩스가 개발한 그록(Grok)이 세상에서 가장 빠른 이미지 생성 속도를 보여주어 화제가 됐죠. 그러던 중 기존의 모든 경쟁자들은 압도하는 이미지 생성 AI가 8월 말에 등장했습니다. 바로 구글의 AI 나노바나나(NanoBanana)입니다.

경쟁자들과의 차별성

나노바나나는 구글 딥마인드 팀이 공개한 차세대 AI 이미지 생성 모델입니다. 이전까지는 사용자들이 원하는 이미지를 얻기 위해선 복잡한 프롬프트 공식을 외우거나 생성된 여러 이미지의 일관성을 얻기 위해 수많은 수작업 편집을 해야 했습니다. 구글은 이러한 문제를 해결하기 위해 더 높은 화질의 이미지, 강력한 편집 제어력, 낮은 지연속도를 목표로 나노바나나를 개발했습니다.

나노바나나가 기존 이미지 생성 AI와 차별되는 가장 큰 특징은 캐릭터의 일관성을 혁신적으로 개선했다는 점입니다. 기존 이미지 생성 AI는 인물이나 사물과 같은 객체를 포함한 이미지를 생성하고 수정할 때 객체 모습이 사용자의 의도와 무관하게 미묘하게 변형된다는 문제가 있었습니다. 예를 들어 이용자가 자신의 여행 사진을 업로드한 후 사진 배경에서 지나가는 낯선 사람만 지워달라고 요청할 경우, 기존의 이미지 생성 AI는 배경의 낯선 사람만 지우는 것이 아니라 사진의 주인공인 이용자의 얼굴마저 다른 사람으로 바꾸곤 했습니다.

나노바나나는 객체의 일관성을 유지하면서도 객체의 방향, 색상, 질감 등 사용자가 이미지에서 변경하고 싶은 부분을 아주 쉽게 바꿔줍니다. 대표적인 이미지 편집 도구인 포토샵에도 나노바나나가 탑재될 정도이니 이미지 생성 AI의 게임 체인저라고 할 수 있습니다. 나노바나나의 주요 특성 및 기능은 다음과 같이 5가지로 정리할 수 있습니다.

1. 캐릭터 및 스타일 일관성

여러 이미지의 인물과 사물 등 객체의 정체성을 유지한 이미지를 생성할 수 있습니다. 똑같은 캐릭터를 다양한 장면에 반복 등장시킬 수 있으며, 얼굴, 체형, 색상, 의상 등 시각적 특징을 대체로 유지하면서 일부 특징만 변경할 수 있습니다. 아래는 수달 인형이 들고 있는 물고기의 색상이라는 특징만 변경한 예입니다.

2. 다중 이미지 합성

여러 장의 이미지를 하나로 자연스럽게 합성합니다. 예를 들어, 1개 제품을 다양한 배경과 결합하여 여러 배경에 제품이 있는 이미지를 만들거나, 서로 다른 객체를 한 장면에 매끄럽게 합성할 수 있습니다. 2가지 별개 이미지에 담긴 수달과 토끼 인형이 같은 공간에 있는 것처럼 합성한 결과가 아래에 제시돼 있습니다.

3. 대화형 편집

이미지를 자연어로 직접 수정할 수 있습니다. 포토샵 같은 복잡한 도구 대신 채팅으로 ‘배경을 지워줘’, ‘옷 색상을 바꿔줘’, ‘배경을 맑은 날의 해변으로 바꿔줘’와 같은 명령만 내리면 됩니다.

4. 다양한 스타일 및 창작 옵션

이미지를 사진, 애니메이션, 만화, 픽셀 등 다양한 스타일로 변경할 수 있습니다. 카메라 종류나 렌즈 효과, 가로세로 비율까지 세부 조정하여 사용자가 원하는 이미지를 훨씬 쉽게 생성할 수 있게 지원합니다.

5. 초고속 생성 및 손쉬운 사용

나노바나나는 경량화된 플래시 아키텍처로 고품질 이미지를 몇 초 내에 생성할 수 있습니다. 별도 설치나 환경 설정 없이 웹이나 모바일 앱에서 구글 계정만으로 즉시 사용할 수 있고, 누구나 자유롭게 활용할 수 있다는 점도 큰 장점입니다.

이러한 나노바나나의 강력한 성능은 동일한 피사체의 특징을 내부 표현으로 인코딩해 두고 이를 반복 활용하는 맥락적 조건화(contextual conditioning) 기법 덕분입니다. 예를 들어 특정 인물의 사진과 편집상의 지시 사항을 함께 입력하면 나노바나나는 인물의 얼굴, 피부색, 체형 등의 특징을 메모리에 저장해 둡니다. 이후 그 인물의 자세를 변형하라거나 뒤의 배경을 바꾸라는 추가 요청이 들어와도 앞서 저장된 특징 표현을 참고하여 같은 사람처럼 보이도록 이미지를 만드는 거죠. 이는 스토리보드, 연속된 광고 컷, 제품 카탈로그 등에서 유용하게 쓸 수 있습니다. 특히 AI로 동영상을 생성할 때도 일관성 유지가 어려운 점으로 여겨지는데, 동영상의 중간중간에 들어가는 각 프레임을 나노바나나를 활용해 객체 일관성을 유지하면서 생성하면 자연스럽게 이어진 긴 동영상도 쉽게 만들 수 있습니다.

혁신의 빛과 어둠

하지만 강력한 성능은 반대로 심각한 위험을 초래할 수 있습니다. 거짓 이미지를 만들거나 선정성을 포함한 사실적인 이미지를 만들 수도 있죠. 그래서 구글은 나노바나나 개발에서 책임감을 최우선으로 고려했습니다. 유해하거나 부적절한 이미지를 걸러내는 콘텐츠 필터와 정책이 반영됐고, AI가 생성하면 안 되는 결과물을 최대한 억제하도록 강화 학습이 이뤄졌습니다.

또한 나노바나나가 생성한 모든 이미지에는 보이지 않는 디지털 워터마크(SynthID)가 포함돼 있습니다. 추후 해당 이미지가 AI에 의해 생성됐음을 확인할 수 있죠. 일부 서비스에서는 디지털 워터마크를 활용하여 AI 생성 이미지임을 알리는 표식을 시각적으로 표시해 투명성을 높이고 있습니다.

나노바나나의 영토 확장

나노바나나는 구글 제품 전반에서 사용할 수 있습니다. 제미나이(Gemini), 구글 슬라이드(Slides), 구글 비즈(Vids), 노트북LM(NotebookLM) 등의 도구에 통합돼 있으며, 이미지를 생성하는 모든 부분에 나노바나나가 들어가 있습니다. 즉, 여러분도 이미 알게 모르게 나노바나나를 사용 중일 수도 있다는 것이죠. 그리고 구글 제품 외에 다양한 기업과 서비스에서도 나노바나나를 통합해 다양한 분야에 활용하고 있습니다.

영국의 미디어 그룹 WPP는 구글과 5년간 최신 기술을 조기에 도입할 수 있는 파트너십을 맺었습니다. 나노바나나도 빠르게 도입하면서 리테일 및 소비재 포장 상품 분야에서 제품과 캐릭터 일관성을 활용해서 카탈로그 대량 제작에 반영했습니다. 이로써 배경과 연출만 바꾼 배리에이션을 짧은 시간에 수백 장 생성할 수 있었습니다. WPP는 이 기능을 자사 마케팅 솔루션인 WPP 오픈(WPP Open)에 통합했습니다. WPP 오픈을 사용하는 기업들은 여러 국가에 알맞은 연출과 다양한 언어를 포함한 캠페인을 순식간에 생성할 수 있죠.

전자상거래 업체 메르카도 리브르(MercadoLibre)는 상품 정보를 등록하는 과정에 나노바나나를 도입했습니다. 상품 상세 페이지를 만들 때 제품 컷을 새로운 장면에 자연스럽게 합성해 배리에이션을 대량 생성하는 자동화 기능을 구현했죠. 판매자가 판매하려는 제품 이미지만 추가하면, 스튜디오 환경에서 직접 제품을 여러 각도로 촬영하거나 배경을 합성하지 않아도 온갖 형태의 광고용 이미지가 생성되는 방식입니다.

사진, 벡터, 일러스트, 아이콘 등 다양한 그래픽 자료를 제공하는 웹 사이트인 프리픽(Freepik)은 나노바나나를 통합함으로써 사용자가 원하는 이미지를 검색할 뿐 아니라 사이트 내에서 생성하고 합성할 수 있게 지원하고 있습니다. 자사가 제공하는 이미지 중 최대 3장을 선택하고, 생성하려는 구도와 스타일만 지시하면 원하는 이미지를 쉽게 만들 수 있습니다. 이 기능은 API로도 제공되므로 외부 개발자가 자신이 개발한 애플리케이션에도 통합할 수 있습니다.

이처럼 나노바나나는 강력한 성능에 힘입어 공개된 지 한 달 만에 수많은 서비스와 애플리케이션에 통합돼 널리 사용되고 있습니다. 물론 경쟁 기업들도 나노바나나에 맞설 새로운 이미지 생성 AI들을 준비 중입니다. 다만, 나노바나나가 불러온 새로운 트렌드는 이미지 생성 AI의 실전 도입에 큰 영향을 끼쳤습니다. “아직 이미지 생성 AI를 본격적으로 활용하기에는 성능이 부족하다”라는 말도 나노바나나 이후 쏙 들어갔기 때문입니다. 나노바나나는 AI 창작 시대의 새로운 키 플레이어이자 반드시 익혀두어야 할 도구로 자리매김하고 있습니다.

편집자 주: 인공지능(AI)의 비약적인 발전은 우리 모두에게 위기인 동시에 커다란 기회이기도 하다. ‘AI 활용 이미지 생성 강좌’ 연재는 AI에 관한 막연한 두려움에서 벗어나 그것을 학업과 업무의 도구이자 파트너로 활용하는 방법을 안내하고자 기획됐다. 이번 첫 회에서는 8월 출시 직후 이미지 생성 분야에서 경쟁자들을 압도하며 광범위하게 활용되고 있는 구글 나노바나나(NanoBanana)의 주요 특성에 대해 알아본다. 총 5회로 예정된 본 강좌는 최근 AI 활용법에 관한 베스트셀러를 다수 집필한 오힘찬 작가의 설명으로 진행될 예정이다.

여러 기업 및 매체와 협업하여 약 4,000편의 IT 관련 칼럼을 기고했고,『이게 되네? 챗GPT 미친 활용법 71제』등 다수의 AI 관련 베스트셀러를 집필했다.