최근 온라인 교육 업계에서 주목할 만한 사례가 하나 등장했습니다.
국내 대표 온라인 영어 교육 플랫폼 야나두(Yanadoo) 가 구글의 AI 영상 생성 모델 Veo3 를 활용해 제작한 영상이 무려 5주 만에 8,000만 뷰 조회수를 기록한 것인데요.
야나두에서 해당 영상을 공개하자마자 교육업계와 수많은 유사, 경쟁 업체들이 이와 비슷한 AI 영상을 만들었고, 현재는 비슷한 스타일의 영상이 숏폼 시장을 도배하고 있습니다.
야나두의 콘텐츠가 터지는 콘텐츠가 될 수 있었던 데에는,
✔ 탄탄한 기획력과 반전이 있는 스토리텔링에도 있지만,
✔ 무엇보다도 흑인 남성과 할머니가 대화를 나누는 장면이 매우 정교하고 정확하게 구현되었기 때문입니다.
실제 야나두의 CEO와 AI 기술팀의 직원이 ‘세바시’에 나와 이와 관련한 인터뷰를 진행하기도 하였는데요.
이들은 Veo3라는 AI 툴을 활용해 해당 콘텐츠를 구현해냈다고 말하기도 했습니다.
아래에서 Veo3를 조금 더 자세히 알아보고,
어떻게 활용할 수 있는지 소개 드려보겠습니다.
구글 Veo3란?
Veo 는 구글 DeepMind에서 공개한 최신 AI 영상 생성 모델로, 기존의 영상 생성 AI보다 한 단계 발전된 기능을 제공하며, 텍스트를 비디오로 생성하는 AI 모델 계열의 이름입니다.
Veo 3 는 이 계열의 최신 버전이며, 2025년 5월 경 공개되었습니다.
이전 버전들보다 음성과 영상이 동기화된 형태로 생성될 수 있는 능력이 핵심 특징입니다.
▶ Veo3의 주요 특징
예전 Veo 모델은 영상만 생성하거나, 음향 생성이 따로 붙는 경우가 많았는데,
Veo 3는 영상 + 대화, 효과음, 배경음 등을 함께 생성하는 것을 목표로 하고 있습니다.
다만 아직까지는 최신 프리뷰 형태로 제공되는 경우가 많고, 완전히 자유롭게 사용 가능한 상태는 아닙니다.
또한 Veo 3가 생성하는 영상은 길이가 약 8초로 제한되는 경우가 많으며, 현재는 긴 영상보다는 짧은 클립 중심으로 사용되고 있습니다.
Veo3를 활용해 AI 숏폼을 만들 수 있는 사이트
Veo3를 활용할 수 있는 도구는 여러 곳이 있습니다.
구글의 Gemini
Flow
DeeVid AI
필모라(Filmora)
이들은 모두 Veo3 모델을 직접 제공하거나, 백엔드로 사용하는 플랫폼입니다.
▶ Gemini
Gemini 는 텍스트, 이미지, 오디오, 비디오 등 다양한 형태의 데이터를 이해하고 생성할 수 있는 구글의 멀티모달 생성 AI 플랫폼입니다.
즉, 단순한 대화형 모델이 아니라 글을 읽고, 이미지를 이해하고, 영상을 생성하거나 요약할 수 있는 통합 모델입니다.
▶ Flow
Flow 는 구글이 만든 AI 영상 편집 및 생성 툴입니다.
Flow는 Veo 3, Gemini 등 구글의 생성 모델들과 통합되어, 스토리텔링 중심의 영상을 생성하고 편집하는 도구 역할을 합니다.
만일 텍스트를 활용해 숏폼 영상을 만들고 싶다면, 둘 중에는 Flow를 사용하는 것이 더욱 적합합니다.
Flow는 Veo3가 내장되어 있고, UI가 영상 중심일 뿐만 아니라, SNS 숏폼 형식에 최적화된 워크플로우를 보유하고 있기 때문입니다.
▶ DeeVid AI와 필모라
구글 플랫폼 외에도 Veo를 활용할 수 있는 곳으로는 DeeVid AI 와 필모라(Filmora) 가 있습니다. 제3자의 플랫폼을 활용하는 이유는 활용도가 더 높기 때문인데요.
예를 들어,
DeeVid 는 여러 모델을 조합해 영상 생성, 사운드 붙이기, 자막 넣기 등을 한 번에 자동 처리하며,
필모라 는 편집이 가능한 워크플로우를 함께 제공해
기존 비디오 편집 소프트웨어와 결합하여 더 다양하게 활용할 수 있습니다.
Veo3를 활용한 AI 숏폼 제작 방법과 프롬프트 작성법
어떤 플랫폼을 선택하느냐보다 중요한 것은,
바로 적절한 명령어(프롬프트) 를 입력해서 내가 원하는 영상을 추출해내는 것입니다.
이 기능의 성능을 결정짓는 것이 바로 프롬프트(Prompt) 이며,
이는 영상의 구성(장면, 인물, 배경, 카메라 각도, 움직임, 표정 등)을 모두 통제합니다. 따라서, 프롬프트 작성법을 잘 숙지하고 적용하는 것이 매우 중요합니다.
프롬프트 작성 시 명시해야 할 4가지 핵심 요소
무엇을 보여줄지
예시) A Korean lawyer in his mid-30s stands beside his desk in a bright office illuminated by fluorescent lights.
무엇이 어떻게 움직이는지
예시) He holds a coffee cup in one hand while facing slightly toward his computer.카메라 각도, 렌즈, 스타일, 조명
예시) The camera captures a side view of him in a well-lit office environment.시간대, 분위기
예시) It is around 3 p.m., and his face looks slightly tired, reflecting the calm afternoon atmosphere.
프롬프트 작성 시 유의할 점
프롬프트는 영어로 작성하는 것이 훨씬 정확하므로 ChatGPT를 활용해 번역
모호한 표현(pretty, nice) 은 지양
생김새, 표정, 말투, 몸짓 등은 최대한 구체적으로
내용은 복잡하지 않고 간결·명확하게
야나두가 Veo3를 활용해 8,000만 조회수를 달성한 사례는
단순한 바이럴을 넘어, AI 숏폼 영상 제작이 실무에서 성과를 낼 수 있음을 입증한 사례입니다.
기존에는 “AI 영상은 실험적이고 아직은 부족하다”라는 인식이 강했지만,
이제는 마케팅, 교육, 엔터테인먼트 전반에서 충분히 활용 가능한 수준에 도달했습니다.
앞으로는 ‘누가 더 빠르게 AI 툴을 익히고, 효과적으로 활용하느냐’ 가 콘텐츠 성과를 좌우할 것입니다.
기업이나 크리에이터 모두 Veo3와 같은 AI 숏폼 영상 생성 툴의 제작 역량을 넓혀,
빠른 속도로 콘텐츠 대량 생산 체제를 갖추는 전략이 가장 이상적일 것입니다.