Generowanie wideo z AI — Transcript

Praktyczny przewodnik po generowaniu wideo z AI, omówienie narzędzi, promptów i technik tworzenia filmów bez budżetu.

Key Takeaways

AI umożliwia tworzenie wideo bez dużych nakładów finansowych i specjalistycznej wiedzy.
Struktura promptu jest kluczowa dla uzyskania pożądanego efektu w generowaniu wideo.
Różne platformy oferują różne funkcje i poziomy kontroli nad generowanym materiałem.
Generowanie wideo AI jest wciąż rozwijające się i wymaga testowania oraz korekt.
Dodanie dźwięku i ruchu kamery znacząco podnosi jakość i realizm materiałów wideo.

Summary

Wideo omawia, jak AI ułatwia tworzenie materiałów wideo bez konieczności posiadania dużego budżetu czy umiejętności technicznych.
Przedstawiono różne platformy do generowania wideo AI, takie jak Gemini, Flow, AI Studio oraz Google Vertex.
Omówiono strukturę promptu do generowania wideo: podmiot, akcja, scena, kamera, styl i estetyka oraz dźwięk.
Wskazano trzy tryby generowania animacji: text to video, image to video oraz video to video.
Podkreślono znaczenie precyzyjnego promptowania, w tym używania dynamicznych czasowników i szczegółowych opisów.
Zaprezentowano możliwości dodawania ruchu kamery za pomocą komend filmowych oraz synchronizacji dźwięku z ruchem ust.
Pokazano, jak wykorzystać obrazy referencyjne do kontroli stylu i animacji wideo.
Omówiono ograniczenia i wyzwania generowania wideo AI, takie jak błędy i różnorodność efektów w kolejnych próbach.
Zwrócono uwagę na różnice w dostępności modeli w zależności od subskrypcji i kosztów kredytów.
Przedstawiono praktyczne przykłady generowania materiałów, w tym wywiadów i vlogów z polskim lektorem.

Full Transcript — Download SRT & Markdown

Speaker A

Cześć. Pomyślcie o własnych doświadczeniach z mediami społecznościowymi. Kiedy ostatnio zatrzymaliście się na dłużej przy jakimś poście?

Speaker A

Duża szansa, że był to właśnie materiał wideo. I nie jest to przypadek. Nasze mózgi są tak zaprogramowane, by zwracać szczególną uwagę na ruch, dźwięk czy też dynamiczną narrację, to wszystko właśnie łączy się w materiale wideo.

Speaker A

Ale wiem, co teraz myślicie. Nie mam budżetu na profesjonalną produkcję wideo, czy też nie jestem dobry w występowaniu przed kamerą. I właśnie dlatego jesteśmy tutaj, bo dzięki AI tworzenie materiałów wideo stało się dostępne dla każdego. Dziś pokażę ci,

Speaker A

jak wykorzystać tę technologię, by twoje historie ożyły w formie wideo, bez potrzeby wielkich budżetów czy specjalistycznej wiedzy technicznej. Dzięki temu jesteśmy też w stanie obniżyć koszty produkcji filmowych, bo możemy przetestować, jak cały film będzie wcześniej wyglądał, i na planie skupimy się już na samej produkcji.

Speaker A

Warto dodać, że modele do generowania wideo rzadko bywają dostępne też bez dodatkowych subskrypcji. Pamiętacie schemat tworzenia obrazu, o którym mówiliśmy wcześniej? Te same zasady będą nam służyć w tworzeniu wideo, ale teraz dodamy do nich jeszcze ruch.

Speaker A

To jak przejść od czytania książki do oglądania filmu. Te same historie nabierają nowego wymiaru, a w przypadku VEO 3 oprócz samego ruchu możemy też wygenerować dźwięk.

Speaker A

Pamiętajcie, dostęp różni się w zależności od posiadanej subskrypcji. W momencie nagrywania możecie przetestować wspomniany model VEO w narzędziu Flow, choć może to też ulec zmianie. Chcąc z niego skorzystać, mamy kilka możliwości.

Speaker A

Od najprostszej, czyli skorzystanie w Gemini. Bierzemy "Utwórz film". I w tym momencie możemy wpisać dowolny prompt.

Speaker A

Generowanie wideo zajmuje trochę dłużej niż w przypadku grafik. I mam pierwszy materiał. Wygląda realistycznie, chociaż zdarzają się błędy.

Speaker A

Niestety przy wideo jeszcze wciąż to się rozwija i warto spróbować jeszcze raz. Pokażę ci teraz drugą przestrzeń, w której możesz generować wideo, czyli Flow.

Speaker A

Tutaj masz większą kontrolę nad możliwościami, gdyż możesz ustawić zarówno proporcje obrazu, jak i to, ile wersji uzyskasz.

Speaker A

Każda z nich kosztuje odpowiednią ilość kredytów, która jest przydzielana czasem za darmo w podstawowej wersji lub też masz wykupioną jakąś subskrypcję.

Speaker A

I mam wygenerowany materiał we Flow. Również, jak widzisz, jest bardzo podobny do poprzedniego, ale minimalnie się różni i tak będzie z każdym materiałem wideo generowanym w AI.

Speaker A

Nigdy nie będziesz mieć tych samych ujęć w ten sam sposób. Wracając do platform. Kolejną, na której możesz generować wideo, jest AI Studio, która udostępnia szereg funkcji, jak tryb porównywania modeli, streaming w czasie rzeczywistym czy generowanie obrazów, dźwięków oraz wideo poprzez VEO.

Speaker A

W AI Studio mamy możliwość ustawienia czasu generowanego wideo, ustawienia formatu czy też wpisanie promptu negatywnego, czyli tego, czego nie chcemy, aby było generowane w wideo.

Speaker A

Kolejną platformą i najbardziej zaawansowaną jest Google Vertex, o którym będziesz mógł się dowiedzieć więcej w kolejnych lekcjach.

Speaker A

Mamy dostęp też do różnych narzędzi, w których część jest darmowa, a część jest płatna.

Speaker A

Jak możesz zauważyć, podobnie jak przy generowaniu obrazu, najlepszą formą komunikacji z modelem jest używanie struktury promptu, pozwala to uporządkować informacje, które mają być przekazywane do modelu.

Speaker A

W przypadku wideo jest to podmiot, czyli kto lub co jest centralnym punktem sceny. Oczywiście precyzja jest tutaj jak zawsze kluczowa.

Speaker A

Zamiast "pies" lepiej napisać "szczeniak rasy Golden Retriever". W reklamie może to być elegancki srebrny samochód sportowy lub kobieta po trzydziestce z rudymi włosami.

Speaker A

Kolejny punkt to jest właśnie akcja, coś, co odróżnia obraz od filmu. Czyli co dokładnie robi nasz główny podmiot.

Speaker A

Używaj jasnych, dynamicznych czasowników. Szczeniak macha ogonem albo samochód pędzi krętą nadmorską drogą. Akcja nadaje scenie narracyjny impet i odróżnia prompt wideo od promptu graficznego.

Speaker A

Scena, czyli gdzie rozgrywa się akcja. Na jałowym ośnieżonym terenie lub w oświetlonym neonami cyberpunkowym mieście o północy.

Speaker A

Kontekst pomaga zrozumieć modelowi atmosferę i otoczenie, w której dzieje się akcja. Kamera - to z jakiej perspektywy jest filmowana cała scena.

Speaker A

Ujęcie z niskiego kąta sprawia, że postać wydaje się potężniejsza. Ujęcie z lotu ptaka pokazuje skalę.

Speaker A

Zbliżenie znowuż podkreśla różne detale. Dynamiczne ruchy kamery, takie jak najazd czy panoramowanie lub ujęcie śledzące, dodają energii i profesjonalizmu.

Speaker A

Styl i estetyka - jaki jest ogólny wygląd czy też nastrój naszego filmu. Używaj odniesień stylistycznych: kinowy, anime, fotorealistyczny.

Speaker A

Określ też oświetlenie, czy ma być dramatyczny kontrast, może złota godzina, a także paletę kolorów, na przykład ciepłe tony. Jak w przypadku VEO, możesz też dodać dźwięk. Pomaga to określić dialogi.

Speaker A

Mężczyzna mówi: "Gdzie jest królik?". Albo efekty dźwiękowe: "w tle słychać plusk wody", a także możesz dodać muzykę, która delikatnie gra sobie w tle.

Speaker A

Zaawansowane modele, takie jak VEO 3, potrafią generować dźwięk natywnie, włączając w to precyzyjną synchronizację ust.

Speaker A

Pamiętacie zasady dotyczące tworzenia obrazów? To tutaj one są rozbudowane o dodatkowe elementy. A mianowicie - ruch kamery, czyli akcja, oraz w przypadku VEO będzie to dźwięk.

Speaker A

Bardzo popularne jest też tworzenie wszelakich materiałów wideo w formie wywiadów czy też vlogów. Spróbujmy zrobić coś takiego na początek.

Speaker A

Dodatkowo, jak widzisz, w prompcie mam ustawione dokładne znaczniki czasowe, które pozwalają zrozumieć modelowi, co chciałbym, aby zadziało się w konkretnym momencie.

Speaker A

-Witam cię w "Umiętnościach Jutra". Jak widzisz, materiał został wygenerowany również z polskim lektorem i ruch ust jest dopasowany do tego dźwięku.

Speaker A

W ten sposób poznaliście pierwszą technikę generowania materiałów wideo. Przy generowaniu animacji wyróżniamy trzy możliwości.

Speaker A

Text to video, wystarczy wprowadzić odpowiedni prompt tekstowy, aby wygenerować materiał wideo. To właśnie przed chwilą przygotowaliśmy.

Speaker A

Image to video, gdy chcemy poruszyć nasze zdjęcie lub wygenerowany przez nas obraz. Daje nam to kontrolę nad tym, jak będzie wyglądał film. No i trzecie to jest video to video.

Speaker A

W tym wypadku przekształcamy nasz materiał wideo w jakąś inną formę. Text to video, ten tryb potrafi dostarczyć bardzo ciekawe efekty.

Speaker A

Jednak nie mamy nad nim zbytniej kontroli, jak to będzie wyglądało. Dlatego najlepiej jest to wykorzystywać do materiałów ogólnych bez wyraźnego kontekstu.

Speaker A

Takich, co pojawiają się jako przerywniki lub tło. Przy promptowaniu ruchu kamery możesz użyć typowych komend filmowych. Mów: up, right, left, pan left, right, albo orbit, round, left, push in, zoom in, dolly out.

Speaker A

I w ten sposób uzyskasz konkretne ruchy kamery. Nasz pierwszy materiał text to video mamy już za sobą.

Speaker A

To przejdźmy dalej. Teraz wykorzystanie obrazu referencyjnego pomaga precyzyjnie określić pożądany styl wizualny, kolorystykę i atmosferę generowanego wideo.

Speaker A

To upraszcza nam promptowanie materiałów wideo i generuje animacje na bazie naszego zdjęcia. I mamy tutaj dwie możliwości.

Speaker A

Ustawienie tylko pierwszej klatki i dalej model już sobie sam dopasowuje ruch. Wgrywam pierwsze ujęcie.

Speaker A

Po wgraniu zdjęcia, wpisuję dokładnie szczegółowy prompt, co chciałbym, aby zadziało się na materiale wideo.

Speaker A

Dostałem materiał wideo, w którym kobieta przekłada stronę kartki i mam delikatny zoom. Teraz stworzę nowy projekt, w którym pokażę ci, jak możesz oznaczyć sobie elementy na grafice, które mają się zaanimować.

Speaker A

A ty poprosisz model tylko o to, aby usunął te instrukcje. Wpisując bardzo prosty prompt.

Speaker A

I wpisuję prompt. Dokładnie opisałem na grafice, w którą stronę chciałbym, aby samochód pojechał, co ma się zadziać i też, żeby po trzech sekundach pojawiła się postać.

Speaker A

Jak widzisz, po chwili model usunął wszystkie dodatkowe adnotacje, które mu narysowałem. A po trzech sekundach pojawiła się postać w prawym rogu.

Speaker A

Dokładnie to, co mu opisałem na grafice. Trzecim dostępnym trybem jest dodawan

Speaker A

Mam wygenerowany materiał, możemy go zobaczyć. Nie są to dokładnie klatki, które mu podałem, ale właśnie o to chodzi w tym trybie.

Speaker A

Video to video. W tym wypadku mamy cały szereg narzędzi i funkcji, które oferują modyfikacje gotowych nagrań.

Speaker A

Pozwala to na zmianę stylu, atmosfery czy też charakteru materiału wideo przy zachowaniu oryginalnej dynamiki ruchu.

Speaker A

To wszystko możemy przetestować w narzędziu Runway. Wgrałem materiał wideo, w którym mam postać, która idzie po lotnisku.

Speaker A

Teraz wybrałem sobie wygenerowany obraz, w którym postać już nie jest na lotnisku, ale idzie sobie nad jeziorem.

Speaker A

Tego trybu też używam do modyfikacji na przykład Brand Hero. Jeżeli mam stworzoną jakąś rysunkową postać i chciałbym nadać jej mimikę, to mogę nagrać siebie i następnie podłożyć pod to, pod grafikę, ruch swojej twarzy i swojej gestykulacji.

Speaker A

Widzisz, ruch postaci jest dokładnie taki sam jak w materiale referencyjnym. A wygląd zupełnie inny, bo już jest zgodny z obrazem, który mu dostarczyłem.

Speaker A

Kolejna funkcja to jest Aleph, gdzie mogę za pomocą promptu wygenerować, zmienić różne elementy w grafice.

Speaker A

Zmieńmy naszemu bohaterowi pogodę na bardziej deszczową. Dostałem wygenerowany materiał. Pogoda się trochę popsuła, ale widać, że nasz bohater nie jest do końca wzruszony, bo wcale nie jest mokry, ani fryzura mu się nie zmieniła.

Speaker A

Tak więc modele do edycji wideo jeszcze się rozwijają. Możliwości zaczynają być coraz większe, ale nie we wszystkich momentach są w stanie nas zastąpić.

Speaker A

Kolejnym narzędziem, które umożliwia edycję wideo, jest HeyGen, w którym możemy nie tylko tworzyć własne awatary, ale też możemy przetłumaczyć nasz materiał wideo, który mu dostarczymy. Wystarczy mu wgrać nasze nagranie i wybrać język, w jakim byśmy chcieli, aby było wygenerowane.

Speaker A

Wziąłem dwa przykładowe i poprosiłem go o wygenerowanie wideo. W tym momencie model nie generuje nowej postaci czy nowych rzeczy, jedynie generuje nową wersję dźwiękową oraz dostosowuje mój ruch ust do materiału, który zostanie wygenerowany jako voiceover.

Speaker A

-Cześć, nazywam się Krystian Wydro i stworzyłem swojego awatara. Dzięki temu, poprzez wpisanie promptu, mogę generować materiał wideo ze swoją osobą.

Speaker A

Wykorzystuję to na przykład do tworzenia szybkich zapowiedzi. Tak wygląda mój materiał źródłowy. Jakiś stary, przykładowy, którego użyłem do wygenerowania dwóch wersji językowych, po to, żeby zaprezentować jego możliwości. Dzięki narzędziom AI zmienił tylko i wyłącznie mój ruch ust, zmienił dźwięk,

Speaker A

zachowując ogólną animację oraz brzmienie mojego głosu. [wypowiedź w języku japońskim] Tu mamy jedną wersję językową.

Speaker A

[wypowiedź w języku szwedzkim] I drugą wersję językową. Dzięki temu narzędziu, jeżeli publikujemy materiały na różne rynki, na różne lokalizacje w różnych językach, możemy w bardzo prosty sposób dostosować pod konkretny rynek lub jeżeli chcemy przygotować jakieś materiały wewnętrzne dla osób,

Speaker A

które mówią w różnych językach, zawsze możemy też to zrobić w ten sposób i korzystać z możliwości AI.

Speaker A

Przejdźmy do finalnego zadania. Teraz to ty stworzysz już samodzielnie materiał wideo. W podstawowej wersji tworzenia wideo poznałeś, poznałaś różne techniki, jak można stworzyć wideo.

Speaker A

Teraz pokażę ci, jak stworzyć swojego rysunkowego, na przykład, Brand Hero, który będzie mógł reklamować twoje produkty.

Speaker A

Zaczniesz od briefu na całą reklamę, następnie stworzysz koncepcję postaci, później wybierzesz postać, która ci najbardziej odpowiada i stworzysz storyboard do animacji, którą następnie poruszysz.

Speaker A

A na koniec wszystko zostanie zmontowane w jedną spójną całość. Jak widzisz, mam już ułożony cały proces.

Speaker A

W poprzedniej lekcji nauczyłem cię, jak tworzyć poszczególne kafelki, jak wpisywać poszczególne prompty, tworzyć konkretne grafiki.

Speaker A

Teraz pokażę ci cały proces tworzenia właśnie postaci scenariusza storyboardu do wygenerowania wideo. Żeby móc stworzyć spójną postać w całej serii animacji, musimy zacząć od budowania naszego głównego bohatera, naszej głównej postaci.

Speaker A

W tym wypadku użyłem lisa, który wygląda à la 3D i określiłem, jak ma dokładnie wyglądać i wygenerowałem przy pomocy Nano Banana.

Speaker A

W kolejnym kroku mam asystenta, który służy do tworzenia promptu do wygenerowania wideo. Ponieważ chciałbym mieć konkretny komunikat w naszym materiale wideo, to dołożyłem kafelek z tekstem, który ma być wypowiedziany.

Speaker A

Tę treść mogę sobie zmieniać dowolnie. Po wygenerowaniu dostaję cały prompt łącznie ze ścieżką dźwiękową do powiedzenia przez postać.

Speaker A

W kolejnym kroku, jeszcze zanim pokażę ci wygenerowany materiał wideo, pokażę kolejną klatkę ze scenariusza, ze storyboardu, czyli jak postać, którą miałem, dostała nasz produkt. Czyli użyłem zdjęcia z poprzedniej lekcji, która posłużyła za referencję do stworzenia grafiki. Podobnie zresztą było z wyglądem

Speaker A

samego lisa, który, jak widzisz, jest dokładnie taki sam jak w tej pierwotnej scenerii. I to jest najważniejszy punkt przy tworzeniu całych storyboardów, całych scenariuszy z wykorzystaniem tej samej postaci i żeby ta postać była spójna przez całą animację.

Speaker A

Czyli odwołujemy się zawsze do naszej głównej referencji, tak żeby model był w stanie dokładnie ją odwzorować.

Speaker A

A następnie znowu tworzę prompt do przygotowania promptu do generowania wideo. I też mam już wiadomość numer 2, którą chciałbym, żeby była wypowiedziana i teraz, jeżeli chciałbyś rozbudować całą narrację wobec tego scenariusza, moglibyśmy tutaj wkleić nasz brief i poprosić go

Speaker A

o przygotowanie, tak jak w poprzedniej lekcji, poszczególnych haseł do wypowiedzenia podczas materiału wideo. Ponieważ przygotowałem już wcześniej wygenerowane rzeczy w wideo, to teraz ci je tylko pokażę, przesuwając sobie w dowolne miejsce.

Speaker A

Pierwsze ujęcie dotyczy samego lisa. -Chcę się z wami podzielić tym, co mi pomaga podczas długich, bezsennych zimowych nocy.

Speaker A

Wypowiedział dokładnie te kwestie, które chciałem, aby zrobił. Tutaj w ustawieniach mu dawałem czas, jakość, w jakiej miał to generować, a także musicie pamiętać o tym, że jeżeli chcecie mieć efekty dźwiękowe czy też ścieżkę dźwiękową lektorską, musicie przełączyć odpowiedni suwak.

Speaker A

I drugi. -To ta piękna oliwkowa lampa, która może być też twoja. Jak możesz usłyszeć, materiał dźwiękowy pomiędzy różnymi ujęciami delikatnie się różni.

Speaker A

Wynika to z tego, że każde ujęcie, każda klatka została wygenerowana w innym momencie, tak więc, aby uspójnić ten dźwięk, możemy wyeksportować całe ścieżki audio i użyć na przykład narzędzia ElevenLabs, w którym spasujemy całą sekcję lektorską, aby ten głos był jeden, spójny, ten sam dla całej naszej reklamy,

Speaker A

na przykład 15-sekundowej czy 30-sekundowej. Po tym jak wygenerujemy sobie już spójny ten głos lektorski, możemy przejść do narzędzi takich jak CapCut, Canva czy Google Vids, a jeżeli ktoś korzysta z profesjonalnych narzędzi, to na przykład Adobe Premiere czy DaVinci Resolve, i tam zmontować finalnie całość,

Speaker A

łącząc wszystkie te krótkie fragmenty, te kilkusekundowe animacje, plus dźwięki, plus efekty dźwiękowe, plus lektor, muzyka, a także dodać nasze logo lub planszę końcową z naszym produktem i informacją o zakupie.

Speaker A

Podsumowując, co zyskujesz z wykorzystania AI w tworzeniu materiałów wideo? Większe zaangażowanie odbiorców. To jest kluczowa korzyść. W świecie, gdzie konkurencja o uwagę jest ogromna, AI pomaga tworzyć treści, które rzeczywiście przyciągają i utrzymują zainteresowanie widzów. A jakość modeli do wideo zaczyna

Speaker A

zbliżać się do produkcji kinowych. Dzięki!

Topics:generowanie wideo AIsztuczna inteligencjapromptowanie wideoplatformy AItext to videoimage to videovideo to videoAI StudioGoogle Vertexprodukcja wideo bez budżetu

Frequently Asked Questions

Jakie są główne tryby generowania wideo za pomocą AI?

Są trzy główne tryby: text to video, gdzie generujemy wideo na podstawie promptu tekstowego; image to video, który animuje zdjęcie lub obraz; oraz video to video, gdzie przekształcamy istniejący materiał wideo w inną formę.

Jakie elementy powinien zawierać prompt do generowania wideo AI?

Prompt powinien zawierać podmiot (centralny punkt sceny), akcję (co robi podmiot), scenę (miejsce akcji), ujęcie kamery, styl i estetykę oraz opcjonalnie dźwięk, dialogi lub efekty dźwiękowe.

Czy generowanie wideo AI wymaga specjalistycznej wiedzy lub dużego budżetu?

Nie, dzięki AI tworzenie materiałów wideo stało się dostępne dla każdego, bez potrzeby wielkich budżetów czy specjalistycznej wiedzy technicznej.

Get More with the Söz AI App

Transcribe recordings, audio files, and YouTube videos — with AI summaries, speaker detection, and unlimited transcriptions.

App Store Google Play

Or transcribe another YouTube video here →