Firma zajmująca się sztuczną inteligencją Midjourney niedawno zaprezentowała swój kolejny duży krok naprzód. Po latach oferowania i koncentrowania się na zdjęciach, Midjourney chce teraz rozszerzyć swoją działalność na świat generowania wideo, w szczególności generowania w czasie rzeczywistym.
Jest to teraz dostępne jako część Version 1 Video Model, który jest opisany jako "coś zabawnego, łatwego, pięknego i niedrogiego, aby każdy mógł odkrywać". W tej chwili system ma przekształcać obrazy w wideo za pomocą mechaniki animacji ruchu. Zasadniczo ożywia i porusza nieruchomy obraz, który można dostosować w zależności od poziomu ruchu, którego należy oczekiwać od danego obrazu źródłowego.
W porównaniu z konkurencyjnym oprogramowaniem wideo AI może się wydawać, że Midjourney jest nieco w tyle, ale zauważa, że jest to tylko krok w kierunku znacznie większego celu. Długoterminowym zamiarem jest możliwość oferowania symulacji otwartego świata w czasie rzeczywistym, a osiągnięcie tego celu oznacza również możliwość poruszania się po modelach 3D generowanego wideo, a następnie bardzo szybkiego generowania wszystkiego. Te ostatnie punkty są kolejnymi krokami w kierunku urzeczywistnienia celu Midjourney. Własnymi słowami Midjourney:
"To, czego możesz nie wiedzieć, to fakt, że wierzymy, że nieuniknionym celem tej technologii są modele zdolne do symulacji otwartego świata w czasie rzeczywistym.
— Co to jest? Zasadzie; wyobraź sobie system sztucznej inteligencji, który generuje obrazy w czasie rzeczywistym. Możesz nakazać mu poruszanie się w przestrzeni 3D, otoczenie i postacie również się poruszają, a także możesz wchodzić w interakcje ze wszystkim.
"Aby to zrobić, potrzebujemy elementów konstrukcyjnych. Potrzebujemy wizualizacji (naszych pierwszych modeli graficznych). Musimy sprawić, by te obrazy się poruszały (modele wideo). Musimy być w stanie poruszać się w przestrzeni (modele 3D) i musimy być w stanie zrobić to wszystko szybko (modele w czasie rzeczywistym).
"Następny rok polega na budowaniu tych elementów indywidualnie, wypuszczaniu ich, a następnie powoli, składaniu wszystkiego w jeden jednolity system. Na początku może to być drogie, ale szybciej niż myślisz, jest to coś, z czego każdy będzie mógł korzystać".
Haczyk w tym oprogramowaniu wideo polega na tym, że jest znacznie droższe w użyciu. Midjourney pobiera 8 razy więcej niż za zadanie graficzne, które według niego jest nadal "ponad 25 razy tańsze niż to, co rynek dostarczał wcześniej".