uutiset

Kuka voi ohittaa Soran käytännön kokemuksella kotimaisten AI-videomallien avaamisesta?

2024-08-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Kansiuutisten toimittaja Xiong Yingying
Tämän vuoden alussa yhdysvaltalainen OpenAI julkaisi tekoälyn videosukupolvimallin Sora, joka oli kuin ukkonen maassa ja toi uusia mahdollisuuksia tekoälyn sovelluksiin. Tuolloin monet nettiläiset valittivat, että meidän ja ulkomaisen tekoälyteknologian välinen kuilu kasvaa ja laajeni.
Kuitenkin vain puolessa vuodessa "kotimainen Sora", kuten Keling, PixVerse V2, Qingying ja Vidu, on julkaistu peräkkäin ja ovat avoinna käyttäjille ilmaiseksi.
Mikä kotimainen videomalli on paras? Vaikka teknologia tekee edelleen läpimurtoja, kuka voi ottaa kaupallistamisen johtavan aseman?
Neljä ”kotimaista Sora” -tuotetta julkaistaan ​​tämän kuun aikana
Toimittajan todellinen testikokemus
Vaikka hintasota suurten kotimaisten valmistajien ja suurten mallien välillä on ankara, jotkut yritykset keskittyvät tekoälyvideon luomiseen ja tekevät salaisia ​​ponnisteluja. Epätäydellisten tilastojen mukaan tällä hetkellä on olemassa yli 10 laajamittaista kotimaista AI-videomallia Pelkästään tämän vuoden heinäkuussa lanseerattiin 4 "kotimaan Sora" -mallia.
Heinäkuun 6. päivänä lanseerattiin virallisesti Kuaishou Keling AI -verkkosivusto, joka tarjoaa Wensheng-video- ja Tusheng-videotoimintoja, jotka voivat luoda jopa 10 sekuntia kestäviä videoita. Se lisäsi myös toimintoja, kuten kameran liikkeen ohjauksen ja ensimmäisen ja viimeisen ruudun mukautuksen.
Heinäkuun 24. päivänä Aishi Technology julkaisi virallisesti PixVerse V2:n, joka avataan maailmanlaajuisesti samanaikaisesti. Tämä malli voi luoda useita videoleikkeitä kerralla, ja se voi tuottaa 8 sekuntia videota yhdelle leikeelle ja 40 sekuntia useille leikkeille.
Myöhemmin myös Zhipu AI Companyn luoma Qingying ja Shengshu Technologyn itsenäisesti kehittämä Vidu julkaistiin peräkkäin. Niistä Qingying keskittyy nopeaan luomiseen 30 sekunnissa.
Edellä mainittujen neljän yrityksen laajamittaiset videosukupolvimallit ovat tällä hetkellä avoinna testattavaksi Nopeasti puhelimitse, sähköpostitse tms. rekisteröitymisen jälkeen toimittajilla oli myös todellista kokemusta.
Testaakseen "Picture Video" -toimintoa toimittaja latasi saman kuvan ruususta, joka ei ole vielä kukkinut neljälle suurelle mallisivustolle ja syötti sanan "kukka kukkii". video kukkien kukkimisesta. PixVersen ja Kelingin luomassa videossa voit nähdä kukkien heiluvan, mutta "kukkimisesta" ei ole dynaamista vaikutusta. Mutta kun toimittaja vaihtoi kehotussanan "hitaasti kukkiva kukka", Keling loi onnistuneesti myös videon ruusun kukkimisesta. Voidaan nähdä, että eri suurten mallien kyvyssä käsitellä ja ymmärtää kieltä on eroja.
Neljän kotimaisen suuren mallin luomia videokuvakaappauksia
Videoiden luomisen nopeudesta päätellen Vidu kesti nopeimman ajan, luoden 3 sekunnin videon alle minuutissa. Kaikki kolme muuta suurta mallia suorittivat videon luomisen 5 minuutissa. Vaikka Qingying mainostaa "nopeaa generointia 30 sekunnissa", ehkä siksi, että sitä yrittää liian monet ihmiset, sukupolvisivulla näkyy "odotetaan jonottavan 3 minuuttia".
Sosiaalisten alustojen verkkokäyttäjien kokemuspalautteesta päätellen kaikissa suurimmissa malleissa on enemmän tai vähemmän ongelmia, kuten hahmojen vääristymiä ja puuttuvia kuvia.
"On monia, jotka odottavat ja näkevät, mutta harvat ryhtyvät toimiin."
Investoinnit suurten mallien alalla ovat yleensä varovaisia
Kun Sora syntyi vuoden alussa, Internetissä oli vielä pessimistisiä ääniä, jotka uskoivat Kiinan olleen paljon jäljessä Yhdysvalloista tekoälyn alalla. Vain puolessa vuodessa Kiinassa on syntynyt useita suuria AI-videomalleja, jotka kilpailevat Soran kanssa.
Tianyancha osoittaa, että vuonna 2019 perustettu Zhipu AI on suorittanut C-sarjan rahoituksen ja sen arvo on tällä hetkellä yli 10 miljardia. Vaikka Aishi Technology ja Shenshu Technology perustettiin vasta vuonna 2023, ne ovat suorittaneet kolme ja neljä rahoituskierrosta. Tarkoittaako tämä sitä, että sijoituspiiri on edelleen erittäin innostunut investoimaan suuriin kilpa-ajoon?
"Periaatteessa näemme yhä enemmän ja investoimme hyvin vähän." hankkeita. Toisaalta suuret valmistajat voivat löytää joitain sovellusskenaarioita suurille videomalleille olemassa olevissa liiketoiminnoissaan, toisaalta, jos nämä suuret mallit ovat jossain määrin päällekkäisiä yrityksen oman liiketoiminnan kanssa, niitä voidaan käyttää täydennyksenä; suuret valmistajat voivat myös olemassa olevien ekologisten resurssien avulla nämä suuret malliyritykset vahvistuvat jossain määrin.
Zhipu AI -yritys on kerännyt yli 100 miljoonaa yuania useilla rahoituskierroksilla
Kaiken kaikkiaan kotimaiset sijoituslaitokset suhtautuvat edelleen konservatiivisesti ja varovaisesti suuriin malleihin, kuten Vincent Video ja Tush Video. Suurin syy tähän on, että niiden kaupallistaminen kohtaa monia haasteita.
Guo Taon näkemyksen mukaan, olipa kyseessä Sora tai iso kotimainen malli, syntyneissä videoissa on silti tiettyjä puutteita. Esimerkiksi tekoälyn luomilla hahmoilla on joskus ylimääräinen sormi, ne eivät voi osua koriin ammuttaessa jne. Tämä osoittaa, että suurella mallilla ei ole riittävästi ymmärrystä objektien välisestä tilasuhteesta, ja myös algoritmimallia kaipaa edelleen parantamista.
Teknisten ongelmien lisäksi, jotka on vielä voitettava, suurin ongelma suurten tekoälyvideomallien kaupallistamisessa on kypsien sovellusskenaarioiden puute.
"Esimerkiksi Kuaishoulla itsellään on alusta ja sisältö, ja suhteellisesti sillä on tiettyjä sovellusskenaarioita. Monet itsemediayritykset voivat käyttää sitä, mutta joidenkin puhtaasti teknisten yritysten on edelleen vaikea löytää niitä." Erityisen hyvä ja jäykkä kysyntäskenaario, jossa käyttäjät ovat valmiita maksamaan.
Alusta nopeuttaa kaupallistamisen tutkimista
Mikrolyhyteldraaman markkinoiden odotetaan ottavan johtoaseman laskeutumisessa
Vaikka kaupallistamisessa on haasteita, suuret mallialustat kotimaassa ja ulkomailla tutkivat ja yrittävät aktiivisesti kaupallistamista.
Toimittaja huomasi, että tällä hetkellä kotimaiset tekoälyvideomallit ovat alkaneet maksaa myös kuluttajapuolella. Keling AI:n virallinen WeChat-viesti paljasti 24. heinäkuuta, että käyttöoikeuksia hakeneiden käyttäjien määrä on ylittänyt miljoonan. Samana päivänä otettiin käyttöön maksullinen jäsenyysjärjestelmä, joka sisältää kolme jäsenluokkaa: kulta, platina ja timantti. Vuotuinen jäsenhinta vaihtelee yli 500 yuanista Se vaihtelee yli 5 000 yuania.
PixVerse ottaa käyttöön tilausmaksumallin, joka sisältää perusversion, vakioversion ja rajoittamattoman version, ja yksikköhinnat vaihtelevat 5 yuanista 60 yuania.
Monet alan sisäpiiriläiset sanoivat kuitenkin, että tällä hetkellä suurilla tekoälymalleilla on erittäin korkeat laskentatehokustannukset ja asiakkaiden maksutottumukset eivät ole vielä muodostuneet, ja kilpailu markkinoilla on erittäin kovaa C-puolen maksulla.
Mediatietojen mukaan tämän vuoden kesäkuussa maailmankuulu lasten lelubrändi "Toys R Us" teki yhteistyötä OpenAI:n kanssa Soran tuottaman 1-minuuttisen mainoselokuvan "The Origin of Toys R Us" avulla tuottaa toteutettavissa olevia kaupallisia mainoksia.
Heinäkuussa julkaistiin ensimmäinen kotimainen AIGC:n alkuperäinen fantasia-mikrolyhytdraama "Mountains and Seas Strange Mirror: Breaking the Waves". Draamassa on 5 jaksoa ja sen kesto on 15 minuuttia , fantastinen Kunpeng ja outo peto jne. ovat kaikki tekoälyn luomia.
Kun yhä useammat tuotantoyritykset ja alustat alkavat tutkia "AI + mikrolyhytdraaman" integraatiopolkua, tekoälyvideon suuret mallit voivat olla ensimmäisiä, jotka kaupallistetaan mikrolyhytdraaman markkinoilla.
Raportti/palaute