uutiset

Zhipu AI on juuri tehnyt Sora "Qingying" virallisesti avoimen lähdekoodin

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Keskellä yötä valtameren toisella puolella ei rullannut, vaan kotimaiset yritykset rullasivat.

Haluan todella nukkua.

Syynä on se, että ennen nukkumaanmenoa katsellessani Githubia näin vahingossa THUKEG-tilin ja päivitin projektia.

CogVideoX

THUKEG on Zhipun virallinen nimike jaCogVideoX on Zhipun toisen sukupolven AI-videonpuhdistuksen perusmalli, joka oli erittäin suosittu viimeisen kahden viikon aikana.

Suosituimmilla termeillä CogVideoX on yhtä kuin GPT4o ja Qingying on yhtä kuinChatGPT, voit yksinkertaisesti ymmärtää, että toinen on malli ja toinen malliin perustuva tuote, joten voit itse piirtää yhtäläisyysmerkin.

Kahden viime viikon aikana, toisen sukupolven AI-videotaistelussa, joka perustui olemassa oleviin kolmeen fantasiajumalaan Runway, Ke Ling ja Luma, Pixverse julkaisi V2-version, ja myös Vidun malli julkaistiin.

Suurten mallien alan tähtiyrityksenä Zhipu on myös liittynyt tähän tekoälyvideon lähitaisteluun ja julkaissut DiT-videotuotteensa, Qingyingin.

Tätä tuotetta voidaan käyttää heidän tekoälyassistenttinsa Zhipu Qingyanissa.

Mutta ollakseni rehellinen, en kirjoittanut sitä, koska mielestäni sen ja Kelingin ja Runwayn välillä on edelleen tietty ero sukupolvivaikutusten suhteen.

Ja tänään, kaksi viikkoa Qingyingin julkaisun jälkeen, he päättivät tehdä niinCogVideoX,Se on avoimen lähdekoodin.

Kannattaa kokeilla.

CogVideoX-mallin latausosoite:

Nykyään valtavirran tekoälyvideot ovat kaikki suljettuja lähdekoodia. On olemassa avoimen lähdekoodin Open-Sora, mutta rehellisesti sanottuna vaikutus ei ole tyydyttävä.

Mitä tulee Qingyingiin, vaikka vaikutus on vielä kaukana valtavirran suljetun lähdekoodin mallista, se on ainakin käyttökelpoinen, kun on kyse jonkin sisällön suorittamisesta.

Tällä kertaa selailin avoimen lähdekoodin ohjelmia ja huomasin, että avoimen lähdekoodin versiot olivat yksiPieni malli CogVideoX-2B.

Päättely vaatii 21,6 Gt videomuistia, eli kun sinulla on yksi kortti 3090 tai 4090, voit suorittaa videoita suoraan paikallisesti polttamatta rahaa. Huippuarvo kuitenkin saavuttaa 36 Gt, mikä todennäköisesti kuluttaa videomuistin.

Mutta he itse sanoivat optimoivansa sen pian.

Mutta minulla on vain pieni roskapala 4060, ja videomuisti on vain 8G Vaikka olet optimoinut sen, en voi käyttää sitä. 4090, ollakseni rehellinen, minulla ei todellakaan ole rahaa ostaa sitä = =

On hienoa, kun tekoälyvideomalli, kuten SD1.5, hyödyttää kaikkia eläviä olentoja ja sitä voivat käyttää kaikki.

Tämä 2B malli,Videon pituus on 6 sekuntia, kuvataajuus on 8 kuvaa sekunnissa ja videon resoluutio on 720*480

Näillä parametreilla on sama tunne kuin Dreamin ensimmäisessä sukupolvessa.

Julkaisen muutaman heidän virallisista tapauksistaan ​​(itse asiassa se on melkein sama, jos menet Qingyingiin ja ajat muutaman)

Hieno puinen leluvene, jossa on taidokkaasti veistetyt mastot ja purjeet, liukuu pehmeästi pehmeällä sinisellä matolla, joka simuloi valtameren aaltoja. Runko on maalattu täyteläisen ruskeaksi ja siinä on pienet ikkunat. Matto on pehmeä ja kuvioitu, mikä tarjoaa täydellisen taustan, kuin valtava valtameri. Aluksen ympärillä on erilaisia ​​leluja ja lasten esineitä, mikä viittaa lapselliseen ympäristöön. Tämä kohtaus vangitsee lapsuuden viattomuuden ja mielikuvituksen, ja leluveneen matka symboloi loputonta seikkailua omituisissa sisätiloissa.

Kamera seuraa valkoista retro-maastoajoneuvoa, jonka katolla on musta tavarateline, maastoauto ajaa nopeasti jyrkässä rinteessä mäntyjen ympäröimänä jyrkkää hiekkatietä pitkin, renkailla lentää pölyä, aurinko loistaa maastoajoneuvossa, maastoauto Nopeaa ajaminen hiekkatiellä antaa lämpimän hehkun koko kohtaukseen. Hiekkatie kaartui hitaasti kaukaisuuteen, eikä muita ajoneuvoja näkynyt. Puut molemmin puolin tietä ovat punapuita, ja siellä on hajallaan vihreitä kasveja. Takaa katsottuna auto seuraa mutkia helposti, ikään kuin se ajaisi epätasaisessa maastossa. Itse hiekkatietä ympäröivät jyrkät kukkulat ja vuoret, joiden yläpuolella on kirkas sininen taivas ja ohuet valkoiset pilvet.

Sodan runtelemassa kaupungissa, jossa rauniot ja rauniot kertovat tuhosta, koskettava lähikuva vangitsee nuoren tytön tätä sydäntäsärkevää taustaa vasten. Hänen kasvonsa tahrasivat tuhkaa, mikä oli hiljainen todistus häntä ympäröivästä kaaoksesta. Hänen silmänsä kimaltelevat surusta ja sitkeydestä ja vangitsevat raakoja tunteita maailmassa, joka on vailla viattomuutta konfliktien takia.

Perustelut ovat luultavasti tämänkaltaisia, mutta odotan enemmän avoimen lähdekoodin osalta hienosäädön ja lisäosien ekologiaa.

Esimerkiksi kaikkien nyt käyttämä AI-piirustus SD 1.5 -malli, perusmalli on itse asiassa kuin paskaa, mutta se on loppujen lopuksi avoimen lähdekoodin lähde, ja joukko mestareita on tehnyt erittäin mahtavia SD1:een perustuvia malleja. .5, kuten Majic, DreamShaper, Anything ja paljon muuta.

jaCogVideoX voidaan myös hienosäätää.

Tuli mieleen Stepping Starsin ja Shadowsin WAIC:n tekoälyvideomalli. He käyttivät 200 minuuttia Calabash-nukkemateriaalia suuren Calabash-nukkemallin luomiseen.

Kaikki tuottamasi on Calabashwa-tyyliä, ja sinun ei tarvitse tehdä kovasti töitä saavuttaaksesi hahmon johdonmukaisuuden.

Ja nyt,CogVideoX on avoimen lähdekoodin lähde, ja jos voimme hienosäätää sitä, jotkut ihmiset, jotka käyttävät tekoälyä lyhyiden näytelmien ja pitkien sarjojen tekemiseen, voivat yrittää hienosäätää omia suuria videomallejaan muokatakseen tyylejä ja hahmoja.

Koska olen aina tuntenut, että Wenshengin videoiden yläraja ja suorituskykydynamiikka ovat paljon korkeammat kuin Tushengin videoiden, mutta kaksi suurinta estettä ovat tyylin johdonmukaisuus ja hahmon johdonmukaisuus ratkaistu.

CogVideoX-2B:n hienosäätö vaatii 46,2 Gt videomuistia. Tavalliset näytönohjaimet eivät riitä, joten tarvitaan A6000:n kaltainen renderöintikortti.

Mutta loppujen lopuksi se on videomalli. Se ei tarkoita, että se hyödyttäisi suurta yleisöä, mutta joidenkin start-up-yritysten ja pienyritysten kynnys on lähes 0.

Koska tämä on avoimen lähdekoodin, heidän ei tarvitse käyttää lukemattomia varoja rakentaakseen oman suuren mallinsa tyhjästä Selvittääkseen tämän sudenkuopan, heidän tarvitsee vain ostaa paikallisia kortteja, joiden summa on kymmeniä tuhansia tai satoja tuhansia. , ja sitten hienosäätö voidaan tehdä paikallisesti.

Olen aina uskonut, että avoimen lähdekoodin tulevaisuus on parempi kuin suljetun lähdekoodin.

Sinä iltana, jolloin Zuckerberg julkaisi LLaMa3.1 405B:n jokin aika sitten, hän julkaisi 10 000 sanan avoimen kirjeen Facebookissa.

Yksi kohdista teki minuun syvän vaikutuksen.

Käännettynä on:

Uskon vakaasti, että avoin lähdekoodi on välttämätön positiiviselle tekoälyn tulevaisuudelle. Tekoälyllä on suurempi potentiaali kuin millään nykytekniikalla parantaa ihmisten tuottavuutta, luovuutta ja elämänlaatua, nopeuttaa talouskasvua ja edistää lääketieteellisen ja tieteellisen tutkimuksen edistymistä. Avoin lähdekoodi varmistaa, että yhä useammat ihmiset voivat nauttia tekoälyn tuomista eduista ja mahdollisuuksista, estää vallan keskittymisen muutaman yrityksen käsiin ja mahdollistaa tämän teknologian edistämisen koko yhteiskunnassa tasapainoisemmalla ja turvallisemmalla tavalla.

Vallan keskittymisen estäminen muutaman yrityksen käsiin mahdollistaa teknologian olevan enemmänMainosta sitä koko yhteiskunnalle tasapainoisella ja turvallisella tavalla

Avoin lähdekoodi on paras menetelmä.

Jokaisella yrityksellä on kolme suurta vaivaa tekoälyn käytössä:

1. Heidän täytyy kouluttaa, hienosäätää ja jalostaa omia mallejaan.

2. Heidän on suojattava yksityisiä tietojaan.

3. He toivovat voivansa muuttaa tekoälynsä pitkän aikavälin standardiekosysteemiksi.
Kaikki tämä yhteen lauseeseen tiivistettynä:

Meidän on kyettävä hallitsemaan omaa kohtaloamme sen sijaan, että jättäisimme sen muille.

Kiinassa Zhipu on mielestäni hyvin erityinen yritysOpenAI, ja hänellä on Metan temperamentti.

Sinun täytyy tietää, että Metan liiketoimintamalli on täysin erilainen kuin joidenkin suurten malliyritysten, kuten OpenAI:n, liiketoimintamalli. Ne eivät kerää rahaa myymällä suurten mallien käyttöoikeuksia, joten avoimella lähdekoodilla ei ole suurta vaikutusta Metaan.

Mutta Zhipu on erilainen malliyritys.

Mutta tällaisten näkökohtien perusteella he hankkivat sen silti päättäväisesti avoimen lähdekoodin.

Ehkä he ovat kuin Meta, sillä erittäin jalolla uskolla: "Että tätä teknologiaa voitaisiin edistää koko yhteiskunnassa tasapainoisemmin ja turvallisemmin."

PaitsiCogVideoX:n lisäksi he ovat myös saaneet avoimen lähdekoodin monia asioita.

Mene heidän Githubiin ja selaa, löydät monia yllätyksiä:

Rakastan jokaista yritystä, joka on valmis käyttämään avointa lähdekoodia.

Odotan innolla tulevaa päivää, jolloin lukemattomat kehittäjät kehittävät erilaisia ​​laajennuksia ja hienosäätömalleja, jotka perustuvat CogVideoX:iin. Jokainen elokuva- ja televisio-, lyhytdraamaan, mainonnan ja muiden videoihin liittyvien teollisuudenalojen yritys niillä on omat lukuisat mallit ja erilaiset videoiden luomisen työnkulkuja.

Aivan kuten SD menestyy useissa yrityksissä.

Ihailen viisauden spektriä.

Tämä ei ole vain tekninen päätös, vaan myös uskon välittäminen.

Valot valtameren toisella puolella sammuivat vähitellen.

Ja aamunkoitto puolellamme.

on nousemassa.

Nyt kun olet lukenut tämän, jos se on mielestäsi hyvä, tykätkää, katsokaa ja uudelleentwiitaakaa kolme kertaa. Jos haluat saada ilmoitukset mahdollisimman pian, voit myös antaa minulle tähden⭐ ~Kiitos, että luit artikkelini, nähdään ensi kerralla.
>/ Kirjoittaja: Kazik