uutiset

Zhipu AI on virallisesti avoimen lähdekoodin Sora "Qingying"

2024-08-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Keskellä yötä valtameren toisella puolella ei rullannut, vaan kotimaiset yritykset rullasivat.

Haluan todella nukkua.

Syynä on se, että ennen nukkumaanmenoa katsellessani Githubia näin vahingossa THUKEG-tilin ja päivitin projektia.

CogVideoX

THUKEG on Zhipun virallinen nimike jaCogVideoX on Zhipun toisen sukupolven AI-videonpuhdistuksen perusmalli, joka oli erittäin suosittu viimeisen kahden viikon aikana.

Suosituimmilla termeillä CogVideoX on yhtä kuin GPT4o ja Qingying on yhtä kuinChatGPT, voit yksinkertaisesti ymmärtää, että toinen on malli ja toinen malliin perustuva tuote, joten voit itse piirtää yhtäläisyysmerkin.

Kahden viime viikon aikana toisen sukupolven AI-videotaistelussa Pixverse julkaisi V2-version, joka perustuu olemassa oleviin kolmeen fantasiajumalaan Runway, Ke Ling ja Luma, ja paljon toivottu Vidu-malli julkaistiin myös.

Suurten mallien alan tähtiyrityksenä Zhipu on myös liittynyt tähän tekoälyvideon lähitaisteluun ja julkaissut DiT-videotuotteensa, Qingyingin.

Tätä tuotetta voidaan käyttää heidän tekoälyassistenttinsa Zhipu Qingyanissa.

Mutta ollakseni rehellinen, en kirjoittanut sitä, koska mielestäni sen ja Kelingin ja Runwayn välillä on edelleen tietty ero sukupolvivaikutusten suhteen.

Ja tänään, kaksi viikkoa Qingyingin julkaisun jälkeen, he päättivät tehdä niinCogVideoX,Se on avoimen lähdekoodin.

Kannattaa kokeilla.

CogVideoX-mallin latausosoite:

Nykyään valtavirran tekoälyvideot ovat kaikki suljettuja lähdekoodia. On olemassa avoimen lähdekoodin Open-Sora, mutta rehellisesti sanottuna vaikutus ei ole tyydyttävä.

Mitä tulee Qingyingiin, vaikka vaikutus on vielä kaukana valtavirran suljetun lähdekoodin mallista, se on ainakin käyttökelpoinen, kun on kyse jonkin sisällön suorittamisesta.

Tällä kertaa selailin avoimen lähdekoodin ohjelmia ja huomasin, että avoimen lähdekoodin versiot olivat yksiPieni malli CogVideoX-2B.

Päättäminen vaatii 18 Gt videomuistia, eli kun sinulla on yksi kortti 3090 tai 4090, voit suorittaa videoita suoraan paikallisesti polttamatta rahaa. Huippuarvo kuitenkin saavuttaa 36 Gt, mikä todennäköisesti kuluttaa videomuistin.

Mutta he itse sanoivat optimoivansa sen pian.

Mutta minulla on vain pieni pala 4060:ta, jossa on vain 8 Gt videomuistia, vaikka olet optimoinut sen, en voi käyttää sitä. 4090, ollakseni rehellinen, minulla ei todellakaan ole rahaa ostaa sitä = =

On hienoa, kun tekoälyvideomalli, kuten SD1.5, hyödyttää kaikkia eläviä olentoja ja sitä voivat käyttää kaikki.

Tämä 2B malli,Videon pituus on 6 sekuntia, kuvataajuus on 8 kuvaa sekunnissa ja videon resoluutio on 720*480

Näillä parametreilla on sama tunne kuin Dreamin ensimmäisessä sukupolvessa.

Julkaisen muutaman heidän virallisista tapauksistaan ​​(itse asiassa se on melkein sama, jos menet Qingyingiin ja ajat muutaman)

Hieno puinen leluvene, jossa on taidokkaasti veistetyt mastot ja purjeet, liukuu pehmeästi pehmeällä sinisellä matolla, joka simuloi valtameren aaltoja. Runko on maalattu täyteläisen ruskeaksi ja siinä on pienet ikkunat. Matto on pehmeä ja kuvioitu, mikä tarjoaa täydellisen taustan, kuin valtava valtameri. Aluksen ympärillä on erilaisia ​​leluja ja lasten esineitä, mikä viittaa lapselliseen ympäristöön. Tämä kohtaus vangitsee lapsuuden viattomuuden ja mielikuvituksen, ja leluveneen matka symboloi loputonta seikkailua omituisissa sisätiloissa.

Kamera seuraa valkoista retro-maastoajoneuvoa, jonka katolla on musta tavarateline, maastoauto ajaa nopeasti jyrkässä rinteessä mäntyjen ympäröimänä jyrkkää hiekkatietä pitkin, renkailla lentää pölyä, aurinko loistaa maastoajoneuvoon, maastoajoneuvoon Nopeasti ajettaessa hiekkatiellä hehkuu koko kohtaus lämpimästi. Hiekkatie kaartui hitaasti kaukaisuuteen, eikä muita ajoneuvoja näkynyt. Puut molemmin puolin tietä ovat punapuita, ja siellä on hajallaan vihreitä kasveja. Takaa katsottuna auto seuraa mutkia helposti, ikään kuin se ajaisi epätasaisessa maastossa. Itse hiekkatietä ympäröivät jyrkät kukkulat ja vuoret, joiden yläpuolella on kirkas sininen taivas ja ohuet valkoiset pilvet.

Sodan runtelemassa kaupungissa, jonka rauniot ja rauniot kertovat tarinaa tuhosta, koskettava lähikuva vangitsee nuoren tytön tätä sydäntäsärkevää taustaa vasten. Hänen kasvonsa tahrasivat tuhkaa, mikä oli hiljainen todistus häntä ympäröivästä kaaoksesta. Hänen silmänsä kimaltelevat surusta ja sitkeydestä ja vangitsevat raakoja tunteita maailmassa, joka on vailla viattomuutta konfliktien takia.

Perustelut ovat luultavasti tämänkaltaisia, mutta odotan enemmän avoimen lähdekoodin osalta hienosäädön ja lisäosien ekologiaa.

Esimerkiksi kaikkien nyt käyttämä AI-piirustus SD 1.5 -malli, perusmalli on itse asiassa kuin paska, mutta se on loppujen lopuksi avoimen lähdekoodin joukossa mestareita, jotka ovat tehneet erittäin mahtavia SD1-pohjaisia ​​malleja. 5, kuten Majic, DreamShaper, Anything ja paljon muuta.

jaCogVideoX voidaan myös hienosäätää.

Tuli mieleen Stepping Starsin ja Shadowsin WAIC:n tekoälyvideomalli. He käyttivät 200 minuuttia Calabash-nukkemateriaalia suuren Calabash-nukkemallin luomiseen.

Kaikki tuottamasi on Calabash Babyn tyyliä. Sinun ei tarvitse tehdä töitä hahmojen johdonmukaisuuden saavuttamiseksi heistä.

Ja nyt,Hammasvideo

Koska olen aina tuntenut, että Wenshengin videoiden yläraja ja suorituskykydynamiikka ovat paljon korkeammat kuin Tushengin videoiden, mutta kaksi suurinta estettä ovat tyylin johdonmukaisuus ja hahmon johdonmukaisuus ratkaistu.

CogVideoX-2B:n hienosäätö vaatii 40 Gt videomuistia. Tavalliset näytönohjaimet eivät riitä, joten tarvitaan A6000:n kaltainen renderöintikortti.

Mutta loppujen lopuksi se on videomalli. Se ei tarkoita, että se hyödyttäisi suurta yleisöä, mutta joidenkin start-up-yritysten ja pienyritysten kynnys on lähes 0.

Koska tämä on avoimen lähdekoodin, heidän ei tarvitse käyttää lukemattomia varoja rakentaakseen oman suuren mallinsa tyhjästä Selvittääkseen tämän sudenkuopan, heidän tarvitsee vain ostaa paikallisia kortteja, joiden summa on kymmeniä tuhansia tai satoja tuhansia. , ja sitten hienosäätö voidaan tehdä paikallisesti.

Olen aina uskonut, että avoimen lähdekoodin tulevaisuus on parempi kuin suljetun lähdekoodin.

Sinä yönä, jolloin Zuckerberg julkaisi LLaMa3.1 405B:n jokin aika sitten, hän julkaisi 10 000 sanan avoimen kirjeen Facebookissa.

Yksi kohdista teki minuun syvän vaikutuksen.

Käännettynä on:

Uskon vakaasti, että avoin lähdekoodi on välttämätön positiiviselle tekoälyn tulevaisuudelle. Tekoälyllä on suurempi potentiaali kuin millään nykytekniikalla parantaa ihmisten tuottavuutta, luovuutta ja elämänlaatua, nopeuttaa talouskasvua ja edistää lääketieteellisen ja tieteellisen tutkimuksen edistymistä. Avoin lähdekoodi varmistaa, että yhä useammat ihmiset voivat nauttia tekoälyn tuomista eduista ja mahdollisuuksista, estää vallan keskittymisen muutaman yrityksen käsiin ja mahdollistaa tämän teknologian edistämisen koko yhteiskunnassa tasapainoisemmalla ja turvallisemmalla tavalla.

Vallan keskittymisen estäminen muutaman yrityksen käsiin mahdollistaa teknologian olevan enemmänMainosta sitä koko yhteiskunnalle tasapainoisella ja turvallisella tavalla

Avoin lähdekoodi on paras menetelmä.

Jokaisella yrityksellä on kolme suurta vaivaa tekoälyn käytössä:

1. Heidän täytyy kouluttaa, hienosäätää ja jalostaa omia mallejaan.

2. Heidän on suojattava yksityisiä tietojaan.

3. He toivovat voivansa muuttaa tekoälynsä pitkän aikavälin standardiekosysteemiksi.
Kaikki tämä yhteen lauseeseen tiivistettynä:

Meidän on kyettävä hallitsemaan omaa kohtaloamme sen sijaan, että jättäisimme sen muille.

Kiinassa Zhipu on mielestäni hyvin erityinen yritysOpenAI, ja hänellä on Metan temperamentti.

Sinun täytyy tietää, että Metan liiketoimintamalli on täysin erilainen kuin joidenkin suurten malliyritysten, kuten OpenAI:n, liiketoimintamalli. He eivät kerää rahaa myymällä suuria malleja, joten avoimella lähdekoodilla ei ole suurta vaikutusta Metaan.

Mutta Zhipu on erilainen malliyritys.

Mutta tällaisten näkökohtien perusteella he hankkivat sen silti päättäväisesti avoimen lähdekoodin.

Ehkä he ovat kuin Meta, sillä erittäin jalolla uskolla: "Että tätä teknologiaa voitaisiin edistää koko yhteiskunnassa tasapainoisemmin ja turvallisemmin."

PaitsiCogVideoX:n lisäksi heillä on myös monia avoimen lähdekoodin tuotteita.

Mene heidän Githubiin ja selaa, löydät monia yllätyksiä:

Rakastan jokaista yritystä, joka on valmis käyttämään avointa lähdekoodia.

Odotan innolla tulevaa päivää, jolloin lukemattomat kehittäjät kehittävät erilaisia ​​laajennuksia ja hienosäätömalleja, jotka perustuvat CogVideoX:iin. Jokainen elokuva- ja televisio-, lyhytdraamaan, mainonnan ja muiden videoihin liittyvien teollisuudenalojen yritys niillä on omat lukuisat mallit ja erilaiset videoiden luomisen työnkulkuja.

Aivan kuten SD menestyy useissa yrityksissä.

Ihailen viisauden spektriä.

Tämä ei ole vain tekninen päätös, vaan myös uskon välittäminen.

Valot valtameren toisella puolella sammuivat vähitellen.

Ja aamunkoitto puolellamme.

on nousemassa.

Nyt kun olet lukenut tämän, jos se on mielestäsi hyvä, tykätkää, katsokaa ja uudelleentwiitaakaa kolme kertaa. Jos haluat saada ilmoitukset mahdollisimman pian, voit myös antaa minulle tähden⭐ ~Kiitos, että luit artikkelini, nähdään ensi kerralla.
>/ Kirjoittaja: Kazik