notizia

abbiamo fatto una videochiamata all'ia e abbiamo scoperto che sembrava poter parlare di tutto. . .

2024-08-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


alla conferenza openai tre mesi fa, credo che alcuni di voi abbiano visto gpt-4o. era proprio come una persona reale.funzionalità di conversazione video fluide.

c'è anche il progetto astra lanciato da google, che in termini di forza non è inferiore a gpt-4o.


a quel tempo, quasi tutta internet si vantava di quanto potenti si fossero evolute le capacità interattive dell’intelligenza artificiale e venivano usati termini come epico e next level.

cosa è successo? la funzione di videochiamata promessa da gpt-4o è stata ritardata ancora e ancora per diversi mesi.ognuno di loro è quasi incazzato dai pessimi recensori. . .

tuttavia, ho scoperto che sembra esserci una regola nel circolo dell’intelligenza artificiale, ovvero non si può far aspettare troppo a lungo le persone per ottenere cose buone. vedi, sora è rimasta riservata per più di sei mesi, di conseguenza, keling, luma ai e zhipu qingying sono apparsi uno dopo l'altro.

negli ultimi due giorni, alla conferenza di data mining kdd a barcellona, ​​zhipu si è trovata di fronte alla comunità accademica e industriale globale.non solo è stato rilasciato l'ultimo modello base di grandi dimensioni glm-4-plus, ma ha anche aggiornato la funzione di videochiamata di zhipu qingyan.


vorrei evidenziare i punti chiave per tutti.è quello della leggenda che può vedere e chattareintelligenza artificialela funzione di videochiamata è ora disponibile direttamente nell'app qingyan. puoi prima scaricare l'app e richiedere una prova.

mettendo da parte tutto il resto, rispetto a openai, zhipu è già più veloce di openai. . .

pertanto, non appena è stata lanciata la funzione di videochiamata di qingyan, il signor bianbing è stato il primo a utilizzarla. apri l'app qingyan, fai clic sul pulsante di chiamata nell'angolo in basso a destra, quindi passa al video e inizia a riprodurre direttamente ~


gli amici dovrebbero anche sapere che uno dei motivi importanti per cui gpt-4o è così popolare è che ha una capacità molto potente di comprendere i video.

per quanto riguarda la cosa più elementare, la capacità di comprensione dei video di qingyan deve essere prima testata, giusto?

il recensore ha dato a qingyan un'occhiata alla sala conferenze dove di solito la nostra redazione fa brainstorming, per vedere se riusciva a indovinare cosa stavo facendo in base all'ambiente circostante. ha anche scosso deliberatamente la fotocamera senza mantenere il video completamente fermo.

indovina un po', il solo dire "wow, indovina cosa stai facendo" mi ha quasi dato filo da torcere. ma sedersi al tavolo nella sala conferenze non è sbagliato. anche i bicchieri di carta sul tavolo, il telecomando e la tv accanto sono descritti in modo abbastanza accurato.

quando ho messo l’obiettivo sul computer del mio collega, ho potuto effettivamente vedere che stava modificando un video.

non dirmelo, questo tipo di capacità di percepire l'ambiente generale che ti circonda è stato visto solo in openai e nella demo di google. oggi l'ho sperimentato personalmente. sembra davvero che la fantascienza sia diventata realtà.

inoltre, qingyan è lo stesso dimostrato da gpt-4o.puoi interrompere in qualsiasi momento durante la conversazione.di tanto in tanto, utilizzerà anche le parole modali "ahi" e "ahi" e riderà prima di parlare, proprio come quando chatti con una persona reale.

quindi, ho provato la funzione specifica di riconoscimento degli oggetti per vedere la riserva di conoscenza di qingyan.

partendo dalla scansione più semplice della postazione di lavoro, in pratica non mancano oggetti di grandi dimensioni come tastiere bianche, mouse neri e monitor. anche le direzioni anteriore, posteriore, sinistra e destra degli oggetti sono chiaramente descritte, persino le cuffie plug-in i personaggi dei cartoni animati sul vetro nessun dettaglio è stato risparmiato.

non posso dire il 100%, ma su questo tavoloalmeno l'80%-90%tutto è stato visto da qingyan.

inoltre, qingyan ha anche un'altra funzionericonoscimento del cerchio, ho circondato da lontano il grande stereo del mio collega. conosceva la marca, il modello e persino il suo scopo specifico.

sebbene ci siano parole sugli altoparlanti, tutti dovrebbero essere in grado di vedere la chiarezza. è difficile vedere ad occhio nudo. devo dire che gli occhi chiari sono davvero facili da usare. . .

inoltre, ho scoperto anche quelloil riconoscimento degli oggetti da parte di qingyan va oltre le semplici categorie.

ad esempio, se chiedi se questo controller di gioco è di sony o microsoft, può analizzarlo in base al design della forma del controller. questa è la xbox di microsoft. invece di dirti semplicemente che si tratta di un controller di gioco, o semplicemente di confonderlo e non riuscire a spiegarlo chiaramente.

ci sono anche i dettagli di questo antico feature phone, nokia, il modello specifico è n95 e il modello classico del 2007.

più tardi, ho chiesto a qingyan di identificare il sistema informatico, di indovinare l'età di tony guardando le sue foto e di indovinare i nomi delle persone guardando le foto delle celebrità. . . mettiamola in questo modo, da quando ho iniziato a usare qingyan, ora voglio aprire una videochiamata e chiedere qualsiasi cosa catturi.

certo, è divertente. in realtà esistono molte forme di videochiamate.scenari pratici

prendiamo come esempio la ricerca quotidiana di argomenti e materiali da parte della nostra redazione. i punti caldi del settore automobilistico in questi due giorni sono sostanzialmente inseparabili dal chengdu auto show. in questo momento, puoi chiedere a qingyan del chengdu auto show e cercare argomenti durante l'ispirazione della conversazione.

principalmente, ho anche scoperto che qingyan lo ha fattofunzione di memoria, ne ho parlato nell'ultima videochiamata e la volta successiva che l'ho aperta, si è avvicinato e mi ha chiesto quali veicoli a nuova energia al salone dell'auto ho seguito.

c'è anche il tutoraggio dei compiti, che è la cosa più fastidiosa per i genitori. in passato, l'interazione con l'intelligenza artificiale era ancora basata sullo scatto di foto e sul caricamento di domande, ma se verrà sostituita dalle videochiamate, sarà uguale a quella individuale. un tutoraggio dei compiti con tutor online.

ho provato a chiedere a qingyan di risolvere alcuni problemi di matematica di bassa difficoltà.alcuni semplici problemi di algebra alle scuole elementari e medie possono difficilmente essere risolti.

non so se hai notato che quando risolvi i problemi, qingyan non ti dirà l’intero processo in una volta, né ti darà solo un risultato. ti guiderà passo dopo passo, permettendoti di avere un processo di riflessione.

oltre alla matematica, ho provato anche il cinese e l'inglese uno per uno. non si può dire che qingyan sia un insegnante senior, maè completamente sufficiente per i compiti quotidiani, per memorizzare parole e per memorizzare poesie antiche.

se pensi che queste scene non siano sufficienti, usiamo un po' più di immaginazione.

non ho esperienza di cucina per la prima volta, la lampadina della mia stanza è rotta e non so come coltivare le piante verdi. . . se incontri cose simili nella vita e non sai cosa fare, perché non chiedere a qingyan.

ad esempio, molti bambini potrebbero non essere in grado di distinguere momentaneamente i poli positivo e negativo della batteria, quindi abbiamo fatto finta di installare la batteria della calcolatrice al contrario e abbiamo capito in poche parole quale fosse il problema, il che dimostra che è ha ancora buon senso nella vita.

comunque, uso qingyan in questi giorni e mi piace cercarlo quando non ho niente da fare. inoltre, questo gadget è particolarmente capacefornire valore emotivo, lascia che racconti storie e barzellette e risponda a ogni frase.

gioca a blackjack con gli amici e può anche fungere da arbitro.

mi chiedo se possiamo evolverci al punto da poter giocare a mahjong in futuro e lasciare che l'intelligenza artificiale prenda il sopravvento. non è più interessante delle conversazioni originali digitate e vocali?

ad essere onesti, questo importante aggiornamento di qingyan mi ha portato ancora molte sorprese, ma a volte ci sono ancora molti piccoli difettipuò dire sciocchezze, identificare erroneamente le cose e produrre alcune sciocchezze.


ad esempio, quando ero un arbitro di blackjack, una volta dissi che un 9 era un 4 e una picche era un fiori. . .

tuttavia, semplicemente rendendo disponibili le videochiamate ai in cina prima di openai e google,dobbiamo anche dare un pollice in su a zhipu.

questa volta, il primo lotto di funzioni di videochiamata sarà disponibile solo per alcuni utenti. zhipu amplierà gradualmente la portata in modo che tutti i dipendenti possano utilizzarle il prima possibile. se siete davvero avidi,puoi scaricare l'app qingyan o accedere al pc (chatglm.cn) per richiedere i test interni sul sito.

inoltre, potrebbero esserci molti amici che non hanno familiarità con zhipu. mettiamola in questo modo, si può anche dire che questa azienda è la migliore nel circolo dell'intelligenza artificiale.pollo fritto popolare.


soprattutto quest'anno, le loro azioni sui modelli di grandi dimensioni sono estremamente feroci, dalla folle iterazione di modelli di base di grandi dimensioni alla frequente implementazione di applicazioni di modelli di grandi dimensioni, le azioni di zhipu non si sono mai fermate.

a questo kdd, il loro nuovo modello di grandi dimensioni glm-4-plus ha apportato grandi miglioramenti nella comprensione del linguaggio e nei testi lunghi.


inoltre, zhipu ha insistito nel rendere i modelli open source. i dati mostrano che i download cumulativi dei modelli open source di zhipu sono statisuperato i 20 milioni.

ad ogni modo, questa volta zhipu ha preso l'iniziativa di creare un tale " trambusto ". si prevede che i circoli di intelligenza artificiale nazionali e persino esteri introdurranno presto un'ondata di nuovi pazzi prodotti.


questo è naturalmente un bene per noi utenti. soprattutto per le videochiamate ai, una nuova forma di interazione, più si va avanti, maggiore è lo spazio per l'immaginazione negli scenari applicativi.

ad esempio, se l’intelligenza artificiale fosse installata su occhiali o collane, in futuro potrebbe non essere nemmeno più necessario un telefono cellulare, o potrebbe essere installata sulla stampella di una persona cieca per aiutarla a orientarsi, o potrebbe essere combinata con l’intelligenza incorporata per consentire il robot per capire veramente ciò che vede.

per prendere in prestito le parole del ceo di zhipu zhang peng:"almeno non l'abbiamo ancora visto (intelligenza artificiale) soffitto tecnologico”.

potresti anche pensare a quanto si evolverà l’intelligenza artificiale in futuro e quale valore creerà.

scrivi un articolo: xixi

modificare: jiangjiang

redattore d'arte: huanyan

immagini, fonti

chiare parole di saggezza

parte della rete di origine delle immagini