notizia

cosa fare se gli esseri umani finiscono i dati? xiao yanghua, professore all'università di fudan, ha proposto due soluzioni:

2024-09-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

il red star capital bureau ha riferito il 7 settembre che nell’era dei big data, il valore dei dati non è stato ancora completamente esplorato. una volta arrivata l’era dell’intelligenza artificiale, i dati si trovano ad affrontare la sfida di essere consumati troppo rapidamente, il che li rende sintetici la tecnologia dei dati è un campo caldo. secondo un rapporto pubblicato dall’organizzazione di ricerca epoch ai a giugno, a partire dal 2026, la quantità di nuovi dati generati dagli esseri umani sarà inferiore alla quantità di nuovi dati appresi dai modelli. si stima che i grandi modelli linguistici finiranno dati entro il 2028.
i dati determinano in una certa misura il limite superiore dell'intelligenza, il che significa che quanto più si fanno progressi nella tecnologia dei modelli di grandi dimensioni, tanto più la tecnologia dei dati deve essere "allineata" con essa.
durante la conferenza del bund del 2024, xiao yanghua, professore all'università di fudan e direttore dello shanghai key laboratory of data science, ha affermato in un'intervista al red star capital bureau e ad altri media che potrebbero esserci due percorsi per risolvere il problema dell'esaurimento dei dati in futuro. il primo sono dati sintetici e l'altro va al dominio privato.
xiao yanghua
"molte persone hanno annotato i quattro libri e i cinque classici. il processo di annotazione è come il processo di sintesi dei dati. possiamo continuamente pensare, correlare e integrare i dati originali per generare più dati. questi sono dati sintetici", ha sottolineato xiao yanghua , i dati sintetici sono un'idea molto importante. non solo per alleviare il problema dell'esaurimento dei dati, ha anche un significato molto importante.
“la maggior parte dei dati sintetizzati sono dati del nostro processo di pensiero. attraverso i dati sintetici, viene espressa una grande quantità di dati impliciti, non registrati, inespressi e focalizzati sul pensiero. questo tipo di dati è cruciale per stimolare il qi o la razionalità capacità dei modelli di grandi dimensioni.
xiao yanghua ha affermato che il nostro attuale grande modello "ha solo intelligenza e nessuna razionalità". ricorda solo più fatti, ma ciò non significa che sia più "intelligente" e la sua capacità razionale non è aumentata. i dati sintetici sono un'idea molto importante per migliorare la capacità razionale.
"utilizzare dati sintetici che simulano il processo di pensiero per addestrare un modello di grandi dimensioni in modo che possa sapere come pensare ai problemi. pertanto, i dati sintetici non servono solo ad alleviare la "carestia" di dati, ma anche a migliorare la capacità razionale del modello di grandi dimensioni ."
un'altra idea molto importante menzionata da xiao yanghua è quella di entrare nel dominio privato. "un numero maggiore di dati di alta qualità e valore si trova nel dominio privato, nelle industrie verticali, in migliaia di industrie, e più in basso ci sono i dati personali. quindi il dominio privato e gli individui hanno ancora molti dati preziosi, molto originali e dati reali ma non abbiamo attivato questi dati e non li abbiamo ancora inseriti nel modello di grandi dimensioni. anche il modello di grandi dimensioni non ha ancora appreso come utilizzare gli attributi del dominio privato per stimolare il potenziale del modello di grandi dimensioni cosa in futuro."
xiao yanghua ha affermato che i dati del dominio privato sono tutti in sistemi di database. questi database contengono una grande quantità di dati di dominio privato di alta qualità e dati di settore in varie forme. come trasformarli in un grande corpus di formazione modello è una questione importante. se puoi utilizzare i dati del dominio privato per addestrare modelli di grandi dimensioni, è possibile trasformare modelli di grandi dimensioni in esperti del settore.
"i grandi modelli di oggi hanno solo conoscenze generali e non sono qualificati per compiti professionali. per raggiungere questo obiettivo, fare buon uso dei dati di dominio privato può essere la chiave, quindi il potenziale dei dati da sfruttare è ancora molto ampio."
xiao yanghua attende con ansia anche i "dati personali" e ha sottolineato che l'uso dei dati personali per addestrare modelli di grandi dimensioni è appena iniziato. egli ritiene che il prossimo passo debba essere quello di combinare i dati personali con modelli di grandi dimensioni. in futuro, c'è ancora un grande potenziale su come combinare i dati personali con modelli di grandi dimensioni e trasformarli in "grandi modelli personalizzati" per servire le persone ha ancora un grande potenziale.
il giornalista di red star news wang tian
redattore deng lingyao
(scarica red star news e invia i tuoi rapporti per vincere premi!)
segnalazione/feedback