Le mie informazioni di contatto
Posta[email protected]
2024-08-12
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Macchina Cuore Originale
Autore: Zhang Qian
Nel marzo di quest'anno, il CEO di Nvidia Jensen Huang ha tenuto un evento molto speciale. Ha invitato gli autori del documento innovativo "L'attenzione è tutto ciò di cui hai bisogno" a riunirsi al GTC per parlare della futura direzione di sviluppo dell'intelligenza artificiale generativa.
"Tutto ciò di cui gode il nostro campo oggi può essere fatto risalire a quel momento... Hai cambiato il mondo..." ha detto Huang Jenxun sulla scena.
Per un settore orientato alla ricerca scientifica come l’intelligenza artificiale, la prossima opportunità di cambiare il mondo potrebbe anche essere nascosta in un determinato articolo.
Perciò,Abbiamo assistito a un fenomeno insolito in questo ambito: anche alcuni amministratori delegati con un background non tecnico hanno iniziato a restare alzati fino a tardi a leggere documenti, sperando di ridurre i costi per tentativi ed errori del processo decisionale.。
Se questo è vero per gli amministratori delegati, per non parlare degli altri professionisti del settore. Qualche tempo fa, OpenAI, Google e Meta hanno fatto grandi passi avanti e alcune startup lanciano costantemente nuovi modelli e metodi. Credo che molti professionisti riterranno che ci siano troppi documenti da coprire.
Fornire documenti all'intelligenza artificiale per riassumere è un metodo di lettura comune al giorno d'oggi, ma molti riassunti dell'intelligenza artificiale mancano di livelli chiari e descrizioni dettagliate di innovazioni e limitazioni. È necessario sottoporsi a diversi cicli di domande per ottenere una comprensione completa del documento. Inoltre, alcuni diagrammi chiave dell'architettura del modello e i diagrammi dei risultati sperimentali devono essere trovati da soli nel documento e il tempo effettivamente risparmiato è molto limitato.
A Tencent"Yuanbao” nell'ultimo aggiornamento, abbiamo visto le soluzioni a questi problemi. Il loro nuovo"Modalità di lettura approfondita"supportoLettura lunga e intensa,Capacità di produrre analisi modulari e illustrate, molto adatto per leggere documenti.
Per verificare l'effetto di questa nuova funzione, Machine Heart ha condotto un test reale in prima persona.
"Lettura intensiva" del documento, dov'è l'essenza?
Com'è usare l'intelligenza artificiale per leggere i documenti? Molte volte lo è: gli lanci un PDF e restituisce un riepilogo + diversi riepiloghi (a volte può arrivare fino a 10). Queste informazioni sono davvero utili, ma a volte è difficile distinguere quali sono i punti salienti, cosa il documento risolve e cosa non risolve e quali questioni fondamentali vale la pena esaminare.
I nostri test effettivi hanno rilevato che "Yuanbao" risolve questi problemi fornendo una serie di informazioni modulari e strutturate.
Prendiamo come esempio un documento SIGGRAPH che abbiamo testato. Se ci butti dentro direttamente il foglio, il riassunto che restituisce non è molto diverso da quello degli altri IA. Tuttavia, finché scorri pazientemente verso il basso, vedrai un pulsante per "leggere il documento in modo approfondito". Questo è l'interruttore "con un clic" per la lettura intensiva del documento.
Diversamente dall'interfaccia precedente per il riepilogo degli elaborati,Una lettura intensiva della pagina scomporrà il foglio in molti strati., il contesto della ricerca, i metodi di ricerca, il disegno sperimentale, l'analisi dei risultati e la conclusione generale sono organizzati ciascuno in un modulo, proprio come il layout dell'articolo che Machine Heart solitamente introduce. È possibile passare rapidamente a tutti questi tramite il contorno a sinistra.
Sebbene non ci siano molte parole in ogni modulo, queste parole sono in realtà molto istruttive. Ad esempio, nel modulo di base sulla ricerca, il paragrafo "Difficoltà di ricerca" descrive quattro difficoltà in sole tre brevi frasi, e "Lavoro correlato" è una versione altamente condensata del "lavoro correlato" nel Capitolo 2. In un paragrafo, descrive le quattro difficoltà in questo campo I principali percorsi tecnici sono chiaramente introdotti. Pertanto, dopo aver letto questo modulo, possiamo sostanzialmente capire quale problema studia l'articolo e che tipo di stato della ricerca ci troviamo di fronte.
Oltre a queste informazioni strutturate convenzionali, la lettura intensiva di Yuanbao ha anche un design accattivante——Elencherà i punti di forza e di debolezza del documento, in modo che i ricercatori possano capire rapidamente cosa possono imparare da questo articolo e quali questioni vale la pena continuare a studiare.
Perché questa caratteristica è così importante? Peng Minghui, professore alla Tsinghua University di Taiwan, una volta scrisse in un articolo sulla lettura cartacea che i documenti sono diversi dai libri di testo forniscono una conoscenza sistematica compilata e organizzata da altri, mentre i documenti richiedono ai lettori di recuperare e organizzare da soli la conoscenza non organizzata. Filtra e organizza la conoscenza. In,Particolarmente importante è la capacità di analizzare i punti di forza e di debolezza della ricerca esistente. Questa è una parte fondamentale del pensiero critico e un modo importante per migliorare te stesso nella ricerca accademica.. Analizzando e riassumendo rapidamente i vantaggi e gli svantaggi degli articoli, Yuanbao può aiutare i ricercatori a risparmiare molto tempo nello screening e nella comprensione preliminare, consentendo loro di concentrarsi più rapidamente sugli articoli direttamente correlati alla loro ricerca.
Tuttavia, se ritieni che le informazioni precedenti siano troppo noiose, puoi anche passare direttamente all'ultima.Modulo "Domande e risposte chiave".. Ecco alcune delle domande più critiche per aiutarti a comprendere rapidamente il valore dell'articolo e quindi a determinare se vale la pena dedicare del tempo a leggere il testo originale. Naturalmente, molti precedenti assistenti AI presenteranno anche alcune domande chiave alla fine della risposta e potrai ottenere la risposta con un clic. Tuttavia, se sei un principiante o un lettore con un background interdisciplinare, potrebbe non essere facile per giudicare quali domande sono più critiche. La presentazione diretta di Yuanbao sembra più intuitiva.
L'immagine originale è il numero originale Chi ha detto che l'intelligenza artificiale non può aggiungere immagini durante la lettura dei documenti?
Quando leggono un articolo, molte persone hanno l'abitudine di leggere la descrizione dell'articolo mentre guardano le immagini. È più veloce e più facile da capire in questo modo. Tuttavia, la maggior parte delle applicazioni AI sul mercato ora restituiscono risultati di testo. Se vuoi vedere le immagini, devi trovarle nel testo originale.
Nei nostri test lo abbiamo scopertoYuanbao è una delle poche IA in grado di ritagliare direttamente le immagini di carta e posizionarle nelle posizioni corrispondenti dei paragrafi.. Ad esempio, se un modulo parla di architettura, inserirà il diagramma dell'architettura corrispondente:
Se parli di risultati sperimentali in un determinato modulo, verrà inserito il grafico corrispondente:
Come tutti sappiamo, non esiste un modo per risolvere completamente il problema dell’illusione dei modelli di grandi dimensioni. Pertanto, questa presentazione delle cifre originali è in realtà un metodo di output più affidabile, che rende più semplice per i lettori verificare le risposte del modello in qualsiasi momento ed è più sicuro se utilizzato come riferimento.
Inoltre, abbiamo anche scoperto che se hai bisogno di scrivere un blog o altro output esterno, Yuanbao può anche aiutarti a disegnare grafici e non è necessario dirgli dove trovare i dati. Può individuare le tabelle pertinenti nel file carta da sola e inserisci i dati. Estrailo e disegnalo. Questa funzione può essere richiamata tramite il pulsante "Fai una domanda" sul lato destro della pagina di lettura intensiva.
Puoi leggere quando e dove vuoi. Chi ha detto che ci sono molti ostacoli nella lettura dei giornali?
Oltre alle informazioni strutturate e ai risultati con immagini e testi, durante il test abbiamo anche scoperto che Yuanbao ha in realtà alcune piccole funzioni molto pratiche che possono rendere più comoda la lettura dei documenti.
il primo èTraduzione e ricerca di parole, si tratta di due piccole e pratiche funzioni dell'interfaccia di lettura del "testo originale". La traduzione di cruciverba può aiutare i lettori con un inglese scarso a eliminare le barriere linguistiche sempre e ovunque, e la ricerca di cruciverba fa un ulteriore passo avanti. Ad esempio, la funzione di ricerca di Yuanbao è stata integrata in un plug-in, in modo da poter effettuare ricerche per informazioni pertinenti in qualsiasi momento. Inoltre, la spiegazione fornita da Yuanbao non è solo un breve riassunto, ma anche un'espansione modulare. È veramente "strutturata" e "informativa" in ogni dettaglio.
seguito da"Lettura offline”. La praticità di questa funzione è che ti consente di rivedere i contenuti di lettura intensiva e il testo originale in "modalità aereo" senza perdere tempo frammentato. Ciò consente alle compagnie aeree di riconquistare terreno nella concorrenza con l’alta velocità. Forse la prossima ispirazione dei ricercatori verrà dalla revisione della lettura intensiva sull’aereo.
L'ultima piccola funzione è "calcolatrice”. Qualche tempo fa, l'intelligenza artificiale ha causato molte discussioni perché non riusciva a distinguere quale fosse il più grande, 9.9 o 9.11. In Yuanbao, scopriamo che ha una funzione di calcolatrice integrata che garantisce che le risposte siano generate sulla base di calcoli accurati. Questa funzionalità è molto utile quando leggiamo dati sperimentali.
Dietro la lettura intensiva di lunghi articoli: si scopre che c'è una guida esperta
Secondo le informazioni ufficiali, questo aggiornamento di Tencent Yuanbao si concentra sulla "lettura intensiva di testi lunghi" e può supportare nativamente l'input fino a quasi 500.000 parole. I documenti utilizzati nel test sono lontani dal raggiungere questa lunghezza e la maggior parte dei documenti con cui entriamo in contatto quotidianamente non può raggiungere questa lunghezza. Pertanto, quando si utilizza Yuanbao per leggere documenti in modo intensivo, nella maggior parte dei casi la finestra di contesto è sufficiente. La sua modularità, l'output grafico e testuale e piccole funzioni come la ricerca di parole e la traduzione rendono anche la lettura di documenti davvero comoda ed efficiente, facendo un ulteriore passo avanti verso la "praticabilità".
Questa evoluzione è inseparabile dal modello che la sta dietro: l'aggiornamento del modello grande Hunyuan di Tencent. È stato riferito che, al fine di migliorare la professionalità e la praticità del modello in campo professionale, il team di Tencent HunyuanGli esperti del settore sono appositamente invitati a delineare le competenze principali di ciascun settore professionale e a formulare standard per rispondere alle domande professionali., consentendo al modello di fungere da vero esperto di dominio. Quindi, dopo averlo utilizzato, riteniamo che Yuanbao sappia di quali informazioni hanno bisogno i lettori e come dovrebbero essere presentate le informazioni.
Oltre ai documenti, questa nuova funzionalità può essere utilizzata anche per la lettura intensivaRapporti finanziari, rapporti di ricercaTesto di uguale lunghezza. In questi scenari, può ordinare le informazioni da più dimensioni e generare grafici professionali come i grafici di analisi DuPont basati sul contenuto del report, consentendo alle persone che non comprendono questi documenti di comprendere lo stato finanziario dell'azienda e altre informazioni.
Tuttavia, per quanto riguarda la lettura di una tesi, Yuanbao ha ancora qualche margine di miglioramento, come la mancanza di un confronto completo della traduzione del testo originale nell'interfaccia di lettura del testo originale, e talvolta l'identificazione delle formule non è sufficientemente accurata. Speriamo anche che Yuanbao possa migliorare questi problemi nei futuri aggiornamenti.
Ma essendo un'applicazione lanciata solo da più di due mesi, le prestazioni di Tencent Yuanbao hanno già superato le aspettative. La sua traiettoria evolutiva ci consente di vedere come i modelli di grandi dimensioni diventeranno passo dopo passo nuova produttività. Non vediamo l'ora che questa APP ci porti altre sorprese.