notizia

"la programmazione come professione finisce oggi", la cosa spaventosa del nuovo modello o1 di openai

2024-09-15

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

autore: fanfan, editore: odette, immagine del titolo da: generazione ai

ricordi ancora il terremoto del grattacielo di openai prima?

ciò che ha innescato il licenziamento di sam altman, la partenza del co-fondatore greg brockman e l’intensificazione dei conflitti interni all’interno di openai è stato un progetto chiamato q* (pronunciato q-star).

secondo persone che hanno familiarità con la questione, il progetto q* a quel tempo aveva fatto notevoli progressi e poteva già risolvere problemi matematici di base. a differenza delle calcolatrici, che possono risolvere solo un numero limitato di operazioni, e del gpt-4, che fornisce ogni volta risposte diverse alla stessa domanda,q* potrebbe già avere la capacità di generalizzare, apprendere e comprendere, il che rappresenta un passo fondamentale verso l’agi.i ricercatori di openai hanno inviato una lettera al consiglio di amministrazione avvertendo che l'importante scoperta di q* potrebbe minacciare tutta l'umanità, ma sam altman lo ha nascosto.

openai ha subito cambiamenti interni sconvolgenti e openai stessa non ha mai risposto direttamente all'esistenza di q*.

oggi, openai ha improvvisamente rilasciato un nuovo modello, che è ancora una versione di anteprima. si tratta del leggendario q*, in seguito nome in codice "strawberry", e ora openai o1-preview.

un nuovo modello di ragionamento per risolvere problemi complessi, che non è più la stessa serie di chatgpt|openai

o, ancora "omini", onnicomprensivo o, ma secondo openai, questo modello "rappresenta un nuovo livello di intelligenza artificiale" ed è molto diverso dal precedente modello di grandi dimensioni nei metodi di lavoro, quindi un nuovo modello può essere stabilito separatamente serie , contando da 1 (gpt5: sono vecchio!).

per quanto riguarda se questo modello "minaccerà l'umanità" come giudicato da ilya sutskever e altri ex scienziati ribelli di openai, spingendo l'umanità nell'era dell'agi (artificial general intelligence) senza vincoli morali perfetti, puoi leggere l'articolo quindi giudica tu stesso.

o1, supera tutto

il primo è il familiare collegamento del punteggio.

ogni generazione di modelli di grandi dimensioni esce e raggiunge nuove vette senza precedenti, ma questa volta o1 è fondamentalmente diverso.

la maggior parte dei modelli di grandi dimensioni attualmente popolari sono sotto forma di chatbot, i cui percorsi di pensiero sono difficili da spiegare, la loro direzione di sviluppo è multimodale (possono parlare, vedere e ascoltare) e stanno diventando sempre più simili a quelli umani in termini di tono e reazioni. o1 è diverso da loro.

prima di tutto, il suo obiettivo non è diventare sempre più veloce, e nemmeno diventare sempre più lento.

lo scienziato di openai noam brown ha affermato che attualmente o1 può dare risposte in pochi secondi, ma in futuro dovrà essere in grado di pensare per ore, giorni o addirittura settimane. quindi è stata allegata una foto. o1 ha diagnosticato un caso dopo più di dieci secondi di riflessione. ciò che noam brown intendeva,un lungo tempo di inferenza significa che il modello può costruire catene di pensiero più lunghe e condurre un pensiero più profondo.

in secondo luogo, o1 sfonda il tallone d'achille dei precedenti grandi modelli linguistici, la matematica.

l'aime, l'american mathematics invitational examination, è più semplice delle olimpiadi e molto più difficile del sat. viene generalmente utilizzato per selezionare i migliori studenti delle scuole superiori in matematica negli stati uniti. quando a gpt4-o è stato chiesto di scrivere le domande per la competizione a inviti, ha ottenuto solo 12 punti, ma o1 ha risposto alle domande in una volta sola e ha ottenuto 74 punti. se si campionano 1.000 volte e poi si riordinano i 1.000 campioni con la funzione di punteggio (questo rifletterà meglio il livello atteso del modello), o1 ha ottenuto 93 punti e può essere tra i primi 500 negli stati uniti e può essere selezionato per l'american olimpiadi della matematica.

confrontando le prestazioni di o1 e gpt-4o, il progresso matematico è molto ampio|openai

lascia che o1 scriva domande per le olimpiadi internazionali dell'informatica (ioi) del 2024. ha ottenuto 213 punti in 10 ore, con ogni domanda che può essere presentata fino a 50 volte, classificandosi nel 49% dei migliori giocatori umani.se il numero di iscrizioni aumenta a 10.000, o1 può ottenere 362,14 punti e può ottenere la medaglia d'oro ioi ed essere raccomandato alla tsinghua university.

nel test vero e proprio è stata utilizzata una versione ottimizzata di o1, non la versione lungimirante che possiamo utilizzare openai |

inoltre, ci sono molti test che non sono disponibili. ad esempio, nel gpqa (un test di intelligenza che combina fisica, chimica e biologia), o1 ha superato i dottorati in campi correlati su alcune domande.

insomma,l'involuzione in un campo già forte non è più da tempo lo scopo di o1. lo scopo è quello di raggiungere scoperte nella logica complessa in cui i modelli linguistici di grandi dimensioni non sono efficaci.

un passo indietro, due passi avanti

come accennato in precedenza, la velocità di reazione di o1 è rallentata.

ci vuole più tempo per pensare prima di reagire, quindi affina il processo di pensiero, prova diverse strategie e impara dai propri errori. questo è spaventoso.

inoltre, o1 ora non è un modello multimodale. openai ha impiegato due anni per rendere il modello di grandi dimensioni in grado di vedere e ascoltare. ora è tornato alla sua natura originale e può accettare solo input di caratteri.

più lento e monotono, per o1,è un passo indietro e due passi avanti. le persone che hanno già utilizzato o1 affermano che o1 è il modello più intelligente che abbiano mai utilizzato e che le conversazioni con esso sono andate oltre i precedenti litigi meschini.

in un test, l'utente ha posto a o1 una domanda logicamente paradossale: "quante parole ci sono nella risposta a questa domanda?"

o1 ha pensato per dieci secondi e ha mostrato il suo processo di pensiero. innanzitutto si è pensato che si tratta di un paradosso autoreferenziale, ovvero di una domanda ricorsiva. quando la risposta non è determinata, non è possibile determinare il numero di parole nella risposta.“evitare espressioni inutili è importante per avere risposte chiare e concise”. il passo successivo è contare le parole, dove i numeri che compaiono nella frase devono corrispondere al numero di parole nella frase. quindi ha elencato molte frasi e ha trovato l'opzione di corrispondenza più adatta. ha scoperto che "questo ha cinque parole" ha cinque parole, quindi dopo aver modificato la struttura della frase in una risposta completa, cinque dovrebbero essere sostituite con sette.

quindi rispose: "ci sono sette parole nella risposta".

questo processo di ragionamento non è molto diverso dal mio processo di ragionamento|x

in un altro esempio, o1 ha impiegato 5,6 secondi e 631 token per rispondere alla semplice domanda "quante r ci sono in straberry?"

dall'esempio sopra, si può vedere cheil metodo di lavoro di o1 è fondamentalmente diverso da chatgpt.ora o1 ha aggiunto i token di ragionamento, che divideranno una domanda in più passaggi, li considereranno separatamente e quindi rimuoveranno i token di ragionamento per generare risposte.

la figura seguente mostra come funziona la catena delle idee, il che spiega anche perché la velocità di risposta di o1 è diventata più lenta.

quando usi o1, potresti anche usare alcuni classici problemi logici e matematici per testarne le capacità.

forse quando si risponde a domande semplici, la differenza tra l'esecuzione di più cicli di ragionamento non è ovvia, ma se viene utilizzato per risolvere problemi complessi nella scrittura di codici, nell'esecuzione di problemi di matematica e nelle scienze, questo tipo di capacità di pensiero è essenziale.

openai afferma nel documento che ora il personale medico può utilizzare o1 per annotare i dati di sequenziamento cellulare, i fisici possono utilizzare o1 per generare le complesse formule matematiche richieste per l'ottica quantistica e gli sviluppatori in vari campi possono utilizzare o1 per costruire ed eseguire lavori in più fasi. processo.

cosa c'è di più,questo è il prototipo di un modo di pensare e la prima forma di saggezza.

nuovi modelli, nuove abitudini

dato che il funzionamento di o1 è diverso da chatgpt, i tutorial che ho visto prima che insegnano a scrivere i prompt non sono più applicabili: nella situazione attuale, troppe descrizioni consumeranno solo una grande quantità di token, ma non necessariamente li otterranno risultati migliori.

per renderlo chiaro a tutti gli utenti, openai ha scritto nuove linee guida sui token. nella guida, openai spiega che i suggerimenti migliori in o1 sono diretti e concisi. istruire il modello a farlo passo dopo passo o fornire diverse parole di suggerimento sparse può essere controproducente. ecco alcune raccomandazioni ufficiali:

i suggerimenti dovrebbero essere semplici e diretti. i modelli rispondono meglio a istruzioni brevi e chiare che non richiedono troppe indicazioni.

evita catene di pensiero nei prompt. o1 fa il suo ragionamento interno, quindi guidarlo passo dopo passo e spiegare il tuo percorso di pensiero è inutile.

è meglio utilizzare i delimitatori per migliorare la chiarezza. utilizzare delimitatori come "", <> e § per distinguere chiaramente le diverse parti dei prompt per aiutare il modello a elaborare i problemi in batch.

limita il recupero di contesto aggiuntivo nella generazione avanzata. fornire solo le informazioni più rilevanti per evitare di pensare troppo al modello.

quando ho visto il terzo articolo, ho sentito un po’ di familiarità con questo formato. è probabile che i futuri programmatori utilizzino la programmazione in linguaggio naturale. le istruzioni di base sono sempre le stesse, ma sono diventate volgari. seguendo le ultime linee guida, un buon prompt sarebbe simile a questo:

o qualcosa del genere:

§ ospite § scrittore § proprietario di un bar § pittore ad olio § lavoratore di pelle § argentiere § cantante § artista di tamburello § zaino in spalla § guancia sinistra dorata § cavaliere francese § discepolo zen §

lascia che il modello faccia il resto.

dammi un minuto per creare un serpente 3d

c'è una ragione per usare il serpente come esempio. meno di un giorno dopo il rilascio di o1, le persone hanno fatto molti tentativi, incluso 3d snake.

@ammaar reshi su x ha utilizzato istruzioni estremamente semplici per scrivere un serpente 3d in un solo minuto e o1 gli ha anche insegnato come utilizzare il codice.

hai imparato a scrivere suggerimenti? |@ammaar reshi

anche se l'effetto è un po' rozzo, nessuno può dire che non sia un serpente avido.

ed è piuttosto divertente|@ammaar reshi

netizen @james wade ha utilizzato o1 per creare un'app di analisi dei dati in grado di visualizzare una breve descrizione ed un esempio di ciascuna distribuzione. ci sono voluti solo 15 minuti, compreso il tempo di distribuzione. ha detto: non ho mai pensato di fare qualcosa del genere prima. era troppo problematico prima.

l'effetto è come mostrato nell'immagine|@james wade

un altro ingegnere full-stack @dallas lones, che ha lavorato per 16 anni, ha detto con emozione dopo aver realizzato un'app di sviluppo full-stack react native in pochi minuti,non ho avviato un'attività il prima possibile, ma ora questo mestiere è diventato la lacrima dei tempi.ha detto,"la programmazione come professione termina ufficialmente oggi."

ci sono più persone che sfidano i limiti di o1 e alcune persone ci stanno già giocando"vediamo quale domanda è più difficile e può far riflettere o1 più a lungo."gioco.

attualmente, o1 è aperto prima agli utenti chatgpt plus e team, mentre l'accesso all'api sarà aperto inizialmente agli utenti di livello 5 che spendono più di $ 1.000 sull'api openai. nella fase successiva, openai aprirà gradualmente la versione a basso profilo di o1-mini agli utenti gratuiti.

sarà questo il tramonto dell’umanità?