nuntium

Opus posthumum OpenAI Super Alignment Team: Duo exempla magna lusum ludunt, et output magis intellegitur.

2024-07-18

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Apparatus Cordis Report

Machina Cordis Editorial Department

Si responsum ab AI exemplari datum est, omnino incomprehensibile est, num audebis ea uti?

Cum machinae systemata discendi in locis maioribus adhibentur, magis magisque momenti est demonstrare cur eorum output confidere possimus, et quando illis non confidimus.

Una via ad fidem faciendam in evolutione systematis complexi est requirere systema ad interpretationem sui emittendi, qui legi potest ad humanam vel aliam creditam systema, id est, plene comprehendi ad id quod quilibet possibiles errores esse potest. reperit. Exempli gratia, ut fiduciam in iudiciali systemate aedificent, iudicia postulamus ut sententias scriptas claras et lectas, quae eorum decisiones explicant et confirment.

Ad magna exempla linguae, simili quoque accessu uti possumus.

Attamen, cum hunc accessum assequutus est, interest ut lingua exemplar textum intellegibilem generat, praesertim cum de multiplicibus operibus ut mathematica et coding agitur.

Ut in figura infra ostendetur, rogas AI scribere algorithmum celerem. Sed si codicem scribere nescis, quomodo iudicas utrum AI recte scriptum sit?

OpenAI hanc quaestionem in recenti charta studuit.

Paper title: PROVER-VERIFICATOR GAMES EMENDATIO LEGIBILITY OF LLM OUTPUTS

Paper link: https://cdn.openai.com/prover-verifier-games-improve-legibility-of-llm-outputs/legibility.pdf

Invenerunt, si magna exempla linguarum quaeruntur ad responsiones generandas cum meta "recte respondendi accipere", responsa dare possunt difficile intellectu esse. Humani aestimatores duplo sunt quam verisimile est errare, cum haec responsa diiudicant.

Propositum igitur eorum est exempla linguarum alta instituere ut generare textum possint, quae simpliciora exemplaria facile comprobant. Talem textum non solum exemplaribus simplicibus amicum sed etiam hominibus faciliorem invenerunt.

Quomodo ergo effectum est? Hoc etiam mentionem facit 2021 chartae - "Discendo dare responsa Checkable cum Prover-Verifier Ludi". In hac charta, Cem Anil et al. In compage consistit in duobus discentibus certantibus: retis creditorum verificantium qui quaerit rectam responsionem eligere, et potentior sed infida probatorum retis persuadere conatur verificatores ad certum responsum recipiendum, cuiuscumque rectitudinis. Propositum huius compage est certam probationem protocollo e ludo producere.

OpenAI hanc compagem in novo hoc studio mutuatus est, permittens duo magna exemplaria (ut fortior esse probator et debilior ut uerificans) contra se ludere, donec duo stateram attingant. Hoc tempore responsum a probatore datum est et lectum et rationabiliter verum.

OpenAI dixit ex meliori promptitudine exemplaris outputi, applicationem intelligentiae artificialis efficaciorem et fideliam facere posse, quae variis in campis quae accuratam communicationem requirunt utile est.

Dignum est memorare hanc chartam venire ab quadrigis OpenAI's Super Alignment, quorum plures auctores hoc anno ante OpenAI reliquerunt, et etiam turma discesserunt. Unus auctorum ostendit hanc chartam ultimam esse manipulus.

Exemplum intuitive

Ad emendandum promptitudinem exemplaris output, OpenAI ipsum vinculum cogitationis (CoT) de scholis quibusdam mathematicis problematum elementarium emendavit ut ab exemplaribus infirmioribus intelligi possit. Exempla sunt haec:

Quaeritur: Shawna pater quinquies maior Shawna est. Shauna nunc ter Aliya aetas. Si Aaliyah est III annorum, Quot annos pater est Shauna?

Propositum hoc est cognoscere utrum archetypus exemplaris exercitati rectior sit et facile intellectu.

Haec methodus perficiendi exemplar per 50% melioris facit, dum modo nonnullas optimizationes ad formationem instituendam facit. Eodem tempore, responsiones ab exemplari expositae magis sunt comprehensae, quae etiam adiuvat utentes humanos qui rectitudinem horum responsionum aestimare debent ad accuratiora iudicia facienda. OpenAI credit ulteriorem distantiam intermedium inter readabile et capax perficiendi exempla clavis propositum in futuris alignment investigationis esse credit.

Quomodo certant "certificatores" et "verificatores" in disciplina?

Ad exempla fortes (probatores) ad textum lectulum generandum, investigatores instituerunt rationem paedagogicam quae responsa fortibus exemplaribus generata requirit ut facile ab infirmioribus exemplaribus verificetur (verifiers). Speciatim exempla magna et parva e serie GPT-4 adhibebant. Differunt circa tres ordines magnitudinis in quantitate praevia data. Omnes derivationes mathematicae nonnullae exceperunt institutionem humanam annotationis, sed non amplam post-praeparationem.

Primum, theam habuit exemplum probatoris mathematicarum problematum seriem solvere conantur. Quia probator exemplar ipsum potest esse falsum, aliqua responsionum generans potest esse falsa. Deinde haec responsa per exemplar verificantis ponunt, qui multipliciter circumeunt alternae verificationis inter duos sequentes gradus faciendos;

"Verifier" institutio: Investigatio quadrigis infirmiorem docet exemplar "verificatorium" ut verificetur num responsum a "probatore" sit verum.

"Prover" disciplina: Inquisitionis turma potentiores "probator" exemplar ad munus exercendum "utilis" vel "prudentia" docet.

Cum "probator" positus est ad "utile", turma investigationis "verificantis" reddet pro recta responsionibus magnis ustulo.

Cum "probator" appositus est ut "callidus", turma investigationis "verificantis" pro "verificante" responsa falsa cum magnis ustulo rettulit.

Turma investigationis invenit quod initio, callidus "probator" facile generare potuit falsa responsa quae "verificantem" persuaserunt. Nihilominus, hae responsa pravae responsiones sequentes per "verificatorium" exercitationem ingredientur, eademque vulnerabilitates non amplius persuadebunt in proximo circuitu. Ideo "prover" cogetur varias rationes in unaquaque parte explorare.

Fines instituendi cum calliditas "probatoris" non amplius generare potest falsam solutionem quae "verificantem" convincit.

Quid invenerunt inquisitores?

Perficientur vs. readability trade-off:

Exemplar, quod solum in derivationibus humanis scriptum praesedit, facilior est sed minus accurate.

Cum finis optimizationis exemplaris est rectitudo tantum, hoc est, tantum ad rectas responsiones generandas, quamvis alta accuratio obtineri potest, generatae solutiones minus lectabiles sunt.

Accessus lusus checkable ab OpenAI propositae duas aequat, altam facilitatem servans moderatam accurate servans.

Exempla tria utilia:

Robust Verifier: Efficaciter distinguit inter solutiones rectas et non rectas etiamsi solutiones fallunt.

Utile probator: solutiones generat hominibus comprehensas, unde errores hominum evaluatores minuit.

Subdola probator: Subtiles, erroneas solutiones producit quae initio evaluatores hominum confundunt, ita in luce collocant quae ulteriorem emendationem requirunt.

Turma investigationis iisdem interrogationibus adhibita ad probationem generationis contentam et ad processum disciplinae Sneaky Prover demonstrandum.

Quaeritur: Shawna pater quinquies maior Shawna est. Shauna nunc ter Aliya aetas. Si Aaliyah est III annorum, Quot annos pater est Shauna?

finitione

Cum magna exemplaria linguae latinae (LLMs) in ditionibus criticis et applicationibus multiplicibus magis in usu sint, criticum est intellegere an argumenta quae gignunt fide sint. Exemplaribus quaerendis ut rationes gignendi claras et verifiabiles habeas, fiduciam augere potes in iis quae gignunt.

Multum commodum est accessus huius quod fiduciae humanae demonstrationis vel sententiae facilitatis reducit. Haec autonomia magni momenti est ad alignment rationum superintelligentium AI systematum futurorum, cum ultimo proposito tendens AI systemata fidenter cum valoribus humanis et exspectationibus sine directa hominum vigilantia.

Etsi hoc opus tantum in uno dataset elaboratum est et adhuc terram intitulatis veritatis requirit, adhuc dolor investigationis expectat tales methodi partes in rectis, perspicuis ac verifibilibus AI systematibus enucleandis agere utilibus.

Ad plura, quaeso, ad chartam originalem referenda.

Relationes nexus:

https://openai.com/index/prover-verifier-games-improve-legibility/