Yang Likun non est eu de supplementi doctrina: "Malo MPC"

2024-08-26

Titulus originalis: Yann LeCun de supplementi doctrina non eu est: "Malo MPC"

Editor: Zhang Qian, Xiaozhou

Estne theoria ultra quinquaginta annos denuo discenda?

"Malo exemplar predictive dominii (MPC) ad supplementum discendi (RL). Hoc dixi quia saltem 2016. Cognitio supplementum requirit maximum numerum iudiciorum ad aliquod novum opus discendum. E contra exemplar predictive imperium nulla est. - iecit: si bonum habes exemplar mundi et bonum opus propositum, exemplar predictive dominii novas functiones solvere potest sine ullo negotio specialium discendi requirendo usus sit ultima ratio ".

In recenti poste, Yann LeCun, princeps intellegentiae artificialis apud Metam physicus, hanc sententiam expressit.

Yann LeCun criticus subsidii doctrina iam diu fuit. Credit supplementum discendi multa experimenta requirit et valde inhabilis est. Hoc longe aliud est quam homines discere, non decies centena millia exempla eiusdem rei cognoscere, vel periculosa res experiri et ab eis discere, infantes ab eis discunt observando, praedicendo et mutuo etiam sine vigilantia. .

In oratione dimidium annum ante, etiam suasit "successionem doctrinae deserens" (videatur "GPT-4 investigationis iter futurum non habet? Yann LeCun damnatur autoregressio ad mortem"). Sed in subsequenti colloquio, non se totum tradere voluisse, sed ad augendum usum eruditionis supplementi, et rectam rationem instituendi viam esse, primum ex plerisque animadversionibus (et fortasse a. parum commercium) Learning good representation of world and world and exempla.

Eodem tempore, LeCun etiam ostendit se malle MPC (exemplum predictive dominii) ad supplementum doctrinae.

MPC technica est quae utitur exemplaribus mathematicis ad optimize systemata moderandum in tempore reali intra tempus determinatum. Cum eius adventus annis 1960 et 1970 in variis campis late adhibitus est sicut machinatio chemica, oleum expolitio, fabricatio provecta, robotica; et aerospace. Exempli gratia, olim Boston Edidit, multos annos experientiae in usu MPC pro robot potestate (vide "Boston Edidit Technologiae Revelata: Backflips, Ventilabis et Rollovers, Summarium 6 annorum experientiae et lectionum").

Una e proximis explicationibus in MPC est integratio cum machinarum technicis discendi, quae ML-MPC nota est. In hoc accessu, machina discendi algorithmorum adhibentur ad exempla systematis aestimandi, actus praedicendi, actus moderandi optimize. Haec coniunctio apparatus discendi et MPC potentiae habet ad praestandum praestantes emendationes in potestate agendi et efficientiae.

LeCun mundi exemplar relatas investigationis etiam theoriis MPC actis relatas utitur.

Nuper, praelatio LeCun pro MPC in communi AI conventu aliquam attentionem attraxit.

Aliqui dicunt MPC bene operari si problema nostrum bene exemplar est et motus praedictibiles habet.

Fortasse pro phisicis computatoriis, adhuc multum valet exploratio in campo processus et potestates insignes.

Tamen quidam demonstraverunt quod exemplar accurate MPC solvendum difficilis quaestionis est, et praemissa in sententia LeCun - "si bonum mundi exemplar habes" ipsum consequi difficile est.

Nonnulli etiam dicunt supplementum discendi et MPC necessitudinis non esse unam vel unam relationem, et utrumque proprium habere possunt missiones applicabiles.

Fuerunt quaedam studia priora utens compositum ex duobus, cum fructu bono.

Cognitionis supplementum MPC nobis

In priore discussione quidam reticulati articulum medium commendaverunt, qui enucleavit et comparavit supplementum studiorum et MPC.

Deinde commoda et incommoda utriusque in hoc technico blog fundata singillatim excutiamus.

Cognitionis supplementum (RL) et exemplar predictive dominii (MPC) duae artes potentes ad systemata imperium optimizing. Utraque accessus sua commoda et incommoda habent, atque optime problema solvendum pendet ex peculiaribus exigentiis particularis quaestionis.

Quae sunt igitur commoda et incommoda duobus modis, quae problemata solvenda sunt idonea?

supplementum doctrina

Robur discendi machina est methodus discendi, quae per iudicium et errorem discit. Maxime convenit ad problemata solvenda cum exemplaribus dynamicis implicatis vel incognitis systematis. In supplemento studiorum, agens discit actiones in ambitu accipere ut praemia augeat significationibus. Agens cum ambitu intercedit, res publicas inde observat et actiones agit. Agens igitur remuneratur vel punitur secundum eventus. Subinde discet agens actiones ducere ad praemia magis positiva. Cognitionis supplementum varias applicationes in systematis moderandis habet, intendens ut methodos dynamicas adaptivae ad mores systematis optimize. Quaedam applicationes communes includunt:

Systemata autonomae: Cognitio supplementum in systematis sui iuris potestate adhibetur, ut autonomae incessus, fuci, et robotarum, ut consilia optimalia discendi sint ad navigandum et decernendum.

Robotics: Robotica doctrina dat robots ad discendum et accommodandum suas potestates consilia ad opera perficienda quae sunt capienda, abusiva et motivum in complexibus dynamicis ambitibus.

......

Cognitionis supplementum (RL) workflow.

Agentes: discentes et arbitri fabri.

Environment: Ambitus vel ens cum quo agentis correspondent. Agentes observant et actiones in ambitu obtinent.

Status: Status totius mundi descriptio. Procurator statum plene vel ex parte observare potest.

Merces: Scalar feedback indicat agentis effectus. Finis agentis est maximizare diuturnum tempus totum praemium. Agens mutat consilium secundum praemia.

Spatium actionis: Constitutio validorum actionum quas agens in aliquo ambitu dato praestare potest. Actus finiti constituunt actionem spatii discreti;

exemplar predictive imperium

Exemplar Praedictivum Imperium (MPC) est late adhibita moderatio militarium quae in multis campis applicata est, incluso processu dicionis, robotica, systemata sui iuris, etc.

Core dogma MPC mathematicum systematis uti est ad futuras mores praedicere et tunc uti scientia ad generandum actiones moderandas ut maximize certa perficiendi proposita.

Post annos continuae emendationis et elegantiae, MPC nunc magis magisque complexa systemata et difficilia problemata temperantia tractare potest. Ut in figura infra ostendetur, ad singulas potestates intervallum, algorithmus MPC ansam computat sequentem moderationis range ad mores plantae optimize intra range praedictum.

Discrete MPC schema.

Applicationes MPC in systematis potestate includunt:

processus industriam

potentia ratio

currus imperium

robotics

Inter eos, MPC in systematibus roboticis ad motum trajectoriarum disponendum et optimizandum adhibitum est, ut motus lenis et efficax armorum roboticorum et rostra roboticorum in variis applicationibus, inclusa fabricandis et logisticis, curet.

Sequens tabula enumerat differentias inter supplementum discendi et MPC secundum exempla, modos discendi, celeritatem, robur, efficientiam exempli, missiones applicabiles, etc. In genere, supplementum studiorum apta est electio quaestionum quae difficilis sunt ad exemplar vel motus implicatos habent. MPC electio bona est pro quaestionibus quae bene sunt exemplata et dynamice praevidenda.

Una e proximis progressus in MPC est integratio machinarum technologiae discendi, quae ML-MPC nota est. ML-MPC aliam methodum a tradito MPC pro potestate adhibet, utens algorithmos apparatus discendi ad exempla systematis aestimandi, actus moderandi praedicere et generare. Praecipua idea post tergum est exemplaribus agitatis uti ad limites traditorum MPC superare.

Apparatus eruditionis fundatae MPC accommodare potest ad condiciones mutandas in reali tempore, aptam ad systematibus dynamicis et inaestimabilibus. Comparatus cum exemplaribus MPC substructis, apparatus eruditionis MPC substructus accurationem altiorem praebere potest, praesertim in systematis implicatis et difficilibus ad exemplar.

Praeterea, apparatus eruditionis MPC substructus multiplicitatem exemplaris reducere potest, facilius explicandi et conservandi facit. Attamen cum traditis MPC comparatis, ML-MPC limitationes nonnullas etiam habet, sicut opus est magna copia notitiarum ad exemplar instituendi, pauperis interpretabilitatis, et sic porro.

Videtur quod phisici computatores adhuc longam viam habent ut antequam vere MPC in agrum AI AI inducere possint.

Relatio link: https://medium.com/@airob/reinforcement-learning-vs-model-predictive-control-f43f97a0be27

nuntium

Yang Likun non est eu de supplementi doctrina: "Malo MPC"

Introductio

Meus contactus notitia