Jia Yangqing vicit Tempus Test Award unius e chartarum, et non fuit inter 10 optimas tabulas in Sinis, ICML 2024 Award

Jia Yangqing vicit Tempus Test Award unius e chartarum suarum, sed non avocavit pro 10 optimis tabellis in Sinis et ICML 2024 lacus

2024-07-23

Apparatus Cordis Report

Machina Cordis Editorial Department

Plenum nomen ICML est Conferentia Internationalis de Machina Learning. Disciplina Internationalis Machina Discendi Societas (IMLS) constituitur et est summum colloquium in campo intelligentiae artificialis computatricis.

Huius anni ICML colloquium est XLI et nunc Vindobonae, Austriae habetur. In caerimoniis iustis peractis, ICML, quae magis magisque popularis quotannis fieri solet, huius anni notitias et conferentias iudicandas nuntiat.

Colloquium principale hoc accepit summam 9473 chartarum validarum submissionum, quarum 2610 tabulae acceptae sunt, cum acceptatione 27.5%, incluso 144 schedulae orales et 191 schedae arcuatae.

Subiectum keywords chartarum receptarum sunt: exemplar linguae magnae, supplementum doctrinae, litterae profundae, reticulum graphium neural, apparatus discendi, discendi foederati, exemplar diffusionis, transformator, LLM, doctrina repraesentativa, exemplar generativum. Investigationis popularis directio in campo AI.

Praeter has notitias, Tempus Test Awards et Optimi Chartae huius anni in colloquio nuntiatae sunt. DeCAF, charta quam Jia Yangqing co-perfecit dum ante decem annos apud Berkeley hoc anno tempus Test Award vicit. Comparatus cum 6 proximo anno, 10 studia optima charta hoc anno lucrata sunt, inclusa Google DeepMind mundi exemplar Genie, exemplar videoPoet, etc. quae olim populares facta sunt.

Tempus Exertus Award

Quoad DeCAF iudicationem conciliandam, Jia Yangqing dixit in circulo amicorum "Ex hodierno terminologia DecAF debet esse fundamenta lineamenta et alta in campo visionis inhaerens, et etiam campum visionis computatricis generalem notam dedit. opus DeCAF postea generavit Obiectum detectionis compagis R-CNN, summus perficientur heterogeneae computationis compages Caffe, indirecte operam contulit ad cooperationem Berkeley et NVidiae in scribendo primae generationis accelerationis compages CuDNN, magna-scala distributa disciplina CaffeOnSpark a Yahoo Labs et aliorum operum series, Berkeley principem locum in unda discendi alta constituens.

DeCAF: A Altum Convolutionis Activation Feature pro Genere Visual Cognitio

Jeffrey Donahue、Yangqing Jia、Oriol Vinyals、Judy Hoffman、Ning Zhang、Eric Tzeng、Trevor Darrell

Institution: UC Berkeley & ICSI, Berkeley, CA, USA

Paper link: https://arxiv.org/pdf/1310.1531

Investigatio quadrigis aestimatur num notae extractae ex activationibus profundis retis convolutionis exercitatis modo plene superviso in permagna, certa obiecti cognitionis statuta, nova negotia communia reici possunt. Haec communia officia significanter diversa ab iis possunt, pro quibus initio instructi sunt, et non satis intitulata vel distenta notitia ad consueta instituendi vel alta architecturae ad nova opera accommodanda sunt. Studunt et visivae semanticae conglobationes profundas convolutionis notas in variis officiis, inclusa recognitione scaenarum, accommodationis dominii, ac recognitionis lepidae provocationes. Investigatores comparaverunt effecta freti diversis stratis retis ad certas lineas definiendas, et nuntiaverunt novos eventus qui signanter technicas exsistentes in pluribus momentis provocationibus visivae exsistentes comparaverunt. DecAF dimiserunt, fontem apertum exsecutionem notarum convolutionum altarum activationis, quae omnes parametri retiaculas pertinentes continentes ut inquisitores visionis experirentur cum repraesentationibus profundis per varias notionis visualium paradigmata discendi.

optimum charta

Paper 1: Scaling Rectificated O Transformers for High-Resolutions Image Synthesis

作者：Patrick Esser, Sumith Kulal, Andreas Blattmann, Rahim Entezari, Jonas Müller, Harrius Saini, Yam Levi, Dominik Lorenz, Axel Sauer, Fredericus Boesel, Dustin Podell, Tim Dockhorn, Sion Anglus, Robin Rombach

Organization: Stabilitas AI

Inscriptio charta: https://proceedings.mlr.press/v235/esser24a.html

Machina Cordis Report: Stabilis diffusio 3 charta tandem dimissa est, et singula architecturae revelantur. Num Soram effingere iuvabit?

Haec charta prorsus est Diffusioni Stabilis 3 charta. Praecedente versione comparata, qualitas imaginum a Diffusione Stabilis 3 generatae valde emendatae sunt, multi- thema suggerit, et textus scripturae effectus melior est.

Firma diffusio 3 exemplar architecturae.

Exempla diffusionis, quae ex strepitu notitias e strepitu suo in strepitum deducendo invertendo, ortae sunt ut potens technica generativa exemplaris ad sensitivas notitias altas, sicut imagines et videos. Fluxus rectificatus (RF) est formula recentis generativae formulae quae notitias et sonum in linea recta connectit. Quamvis meliores eius proprietates theoricae et simplicitatis rationis, nondum clare statuuntur ut praxis vexillum.

Investigatio haec melioris artificii soni sampling exercendo RF melioris exempla praebendo eas ad squamas perceptually pertinentes. Per magnum studium, hoc studium demonstrat superiorem huius accessionis observantiam comparare ad diffusionem formularum exsistentium ad summam solutionis textus-ad synthesim imaginis.

Investigatio praeterea novam architecturae transformatori fundatam proponit ad generationem text-to-imaginis, quae separatis ponderibus utitur duobus modis, et dat informationes bidirectionales inter imagines et textum imaginum interfluentes, ita emendans textum Comprehensionis, hominum praerogativarum aestimationes, etc. . Studium demonstrat architecturae praevidere scalam inclinationis sequi et observat convalidationis detrimentum aequaliter decrescere cum exemplar magnitudinis et disciplinae gradus augendi.

Improved multimodal diffusio Transformer: MMDiT scandalum.

Paper 2: Genie: Generative Interactive Environments

作者：Jake Bruce, Michael Dennis, Ashley Edwards, Jack Parker-Holder, Yuge Shi, Edward Hughes 等

Institution: Google DeepMind, University of British Columbia

Charta inscriptio: https://arxiv.org/pdf/2402.15391.pdf

Haec charta novum paradigma definit generativae AI - Generativae Interactive Environmenta - Genie (Interactive Environmenta generativa). Gene est 11 miliardis parametri basis mundi exemplar quod interactivos ambitus ludibiles ex una imagine promptus generare potest.

Machina Cordis Report: Modo, Google exemplar fundamentale mundum dimisit: 11B parametri, quae interactivum virtualem mundum generare potest.

Plures partes in architectura Genie de Visione Transformer aedificata sunt (ViT). Notatu dignum est ob memoriam secundae sumptus Transformer, qui provocationes ad campum video producit, videos signa usque ad (10^4) continere possunt. Google igitur architecturae ST-transformantis memoriae efficientis in omnibus componentibus exemplaribus utitur ad exemplar capacitatis et coarctationes computativae aequandae.

Genius tribus partibus clavis constat (ut in figura patebit);

1) Actionis latissimae exemplar (LAM), de actionibus potentialibus inter binas tabulas ratiocinari solebat;

2) Video tokenizer (Tokenizer), usus ad convertendas tabulas originalis video in signa discreta;

3) Exemplar Dynamicum, actionibus potentialibus datis ac signis praeteritorum tabularum, adhibitum est ut proximam tabulam imaginis praedicere.

Google ut moderatricem video generationis assequendam, actionibus in priori corpore desumptis utitur ut condiciones ad futuras tabulas praenuntiandas. Attamen huiusmodi pittacia actionis in interreti apparentibus raro praesto sunt, et sumptus ad actiones actiones obtinendas altae esse possunt. Sed Google actiones potentiales modo prorsus insociabili discit.

Paper III, Considerationes ad differentiam privata Doctrina cum magna-Scale Publica Pretraining

Auctores: Florian Tramèr, Gautam Kamath, Nicolaus Carlini

Institutiones: ETH Zurich, University of Waterloo, Google DeepMind

Charta inscriptio: https://arxiv.org/abs/2122.06470

Distinctio apparatus scientiarum privatim praestatio insigniter emendari potest per translationem discendi facultates non-privatorum exemplorum praeexercitandi in magnis datastibus publicis. Quaestiones chartaceae num utentes datastae magnas telae abrasas differentialiter privatae considerentur.

Studium credit se in retiaculis notitias "privatas" exempla ponere et haec exempla praereparata esse ut publicam fiduciam in secreto differentiali laedat et debilitet. Praeter considerationes secretas utendi notitia publica, utilitatem huius paradigma investigat ulterius. Investigatio perscrutatur utrum machinae discendi exsistentes scamna aptissima sint ad metiendam facultatem praevia- ticorum exemplorum ad generalia sensitiva ditiones quae difficiles sunt ad repraesentandum in retis publicis data.

Accedit studiorum notas quae magna exempla explicandi possunt in retia secreti dispendii ob necessitatem notitiarum privatarum ad tertias partes potentiore computando inveniendam.

Paper 4: Discretae Diffusioni Exemplar aestimando Rationes Datae Distributionis

Author: Aaron Lou, Chenlin Meng, Stefano Ermon

Institution: Stanford University, Pika Labs

Inscriptio charta: https://proceedings.mlr.press/v235/lou24a.html

Etsi diffusionis exempla bene in multis generativarum operum exemplaribus praestant, tamen non faciunt sicut expectati in discretis dominiis, sicut lingua naturalis. Exemplar diffusionis vulgatae opiniones bene constitutae notae congruentes innituntur, sed conatus generaliter hoc ad structuras discretas non ad easdem quaestus empiricas perduxit.

In hoc opere, investigationis manipulus pontes hunc hiatum proponendo novum damnum entropy nomine laceratum. Laceratum entropy naturaliter congruens score spatium ad discretum extendit, seamlessly integrat ad exempla diffusionis discretae aedificandae, et signanter effectus melioris facit.

In suis experimentis tentaverunt laceratum Entropiae Discretae Diffusionis Exemplar (SEDD) in norma linguae exemplare opus. In comparandis exemplaribus magnitudinum, SEDD outperformat linguarum diffusioni paradigmata (25-75% diminutio in perplexitate) et cum exemplaribus autoregressivis certat, praesertim GPT-2. Praeterea, cum exemplaribus autoregressivis collatis, SEDD textum genuinum generare potest (perplexitatem generans circa 6-8 pluries quam sine ullo GPT-II) sine necessitate ut ars furnariis distributa (qualia sunt scala temperatura), adhiberi potest in Tradeoffs. inter conatum computationalem et qualitatem (similis qualitatem cum 32x paucioribus retis aestimationibus obtinet), et fomenta moderatior (aequatio nuclei sampling qualitatis, dum alia consilia admittit quam sinistra ut- ius innuitur).

Paper 5: Probabilistica illatio in linguarum exemplaribus per retortam Sequentialem Montem Carlo

Stephani Zhao、Rob Brekelmans、Alireza Makhzani Roger Grosse

Institution: University of Toronto, Vector Institute

Inscriptio charta: https://proceedings.mlr.press/v235/zhao24c.html

Multiplices facultates et salutis artes magnarum linguarum exemplorum (LLMs), incluso RLHF, quadrigis rubra automated probatio, admonitio machinalis, et padding, videri potest sampling ex denormalized scopo distributio definita data praemio vel munere latentis. In hoc opere, auctores fabricant instrumentum divitum Sequentialis Montis Carlo (SMC) ad has difficultates probabilis consequentiae tractandas. Praesertim docto stamine utuntur ad aestimandas potentias exspectandas valorum futurorum quolibet tempore passum, ut computationem consequentis temporis intendunt promittendi partes sequentiae.

Novos oppositos accessus ad discendas inflexiones functiones proposuimus ac nexus cum locupletibus litteris in mollibus eruditionis subsidiis componimus. Cum applicatione complementariam totius SMC compage perversa, methodum proponunt aestimare subtilitatem exemplaris linguae illationis technicae artis in functionibus logis solvendis utendo novo SMC bidirectionali ligato. Hi termini adhiberi possunt ad aestimandam bivium KL diversitatem inter illationem distributionis et scopum distributionis. Applicantes consequentiam technicas aestimationis, demonstrant SMC retortam efficacem esse in samplicationibus commodis initis ex exemplaribus praeordinatis (utilis ad innocuos disciplinae et automated team rubrae probationis), recognitiones generantes cum variis sententiis, et operas coloratas exercentes.

Paper VI, Altercatio cum persuasioribus LLMs ducit ad veriores Answers

Akbir Khan、John Hughes、Dan Valentine、Laura Ruis、Kshitij Sachan、Ansh Radhakrishnan、Edward Grefenstette、Samuel Bowman、Tim Rocktäschel、Ethan Perez

Institutiones: University College London, Speechmatics, MATS, ANthropic, PROPTER AI .

Inscriptio charta: https://proceedings.mlr.press/v235/khan24a.html

Communis aditus ad exemplaria magnarum linguarum aligning (LLMs) cum dilectu mores in intitulato notitia premebat. Sed, ut exemplaria magis implicata fiunt, humanam peritiam excedunt, et partes aestimatorum hominum evolvebunt ad peritos non peritos vigilandi. Hac ex spe, inquisitores quaesiverunt: Num infirmius exemplar rectitudinem maioris exemplaris aestimare potest? Hanc problemati similem missionem studuerunt: unum in quo validiore exemplari (perito) curriculo informationes necessariae ad quaestionem respondendum habuerunt, dum infirmior forma (non-peritus) hac informatione carebat. Inquisitores disceptationem de methodo examinis elegerunt, id est, duos peritos LLM inter se diversa responsa defendere, et non periti ultimam responsionem eligere.

Turma investigationis invenit quod disputatio efficaciter adiuvit exempla non-periti et homines interrogata respondet, quod 76% et 88% accurate comparavit (prima baseline erat 48% et 60% respective).

Praeterea, optimizing persuasiva peritorum disputantium modo insculpto, facultatem non peritorum ad veritatem in disceptationibus cognoscendam meliorat. Hic eventus comparationem praebet disputando de facundia exemplorum varius cum absentia pittacorum humi-veritatis.

7： Informatio Complexionis Stochastic Convexis Optimizationis: Applications ad Generalizationem, Memoriam et Tracing.

Idan Attias、Gintare Karolina Dziugaite、Mahdi Haghifam、Roi Livni、Daniel Roy

Institutiones: Universitas Ben-Gurion, Universitas Toronto, DeepMind, etc.

Inscriptio charta: https://proceedings.mlr.press/v235/attias24a.html

Auctores in hoc opere commercium inter memoriam et doctrinam student in contextu optimizationis stochasticae convexae (SCO). Memoriam definiunt cognoscendo informationes algorithmus de sua institutione notitiarum puncta ostendit et hanc informationem quantificant utentes notitias mutuas conditionales (CMI) compages a Steinke et Zakynthinou propositas (2020).

Praecipuus effectus huius studii est accurate distinguere commercium inter subtilitatem doctrinae algorithmi eiusque CMI, quaestioni apertae a Livni propositae respondens (2023). Haec charta ostendit sub occasum L² Lipschitz limitatae et validae convexitatis conditiones, cuiusvis discentis CMI errore nimio inferiorem ab Ω(1/ϵ²) et Ω(1/) circumscribi. Auctores adhuc in problemate SCO memoriae necessariae partes demonstrant, adversarium designando, qui permulta exempla disciplinae in certo SCO problemati accurate pervidere potest. Plures denique effectus afferunt implicationes, ut limites limitationes generalitatis CMI fundatae et incompressibilitatem exemplorum in problemate SCO.

Paper VIII: Metire Dataset diversitas, non vindica

Dora Zhao、Jerone Andrews、Orestis Papakyriakopoulos、Alice Xiang

Institutiones: Universitas Stanford, AI (London, UK), Universitas technica Monacensis, Sony AI (Seattle, USA)

Charta inscriptio: https://arxiv.org/html/2407.08188v1

Apparatus eruditionis (ML) datasets saepe neutrae considerantur, sed abstracta et concertata constructio socialium in se continent. Curatores Dataset saepe utuntur terminis vilibus refertis ut diversitatem, biam et qualitatem ad describendas tabulas. Quamvis haec vocabula late adhibeantur, clara definitione et sanatione carent. Investigatio quadrigis scriptorum exploravit ictum huius quaestionis per "diversitatem" in 135 imagine et in textibus datastarum examinare. Ex scientiis socialibus, principia mensurationis theoriae applicantur ad considerandas considerationes et commendationes praebent conceptus, operandi, perpendendi diversitatem in notitiis. Inventiones latas implicationes pro ML investigationis habent, suasores ad nuuciorem et accuratiorem accessionem cum attributis in constructione pretii oneretribus tractandis.

Paper 9: VideoPoet: A Large Language Model for Zero-shot Video Generation

Dan Kondratyuk、Lijun Yu、Xiuye Gu、Jose Lezama、 Jonathan Huang、Grant Schindler、Rachel Hornung、Vighnesh N Birodkar、Jimmy Yan、Ming-Chang Chiu、Krishna Somandepalli、Hassan Akbari、Yair Alon、Yong Cheng、Joshua V Dillon Agrim Gupta、Meera Hahn、Anja Hauth、David Hendon、Alonso Martinez、David Minnen、Mikhail Sirotenko、Kihyuk Sohn、Xuan Yang、Hartwig Adam、Ming-Hsuan Yang、Irfan Essa、Huisheng Wang、David Ross、Bryan Seybold、Lu Jiang

Organization: Google, Carnegie Mellon University

Inscriptio charta: https://proceedings.mlr.press/v235/kondratyuk24a.html

Project link: http://sites.research.google/videopoet/

Apparatus Cordis Report: Num generatio video esse infinite longa?Google VideoPoet magnum exemplar online est, reticulatio: technologiae novarum

Turma investigationis dimissa VideoPoet, exemplar linguae latinae, capax solutionis specierum qualitatum e multiplicibus significationibus conditionalibus. VideoPoet utitur architectura decoder-tantum Transformer ad tractandas inputationes multi-modales includentium imagines, video, textus, et audio.

Protocollum institutio sequitur fistulam magnarum linguarum exemplorum (LLMs) et in duobus gradibus consistit: prae-praeparatio et accommodatio munerum specialium. In scaena prae-traturae, VideoPoet multi-modalem generationem scuta coniungit intra compagem autoregressivam Transformatorem. Praestructa LLM tamquam basis et aptari potest ad operas generationis video. Demonstrant facultatem exemplar status-of-artis in generatione nulla video iactum, in specie facultatem motus fidelitatis summus generandi.

Chartae X: Linguae exemplar productionis pars furari

Nicholas Carlini、Daniel Paleka、Krishnamurthy Dvijotham、Thomas Steinke、Jonathan Hayase、A. Feder Cooper、Katherine Lee、Matthew Jagielski、Milad Nasresfahani、Arthur Conmy、Eric Wallace、David Rolnick、Florian Tramer

Institutiones: OpenAI, Google DeepMind, ETH Zurich, University of Washington, University McGill

Charta inscriptio: https://arxiv.org/pdf/2403.06634

Haec charta novam methodum oppugnandi AI exempla proponit. Accurate informationes extrahere e capsula lingua generativae exemplaris OpenAI's ChatGPT vel Google PalM-2. Haec methodus in tabulatum Proiectionis Transformatoris infixam (quae est clavis intellectus exemplaris linguae), ac solum API accessum requirit, per website vel applicatione, et cum exemplari confabulando ad "vincendum" illud. Ex ratione in charta, investigatores totam proiectionem vulvam ex duobus exemplaribus fundamentalibus seriei GPT, Adae et Babbagis emissi sunt. Perruperunt etiam per occultas rationes auimae-3.5-turbae, et si vis integram proiectionem matricis exemplaris restituere, sumptus MM $ non excedunt. Investigatores proposuerunt seriem defensionis consiliorum et consiliorum mitigationem impedire ne talis impetus fiat.

nuntium

Jia Yangqing vicit Tempus Test Award unius e chartarum suarum, sed non avocavit pro 10 optimis tabellis in Sinis et ICML 2024 lacus

Introductio

mihi contactus notitia