nuntium

Manuale annotatione relicta, methodus AutoAlign cognitionem graphorum plene automated in magnis exemplaribus facit

2024-07-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



AIxiv columna columna est ubi Machina Cordis contenta academica et technica publicat. Praeteritis his annis, Cor Machinae AIxiv columnam plus quam 2.000 reportavit, tecta laboratatoria a maioribus universitatibus et societatibus circum orbem terrarum, efficaciter promovens permutationes academicas et disseminationem. Si egregium opus habes quod communicare vis, libenter senties nos ad nuntiandum conferendi vel contactum. Submissio inscriptio: [email protected];

Hoc opus coniunctim perficitur per turmas scholarium possidet Rui Zhang, Yixin Su, Bayu Distiawan Trisedya, Xiaoyan Zhao, Min Yang, Hong Cheng, et Jianzhong Qi ab Universitate Tsinghua, Universitate Melbourne, Universitate Sinensi Hong Kong, et Universitate Academiae Scientiarum Sinensis. Manipulus investigationem in magnis exemplaribus tendit, graphs scientias, inquisitionem commendatam, linguam naturalem processus, magnas notitias et alias directiones.

Tamquam maximus tabellarius cognitionis structae, graphorum scientiarum late in multis campis utuntur ut informationes retrievalis, e-commercii et deliberationis ratiocinationis. Sed quia scientia graphi a diversis institutis vel methodis constructa habent differentias repraesentationum methodi, coverage, etc. cognitio graphs.

Traditional cognitionis graphi alignment methodi niti debent manuali annotatione ad align entia et praedicata ut sementem entitatem paria. Huiusmodi modi sunt cari, inhabilis, et noctis egenum praebent. Scholastici ab Universitate Tsinghua, Universitate Melbourne, Universitate Sinensi Hong Kong, et Academia Scientiarum Sinensi communiter proposita est methodus graphi graphi cognitionis plene latae secundum magna exempla fundata - AutoAlign. AutoAlign non requirit annotationem manualem entium seminis aligned vel praedicati paria.



AutoAlign: Plene Lorem et efficax scientia Aliquam lacinia purus enabled per magnae linguae exemplum,36 (6) TKDE MMXXIV

Paper link: https://arxiv.org/abs/2307.11772

Code link: https://github.com/ruizhang-ai/AutoAlign

Exemplar introductio

AutoAlign duabus partibus maxime consistit:

Ad align praedicatorumPraedicatum embedding moduliPredicate Embedding amet

Entitas discendi pars in aligning entia includit duos modulos:Res moduli embeddingEmbedding attributum amet)和Module structuralis EmbeddedModule Embedding Structure)。

Processus altiore figura infra ostenditur:



Praedicatum embedding moduli : Praedicatum embedding moduli intendit ad align praedicata quae eandem significationem significant in duabus graphis cognitionis. Exempli gratia, color "is_in" et "sita_in". Ad hoc propositum assequendum, turma inquisitionis Praedicatum Proximitatem Graph creavit, duas graphs scientiarum in unum graphum mergens et entia in eo cum suis correspondentibus generibus reposuit (Type Entity). Methodus haec suppositione fundata est: eaedem (vel similia) praedicata, eorum entitatis correspondentes species etiam similes esse debent (exempli gratia, scopum entitatis genera "is_in" et "located_in" altam habent probabilitatem pertinendi ad locum vel urbs). Semanticus intellectus typorum per magnas linguae exempla adhuc his generibus adsimilat, subtilitatem triplicem cognitam emendans. Denique praedicatum proximum graphum discitur per modos transeundos graphes (ut TransE), ut eadem praedicata similia habeant emplicationes, per quod alignment praedicatum assequendum.

In terminis exsecutionis specificae, turma investigationis primum praedicatum propinquitatis graphi construit. Propinquitas graphi praedicatum est quoddam graphum quod relationes inter entitatem generum describit. Typi entitatis lata genera entium repraesentant et sponte varias entia coniungi possunt. Etsi formae superficies aliquorum praedicatorum diversae sunt (v.g. "lgd:is_in" et "dbp:sita_in"), eorum similitudines efficaciter idem possunt cognoscendo praedicatum propinquitatis graphi. Gradus construendi propinquitatis praedicati graphi sunt hae:

Entity genus extraction : Turma investigationis genus entitatis extraxit obtinendo valorem rdfs: praedicati cuiusque entitatis in graphi scientia. De more, quaelibet res plures species habet. Verbi gratia, res Germaniae multiplices species habere potest in cogni- graphe, ut "res", "locus", "locus" et "terra". In praedicato graphi propinquitatis, caput et caudam cuiusvis tripli cum entitatis generum statuto restituunt entia.

type alignment : Cum entitatis rationes in diversis graphis cognitionis, diversis formis superficiebus uti possunt (v.g., "persona" et "populus"), bigas investigationis indiget his generibus align. Ad hunc finem, turmae investigationis leverages publica-of-artis magnae linguae exempla sunt sicut ChatGPT et Claude ad has species sponte align. Exempli gratia, turma investigationis Claude2 uti potest ad similia paria generum in duabus graphis cognitionis identificatis et deinde omnia similia genera in repraesentatione unificata appone. Ad hunc finem, turma inquisitionis designata certa suggestorum automated (promptorum) quae statim consequi possunt alignment verba ex diversis graphis cognitionis.

Ad similitudinem praedicati capiendam, multiplices entitatis species aggregati sunt oportet. Manipulus Investigationis proposuit duas methodos aggregationis: functiones pondus et attentionem substructio. In experimentis invenerunt operam substructio functiones melius praestare. Speciatim attentionem ponderis uniuscuiusque generis entitatis computant et finalem pseudo-typum per summationem gravem implicantem obtinent. Deinde, turma investigationis exercitata praedicatum involvit, obscurando munus obiectivum ut similia praedicata similia repraesentationibus vectoris habeant.

Res embedding moduli et compages embedding moduli : Utriusque moduli attributum embedding, et moduli embedding fabrica, pro ente alignment adhibentur. Eorum ideae similes sunt praedicato embedantis, hoc est, pro entitate simili (vel simile) praedicatum in triplo correspondente, et aliud ens etiam simile. Ideo in praedicato alignment (per modulum praedicatum embeding) et attributum alignment (per characterem attributum modum embeding), possumus similia entia cognoscere similes emblemationes per TransE. In specie:

Doctrinae attributum embedding : Attributum moduli inemenso necessitudinem instituit inter entitatem capitis et valorem attributum per modum characteris sequentis pretii attributi. Investigationis quadrigis proposuit tria iuncturae munera ad valores attributorum encode: summationis munus compositum, LSTM-substructio munus iuncturae et munus N-gram-substructio coniunctio. Per has functiones possumus capere similitudinem inter valores attributorum, ut entitates attributae in duabus graphis cognitionis perpendantur.

embedding structuram doctrina : Modulus embledendi structura in TransE methodo innixa emendatur et emblemationem entium discit diversis ponderibus diversis finitimis dando. Perpendentia et implicata praedicata altiora pondera accipient, praedicata vero non sonantia. Hoc modo, modulus emblematis structuralis ex triplici triplici efficacius discere potest.

iuncturam disciplina : Tres praedicati moduli embedendi moduli, attributi moduli emblendi et structurae moduli embledandi alternatim institui possunt, se invicem per alternam doctrinam influere, ac altiorem optimum in cuiusque structurae embedding optimizing repraesentatione consequi. Post exercitationem, turma investigationis consecuta repraesentationes entium, praedicatorum, attributorum et generum infixae sunt. Denique in duabus graphis cognitionis entitatis similitudinem (ut cosin simile) comparamus et entitatis paria cum summa similitudine (opus altiore limine) pro entitatis noctis comparamus.

Eventus experimentalis

Manipulus inquisitionis perduxit experimenta in notae probatio novissimae DWY-NB (Rui Zhang, 2022), et principales eventus in tabula infra monstrantur.



AutoAlign signanter emendavit ad alignment cognitionis graphae faciendam, praesertim in absentia semina annotationis manualis. Sine hominum annotatione, exempla exsistentes fere impossibilia sunt efficaciter align. Nihilominus, AutoAlign adhuc sub his conditionibus optimum effectum consequi potest. In utraque datasets, AutoAlign emendationes significantes consequitur in exemplaribus optimis basilineis (etiam cum annotationibus manualibus) sine seminum annotatione manuali. Hi eventus demonstrant AutoAlign non solum methodos in alignment accuratione formare exsistentes, sed etiam validas utilitates ostendere in operibus noctis plene automated.

references:

Rui Zhang, Bayu D. Trisedya, Miao Li, Yong Jiang, et Jianzhong Qi (MMXXII). Probatio et Comprehensiva Survey de scientia lacinia purus Entity Gratia diei et noctis per Repraesentationem Learning. VLDB Acta, 31 (5), 1143–1168, 2022.