nuntium

Cur morae commercium exemplar vexillum est generationi RAG?

2024-08-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina



AIxiv columna columna est ubi Machina Cordis contenta academica et technica publicat. Praeteritis his annis, Cor Machinae AIxiv columnam plus quam 2.000 reportavit, tecta laboratatoria a maioribus universitatibus et societatibus circum orbem terrarum, efficaciter promovens permutationes academicas et disseminationem. Si egregium opus habes quod communicare vis, libenter senties nos conferendi vel nuntiandi contactum. Submissio inscriptio: [email protected];

Zhang Yingfeng: Co-conditor Infra, multis annis experientiae quaerendi AI, infrastructuram infrastructuram, nunc laborat in constructione sequentis generationis RAG core productorum.

In evolutione systematis RAG, exemplar bonum Reranker nexus necessarius est et semper in variis aestimationes adhibetur. Haec causa est, quia quaerentes quae per vector perscrutationes exhibentur, quaestioni gravis hit rate praebebit, ideo exemplar Reranker provectum ad remedium necessarium est. hoc, ita architecturae biennii scaenae genus utens vector quaerendi ut crassum protegendo et Reranker exemplar quasi pulchrum genus.

Nunc sunt duo genera architecturae principales ad exempla proposita:

1. Dual encoder. Exemplar exemplum BERTI sumens, inquisitiones et documenta separatim encodes, et tandem per stratum mersarum transit ita ut output unum tantum vectorem contineat. In gradu interrogationis ranking, tantum similitudinem duorum vectorum computare debes, ut figura infra ostendetur. Dual encoders adhiberi possunt pro gradibus et rankings et Reranking, et vector inquisitionis est actu hoc ordo exemplar. Cum interrogationem et documentum separatim encode encodes, non potest capere complexam relationem interactivam inter interrogationes et indicia documenti, quae multum damnum semanticum facient calculi, executio efficacia altissima emendatur.



2. Crucis Encoder. Crux-Encoder uno exemplo encode utitur ad interrogationes et documenta simul encode. Potest capere complexum commercium inter quaesita et documenta, ut accuratiores investigationes ordo consequi possit. Crux-Encoder vectorem non ponit respondens signo interrogationis et documenti, sed classificium addit ut directe exeat similitudinem quantitatis inquisitionis et documenti. Incommodum est quod propter necessitatem coeundi singula documenta et interrogationem in tempore interrogationis enodandi, quod genus tardissimum reddit, Cross-Encoder solum ad finales eventus reordinare adhiberi potest. Exempli gratia, reordinare Top X eventus protegendi praeliminares secundas ad perficiendum adhuc accipit.



Cum hoc anno, aliud genus operis quam ColBERT repraesentatum [Reference 1] in RAG communitatis progressionis attentionem advertit.

Una est quae cum cruce Encoder comparata est, ColBERT adhuc consilio encoder duplice utitur, utens sui iuris encoders ad interrogationes et documenta encode offline processit, et solum Query cum interrogatione encoded est, ergo celeritas processus processus Cross Encoder multo altior est;

Secundum est quod comparatus ad duplicem encoder, ColBERT outputat multiplicem vectorem pro uno vectore, quod immediate ab ultimo strato Transformer obtinetur, cum duplices encoder plures vectores in unum vectorem per stratum lacunarum convertunt. amissis quibusdam semantics.

In computando voluptua, ColBERT calculi moram interactivam similitudinem functionis inducit et nominat eam maximam similitudinem (MaxSim). indagamus maximum signum pro singulis quaestionibus. Totalis score inquisitionis et documenti est summa horum usorum cosini maximi. Exempli gratia, pro interrogatione cum vectoribus 32 Thochen (maxima longitudo quaesitio 32 est) et documentum cum 128 Signis, 32*128 similes operationes faciendae sunt, ut in figura infra monstratum est.

Ita in comparatione, Crux Encoder vocari potestPrimo commercium Modelet opus quod ColberttNuper commercium Model.



Sequens figura comparat exempla supra voluptua secundum perficientur et quale genus. Cum exemplum retardati commercii facultatem satisfacit facultatem capiendi complexorum interactionum inter queries et documenta in processu voluptua, et etiam supra caput signa documenti transeundi vitat, non solum bonum genus effectus efficere potest, sed etiam citius genus effectus consequi — Sub eadem scala data, efficacia Colbert plus quam 100 temporibus Crucis Encoder esse potest. Ergo moratus exemplar commercium genus est exemplar valde promissum.Potestne morae commercium exemplar in RAG directe adhiberi ut architecturae vectoris quaesiti + subtilem voluptua exquisitae architecturae voluptua substituere possit?



Ad hunc finem, nonnullas quaestiones in Colbert machinatione considerare oportet;

1. Colbert's MaxSim distulit similitudinem interactivam functionis multo altiorem efficientiam computativam quam Cross Encoder, sed comparata cum investigatione ordinaria vectoris, caput computationale adhuc altissimum est: quia similitudo inter interrogationem et documentum est multi-vector calculi, MaxSim's The. supra caput est M * N temporibus ordinariae vectoris similitudinis calculi (M est numerus signorum in interrogatione, N numerus signorum in documento). Ad haec auctor ColBERT V2 anno 2021 excussit, qui qualitatem generati Embedding per Crucem Encoder et exemplar distillationis emendavit, et technologiae pressio adhibita quantitatis documenti vectoris generati, calculi melioris. MAXSIM faciendum. Project RAGatouille [Reference 3] fundatur in ColBERT v2 packaging solutio fit pro qualitate RAG voluptua. Nihilominus, ColBERT v2 bibliotheca algorithmus est iustus, et adhuc difficile est uti in systematis gradu RAG inceptis finire.

2. Cum Colbert exemplar praeexcitatum est, et notitia disciplinarum ex inquisitione quaesitorum et redituum reddituum provenit, haec notitia textus non magnus est quae sunt propriae longitudinis limites. Cum igitur Colbert ponitur pro notitia reali, longitudo modum excedens mutilum erit, quod non est amica longi documenti retrieval.

Ex his quaestionibus, fons apertus AI datorum datorum Infinitas Tensorem praebet genus in recentissima versione et nativa solutionem praebet finem-ad-finem ColBERT. Cum Tensor pro notitia speciei adhibetur, multi vectores output a ColBERT delatam possunt directe condi in uno Tensore, ergo similitudo inter Tensores directe ustulo MaxSim trahere potest. Ad quaestionem de magna quantitate calculi MaxSim, Infinitas duas solutiones optimize dedit: una est quantitas binaria, quae spatium Tensoris originalis tantum 1/32 magnitudinis originalis efficere potest, sed ordinatio relativa non mutat. de maxS calculis. Haec solutio maxime adhibita est pro Reranker, quia necesse est extrahere tensorem respondentem secundum eventus prioris stadii crassus protegendi. Alter Tensor Index est. instructiones de operationibus clavium ad accelerandum exsequendum inducuntur. Index Tensor solum adhiberi potest ad serviendum Rankero potius quam Reranker. Praeterea, pro longa littera quae modum Thochen excedit, Infinitas genus Tensorem Array introducit:



Documentum quod modum Colberti excedit, in plures paragraphos dividetur. Post respective Tensores descriptam et generantem, in eadem linea servabuntur sicut documentum originale. Cum MaxSim calculaturas, quaesitio et hae paragraphi separatim computantur, tum maximus valor pro titulo totius documenti accipitur. Ut infra patebit:



Quare, infinitum, exemplum morae commercium finem-ad-finem introduci potest ut serviat RAG cum qualitate maxima. Ita utendum sit Colbertt Ranker vel Reranker? Infra Infinitas utimur ad aestimationem faciendam in notitia reali occidere. Cum postrema versio infinitatis instrumentorum latissime patet solutio inquisitionis hybridarum in historia, reminiscere methodos quaerendi vectorem, investigatio plena text, investigatio sparsa vector, Tensor de quo supra, et quodlibet horum modorum iuncturam, et varias methodos Reranker praebet. .

MLDR dataset ad iudicium utimur. MLDR Probatio a MTEB [Reference 5] aestimandi qualitas exemplorum Embedding est. MLDR est una notitiarum copiarum, quae Multi Long Documenti Retrieval appellatur et summam 200,000 longi textus notitiae continet. Aestimatio utitur BGE-M3 ut exemplar Embedding, Jina-Colbert [Reference 7.] ad Tensorem generandum, et etiam scriptum aestimatio in CELLA infinita ponitur.

Iudicium 1: Estne Colbert efficax ut Reranker? BGE-M3 utere ad vectores densos et sparsos vectores ex data 200,000 MLDR generare, easque in datorum infinitatem inserere. index, vector respectively. Aestimatio includit omnes coniunctiones reminiscentium, incluso modo receptui solius, dual-iter revocatio, et trium modorum revocatio, ut sequitur:



Aestimatio index nDCG@10. Ceteri parametri: Cum RRF Reranker utens, Top N = 1000 crasso protegendo reddit, numerus queriarum totalis est octingenta, et mediocris quaestio longitudo circiter 10 signa est.



Ut ex figura videri potest, omnes solutiones revocabiles eventus significantius emendaverunt postquam Colbert Reranker usus est. Ut exemplum morae commercii, ColBERT comparare potest ordinem qualitatem comparabilem in summitate MTEB scriptoris Reranker rankings, sed perficiendi 100 times altior est, ita ordo amplius praestari potest. Eventus in figura ostensus sunt pro Top 100 Reranker, et Top 1000 pro ColBERT reordinandi. Traditionaliter, cum externa Reranker innixa in Cruce Encoder utens, secundo gradu mora erit in Top. 10. Infinitas autem perficit summam observantiam ColBERT Reranker interne. usus utentis non afficietur. Attamen ambitus revocationis valde augetur, ut ultimus effectus notabiliter emendari possit. Praeter haec ColBERT Reranker calculus solum debet currere in architectura pura CPU, quae etiam sumptus instruere valde minuit.

Evaluatio 2: Comparatio innititur Colbert ut Ranker potius quam Reranker. Ideo Tensor Index pro columna Tensor elaborare necesse est. Eodem tempore, ut damnum accurate aestimandum a Tensore Indice allatum, etiam violentia inquisitionis facta est.



Videri potest quod comparati Reranker, etiam violenta vi quaerendi sine accuratione dispendii, nulla est momenti emendatio, et quale genus in Tensor Index minus est quam utens Reranker. Investigatio temporis in Ranker multo tardior est: MLDR notitia copia 200,000 documentum continet, quod est circiter 2GB Species data documentum est. Vector singulis respondet Thochen documenti servari debet. Dimensio exemplaris ColBERTi 128 dimensiones est, ergo volumen notitia defectus per 2 ordines magnitudinis dilatabitur. quaesitum medium 7 seconds ad quaestionem tantum accipiet. Refert quaesitum, sed meliores fructus non accipit.

Unde patet quod Colbert multo utilior est Reranker quam Ranker. Praesens optima solutio RAG retrievalis est addere ColBERT Reranker ex 3-via inquisitionis hybridarum (quaerere plenus-textus + vector + sparsus vector). Nonnulli socii quaerunt, ut ColBERT Reranker utatur, necesse est columnam separatam Tensorem addere, et columna dilatabitur per 2 ordines magnitudinis comparata ad originalem datam statutam. Imprimis: Infinitas quantitatis Binariae methodum Tensorem praebet. Secundo, sic etiam aliqui existimant hoc supra caput esse nimis altum. Attamen, ex usoris prospectu, operaepretium est adhuc plus repositionis uti pro melioribus qualitatibus et vilioribus sumptibus (processus voluptua GPU non requirit). Denique, ut opinor, exemplar Serae Interactionis cum aliquantula effectu reducta sed multum redactum supra caput repositionis mox deducendum erit. Ut Data Infra infrastructura, hisce mutationibus perlucidum est et prudenti arbitrio est has Trade Off usoribus tradere.

Hoc supra in infinitis multi-alvei reminiscentis aestimationis in MLDR datae statuto fundatur. Aestimatio eventus in aliis datae copiae diversus esse potest, sed altiore conclusio non mutatur - 3-modo investigationis hybridarum + Tensor-basi reordinatio est Revocatio currentis. methodum cum summa qualitate quaesitorum.

Ex his constare potest quod ColBERT et eius morae commercium exemplar magnum in RAG missionibus applicationis habent. Hoc est ColPali, quod mutat fluxum RAG, ut in sequenti figura ostenditur:



Cum RAG facies documentorum formarum implicatarum, current SOTA documento agnitionis exemplar adhibet ad cognoscendum documenti extensionem, et tunc vocat exemplar congruentem pro structurarum partialium identificandorum, ut chartis, imaginibus, etc., ut eas in The correspondentes convertat. textus tunc servatur ad RAG sustentationem datorum in variis formatis. ColPali hos gradus eliminat et exempla multimodis directe utitur ad contenta Embedding generanda. Cum interrogationes interrogant, directe respondere potes in chartis in scriptione;



Disciplina ColPali exemplaris ColBERT similis est, etiam forma paginae interrogationis documenti utens paria ut consociationem semanticam inter interrogationem et documentum multimodis datam capiat, sed utendo PaliGemma [Reference 10] ad Embedding multi-modales generandum. Comparatus cum BiPali, qui mechanismo nuper interactionis non utitur, sed etiam PaliGemma ad Embedding generandam utitur, aestimatio index comparationis nDCG@5 est 81.3 vs 58.8.



Itaque, licet ante 4 annos ColBERT apparuerit, nupera Interactionis applicatio exemplar in RAG iam inceperat. Usum missionum RAG definite expandet ac semanticam retractationem praebet summus qualis in multiplicibus RAG scaenarum multimoditate. Infinitas iam parata est ad finem eius applicationis finem.

references

1. Colbert: Efficiens et efficax perscrutatio per contextuas nuper commercium super Bert, SIGIR MMXX.

2. Colbertv2: Efficax et efficiens retrieval per leve commercium nuper, arXiv:2112,01488, 2021 .

3. RAGatouille https://github.com/bclavie/RAGatouille

4. Efficiens Multi-vector Densa Retrieval cum Bit Vectoribus, ECIR MMXXIV.

5. https://huggingface.co/mteb

6. https://huggingface.co/BAAI/bge-m3

7. https://huggingface.co/jinaai/jina-colbert-v1-en

8. https://github.com/infiniflow/infinity/tree/main/python/benchmark/mldr_benchmark

9. ColPali: Efficient Document Retrieval with Vision Language Model, arXiv:2407.01449, 2024.

10. https://github.com/google-research/big_vision/tree/main/big_vision/configs/proj/paligemma