notizia

il modello ai depth pro di apple avvia una rivoluzione nell'ar: apprendimento a campione zero, trasformando una singola immagine 2d in 3d ad alta definizione in 0,3 secondi

2024-10-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

it house ha riferito il 5 ottobre che il media tecnologico venturebeat ha pubblicato un post sul blog ieri (4 ottobre), segnalando che il team di ricerca sull'intelligenza artificiale di apple ha rilasciato un nuovo modello di intelligenza artificiale chiamato depth pro, che non richiede la tradizionale previsione dei dati della fotocamera e può ottenere i risultati desiderati in pochi minuti genera mappe di profondità 3d dettagliate da una singola immagine 2d in un secondo.

l'articolo è intitolato "depth pro: profondità metrica monoculare nitida in meno di un secondo" e rappresenta un importante passo avanti nel campo della stima della profondità monoculare (stima della profondità monoculare). l'intero processo utilizza una sola immagine per dedurre informazioni sulla profondità.

confronta le mappe di profondità di depth pro, marigold, depth anything v2 e metric3d v2 di apple. depth pro eccelle nel catturare dettagli come capelli e fili di gabbie per uccelli, producendo mappe di profondità chiare e ad alta risoluzione in soli 0,3 secondi, superando altri modelli in precisione e dettaglio.

secondo il documento, il modello, guidato dal team di aleksei bochkovskii e vladlen koltun, afferma che depth pro è uno dei sistemi di generazione totale più veloci e accurati del suo tipo.

depth pro può generare mappe di profondità ad alta risoluzione in 0,3 secondi su una gpu tradizionale, creando immagini con un totale di 2,25 milioni di pixel e una chiarezza eccezionale, catturando dettagli come capelli e piante che spesso sfuggono ad altri metodi.

ciò che distingue davvero depth pro è la sua capacità di stimare sia la profondità relativa che quella assoluta, una capacità nota come "profondità metrica".

depth pro non richiede una formazione approfondita su set di dati specifici del dominio per fare previsioni accurate. questa funzionalità è chiamata "apprendimento zero-shot", il che significa che il modello può fornire dati di misurazione reali, il che è molto utile per la realtà aumentata (ar). le applicazioni sono cruciali.

depth pro è attualmente open source sulla piattaforma github e gli sviluppatori sono incoraggiati a esplorare ulteriormente il potenziale di depth pro in campi quali la robotica, la produzione e l'assistenza sanitaria.