nouvelles

le modèle d'ia depth pro d'apple déclenche une révolution dans la réalité augmentée : l'apprentissage sans échantillon, transformant une seule image 2d en 3d haute définition en 0,3 seconde

2024-10-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

it house a rapporté le 5 octobre que le média technologique venturebeat avait publié un article de blog hier (4 octobre), rapportant que l'équipe de recherche en ia d'apple avait publié un nouveau modèle d'ia appelé depth pro, qui ne nécessite pas de prédiction de données de caméra traditionnelle et peut obtenir les résultats souhaités. en quelques minutes. générez des cartes de profondeur 3d détaillées à partir d'une seule image 2d en une seconde.

l'article s'intitule « depth pro : sharp monocular metric depth in less than a second » et constitue une avancée majeure dans le domaine de l'estimation de la profondeur monoculaire (monocular depth estimation). l'ensemble du processus utilise une seule image pour déduire des informations sur la profondeur.

comparez les cartes de profondeur de depth pro, marigold, depth anything v2 et metric3d v2 d'apple. depth pro excelle dans la capture de détails tels que les cheveux et les fils de cage à oiseaux, produisant des cartes de profondeur claires et haute résolution en seulement 0,3 seconde, surpassant les autres modèles en termes de précision et de détails.

selon le journal, le modèle, dirigé par l'équipe d'aleksei bochkovskii et vladlen koltun, affirme que depth pro est l'un des systèmes de génération totale les plus rapides et les plus précis de ce type.

depth pro peut générer des cartes de profondeur haute résolution en 0,3 seconde sur un gpu traditionnel, créant des images avec un total de 2,25 millions de pixels et une clarté exceptionnelle, capturant des détails tels que les cheveux et les plantes qui sont souvent manqués par d'autres méthodes.

ce qui distingue vraiment depth pro, c'est sa capacité à estimer à la fois la profondeur relative et absolue, une capacité connue sous le nom de « profondeur métrique ».

depth pro ne nécessite pas de formation approfondie sur des ensembles de données spécifiques à un domaine pour effectuer des prédictions précises. cette fonctionnalité est appelée « apprentissage zéro », ce qui signifie que le modèle peut fournir des données de mesure réelles, ce qui est très utile pour la réalité augmentée (ra). . les candidatures sont cruciales.

depth pro est actuellement open source sur la plateforme github, et les développeurs sont encouragés à explorer davantage le potentiel de depth pro dans des domaines tels que la robotique, la fabrication et la santé.