noticias

el modelo depth pro ai de apple desencadena una revolución en ar: aprendizaje de muestra cero, que convierte una sola imagen 2d en 3d de alta definición en 0,3 segundos

2024-10-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

it house informó el 5 de octubre que el medio tecnológico venturebeat publicó una publicación de blog ayer (4 de octubre), informando que el equipo de investigación de inteligencia artificial de apple lanzó un nuevo modelo de inteligencia artificial llamado depth pro, que no requiere la predicción de datos de la cámara tradicional y puede lograr los resultados deseados. en unos minutos genere mapas de profundidad 3d detallados a partir de una única imagen 2d en un segundo.

el artículo se titula "depth pro: profundidad métrica monocular nítida en menos de un segundo" y es un gran avance en el campo de la estimación de profundidad monocular (estimación de profundidad monocular). todo el proceso utiliza solo una imagen para inferir información de profundidad.

compare los mapas de profundidad de depth pro, marigold, depth anything v2 y metric3d v2 de apple. depth pro destaca en la captura de detalles como pelos y cables de jaulas de pájaros, produciendo mapas de profundidad claros y de alta resolución en solo 0,3 segundos, superando a otros modelos en precisión y detalle.

según el artículo, el modelo, dirigido por el equipo de aleksei bochkovskii y vladlen koltun, afirma que depth pro es uno de los sistemas de generación total más rápidos y precisos de su tipo.

depth pro puede generar mapas de profundidad de alta resolución en 0,3 segundos en una gpu tradicional, creando imágenes con un total de 2,25 millones de píxeles y una claridad excepcional, capturando detalles como cabello y plantas que a menudo pasan desapercibidos con otros métodos.

lo que realmente distingue a depth pro es su capacidad para estimar la profundidad relativa y absoluta, una capacidad conocida como "profundidad métrica".

depth pro no requiere una formación exhaustiva en conjuntos de datos de dominios específicos para realizar predicciones precisas. esta característica se denomina "aprendizaje de disparo cero", lo que significa que el modelo puede proporcionar datos de medición reales, lo cual es muy útil para la realidad aumentada (ar). las aplicaciones son cruciales.

actualmente, depth pro es de código abierto en la plataforma github y se anima a los desarrolladores a explorar más a fondo el potencial de depth pro en campos como la robótica, la fabricación y la atención sanitaria.