nachricht

das ai-modell depth pro von apple löst eine revolution in der ar aus: zero-sample-learning, das ein einzelnes 2d-bild in 0,3 sekunden in hochauflösendes 3d umwandelt

2024-10-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

it house berichtete am 5. oktober, dass das technologiemedium venturebeat gestern (4. oktober) einen blogbeitrag veröffentlicht habe, in dem es berichtete, dass das ki-forschungsteam von apple ein neues ki-modell namens depth pro veröffentlicht habe, das keine herkömmliche kameradatenvorhersage erfordert und die gewünschten ergebnisse erzielen kann erstellen sie in wenigen minuten detaillierte 3d-tiefenkarten aus einem einzigen 2d-bild.

der artikel trägt den titel „depth pro: scharfe monokulare metrische tiefe in weniger als einer sekunde“ und stellt einen großen durchbruch auf dem gebiet der monokularen tiefenschätzung dar. der gesamte prozess verwendet nur ein bild, um tiefeninformationen abzuleiten.

vergleichen sie die tiefenkarten von apples depth pro, marigold, depth anything v2 und metric3d v2. depth pro zeichnet sich durch die erfassung von details wie haaren und vogelkäfigdrähten aus und erstellt in nur 0,3 sekunden klare, hochauflösende tiefenkarten und übertrifft andere modelle in genauigkeit und detailliertheit.

dem papier zufolge behauptet das vom team von aleksei bochkovskii und vladlen koltun geleitete modell, dass depth pro eines der schnellsten und genauesten gesamterzeugungssysteme seiner art sei.

depth pro kann auf einer herkömmlichen gpu in 0,3 sekunden hochauflösende tiefenkarten erstellen und so bilder mit insgesamt 2,25 millionen pixeln und außergewöhnlicher klarheit erstellen und details wie haare und pflanzen erfassen, die mit anderen methoden oft übersehen werden.

was depth pro wirklich auszeichnet, ist seine fähigkeit, sowohl die relative als auch die absolute tiefe zu schätzen, eine fähigkeit, die als „metrische tiefe“ bekannt ist.

depth pro erfordert kein umfangreiches training an domänenspezifischen datensätzen, um genaue vorhersagen zu treffen. diese funktion wird als „zero-shot-learning“ bezeichnet, was bedeutet, dass das modell echte messdaten liefern kann, was für augmented reality (ar) sehr nützlich ist. . anwendungen sind entscheidend.

depth pro ist derzeit open source auf der github-plattform und entwickler werden ermutigt, das potenzial von depth pro in bereichen wie robotik, fertigung und gesundheitswesen weiter zu erkunden.