berita

model depth pro ai dari apple memicu revolusi dalam ar: pembelajaran tanpa sampel, mengubah satu gambar 2d menjadi 3d definisi tinggi dalam 0,3 detik

2024-10-05

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

it house melaporkan pada tanggal 5 oktober bahwa media teknologi venturebeat menerbitkan postingan blog kemarin (4 oktober), melaporkan bahwa tim peneliti ai apple merilis model ai baru yang disebut depth pro, yang tidak memerlukan prediksi data kamera tradisional dan dapat mencapai hasil yang diinginkan. dalam beberapa menit. hasilkan peta kedalaman 3d terperinci dari satu gambar 2d dalam satu detik.

makalah ini bertajuk "depth pro: sharp monocular metric depth in less than a second" dan merupakan terobosan besar dalam bidang estimasi kedalaman monokuler (monocular depth estimation). keseluruhan proses hanya menggunakan satu gambar untuk menyimpulkan informasi kedalaman.

bandingkan peta kedalaman apple depth pro, marigold, depth anything v2, dan metric3d v2. depth pro unggul dalam menangkap detail seperti rambut dan kabel sangkar burung, menghasilkan peta kedalaman resolusi tinggi yang jelas hanya dalam 0,3 detik, melampaui model lain dalam hal akurasi dan detail.

menurut makalah tersebut, model yang dipimpin oleh tim aleksei bochkovskii dan vladlen koltun mengklaim bahwa depth pro adalah salah satu sistem pembangkitan total tercepat dan paling akurat dari jenisnya.

depth pro dapat menghasilkan peta kedalaman resolusi tinggi dalam 0,3 detik pada gpu tradisional, menghasilkan gambar dengan total 2,25 juta piksel dan kejernihan luar biasa, menangkap detail seperti rambut dan tanaman yang sering terlewatkan oleh metode lain.

apa yang benar-benar membedakan depth pro adalah kemampuannya memperkirakan kedalaman relatif dan absolut, suatu kemampuan yang dikenal sebagai "kedalaman metrik".

depth pro tidak memerlukan pelatihan ekstensif pada kumpulan data khusus domain untuk membuat prediksi yang akurat. fitur ini disebut "zero-shot learning", yang berarti model dapat memberikan data pengukuran nyata, yang sangat berguna untuk augmented reality (ar). .aplikasi sangat penting.

depth pro saat ini bersifat open source di platform github, dan pengembang didorong untuk mengeksplorasi lebih jauh potensi depth pro di bidang-bidang seperti robotika, manufaktur, dan perawatan kesehatan.