новости

голографические ar-очки уже здесь! цукерберг распаковал коробку на месте, джен-сун хуан был в числе первых, кто испытал ее, и была выпущена большая модель llama 3.2.

2024-09-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

автор | ченг цяньзер0

редактировать | синь юань

26 сентября компания zhidongxi сообщила, что сегодня в 1:15 утра по пекинскому времени официально стартовала ежегодная конференция meta connect 2024 «mr circle spring festival gala».

генеральный директор meta марк цукерберг вышел на сцену в черной футболке и в полном разгаре опубликовал новость.квест 3сголовной дисплей,лама 3.2большая модель,умные очки ray-banголографические ar-очкиждем новых товаров.

первый новый аппаратный продукт, представленный цукербергом, былквест 3с, шокирующая цена299,99 долларов сша(эквивалент примерно 2110 юаней).

хотя его производительность немного уступает первой универсальной mr-машине meta потребительского класса quest 3, стартовая ценаскидка 200 долларов, примерно равно apple vision pro1/11, действительно экономичная машина! ! !

также недавно выпущены большие модели! мета-мультимодальная модельлама 3.2выпущено, включая параметры 90b и 11bвизуальная модель большого языка, а также параметры 1b и 3bупрощенная текстовая модель

с ламой 3.2,мета иизапущена новая мультимодальная функция, поддерживающая голосовое взаимодействие и имеющая различные варианты звука (в том числе голоса некоторых знаменитостей). цукерберг продемонстрировал живой голосовой чат с meta ai, который прошел очень гладко.

есть также ar-очки, которые meta называет самыми продвинутыми за всю историю —голографические ar-очки«орион»

основатель и генеральный директор nvidia дженсен хуанг уже попробовал это.

01.

quest 3s: доступная и доступная версия по цене 300 долларов сша.

производительность почти такая же, как в quest 3.

прежде всего, доступна доступная версия устройства quest!

мета напрямуюквест 3сцена снижена на 200 долларов сша (что эквивалентно примерно 1406 юаням), а производительность почти такая же, как у quest 3.

версия meta quest 3s 128 гб стоит299,99 долларов сша(что эквивалентно примерно 2110 юаням), версия на 256 гб стоит$399,99(эквивалент примерно 2813 юаней). квест 3 на 512 гб$499,99(эквивалентно примерно 3516 юаням).

обе гарнитуры используют один и тот же процессор, обечип qualcomm snapdragon xr2 gen 2. ключом к значительному снижению цен является то, что quest 3s заменил объектив pancake набесконечная линза

судя по живой демонстрации, quest 3s с дисплеем 4k имеет очень четкий дисплей, а также поддерживает объемный звук dolby atmos.

метапересобрана ос horizon.для достижения пространственных вычислений он может лучше помочь пользователям использовать базовые 2d-приложения, такие как youtube, facebook и instagram.

мета добавленапространственный звуки улучшенныйсквозное прохождениеконтраст и цвет делают изображение более реалистичным и захватывающим.

цукерберг объявляет, что meta работает смайкрософтсотрудничать, использоватьпк с windows 11для достижения беспрепятственного взаимодействия с виртуальными рабочими столами.

meta уже предлагает поддержку нескольких экранов и возможность напрямую взаимодействовать с тем, что происходит на дисплее. например, пользователи могут напрямую перетащить интерфейс из записной книжки на устройство quest.

чтобы создать более реалистичную среду метавселенной, meta запустилагиперскейп, пользователям нужно всего лишь просканировать комнату, в которой они находятся, с помощью своего мобильного телефона, а затем надеть гарнитуру, чтобы «воспроизвести» комнату в любое время.

это головное устройство отображения позволяет вам сидеть в первом ряду, чтобы смотреть концерты, сидеть в домашнем кинотеатре, чтобы смотреть блокбастеры в высоком разрешении, заниматься спортом и многое другое.

кроме того, quest 3s совместим с тысячами приложений и полной библиотекой игр meta, а также с предстоящими эксклюзивными играми quest 3 и 3s, такими как batman: arkham shadow.

для тех, кто новичок в xr или ждет снижения цен на устройства quest и quest 2, quest 3s может быть лучшим выбором.

02.

лама 3.2: визуальная модель догоняет gpt-4o mini,торцевая модель 1b сравнима с gemma.

что касается искусственного интеллекта с открытым исходным кодом, meta выпустила новую мультимодальную большую модель.лама 3.2

llama 3.2 имеет две визуальные большие языковые модели со спецификациями параметров 90b и 11b, а также облегченные текстовые модели 1b и 3b, которые могут запускаться локально на устройстве, включая версии для предварительного обучения и версии с настраиваемыми инструкциями.

адрес загрузки:https://www.llama.com/

поддержка моделей 1b и 3b128 тыс. токеновконтексте, адаптируется к оборудованию qualcomm и mediatek и нацеленпроцессор рукиоптимизирован.

3б модельпревосходит модели gemma 2 2.6b и phi 3.5-mini в таких задачах, как следование инструкциям, подведение итогов, быстрое переписывание и использование инструментов.модель 1бпроизводительность сравнима с джеммой.

визуальные модели 90b и 11bэто прямая замена соответствующей текстовой модели, и ее производительность при решении задач по распознаванию изображений лучше, чем у закрытых моделей, таких как claude 3 haiku и gpt-4o mini.

например, если вы спросите компанию, в каком месяце прошлого года были самые высокие продажи, llama 3.2 сможет рассуждать на основе доступных диаграмм и быстро дать ответ.

он также может использовать карты, чтобы рассуждать и помогать отвечать на вопросы, например, о расстоянии определенного пути, отмеченного на карте.

визуальные модели также могут помочь рассказывать истории, извлекая детали из изображения, понимая сцену, а затем создавая одно или два предложения в качестве подписи к изображению.

в отличие от других открытых мультимодальных моделей, как предварительно обученные, так и согласованные модели можно точно настроить для пользовательских приложений с помощью torchtune и развернуть локально с помощью torchchat.

требуются мультимодальные модели с параметрами 11в и 90в.новая архитектура модели, поддерживающая вывод изображений

процесс обучения meta состоит из нескольких этапов: начиная с предварительно обученной текстовой модели llama 3.1, сначала добавляя адаптеры изображений и кодировщики, затем предварительно обучая данные крупномасштабному шуму, а затем предварительно обучая среднемасштабным высококачественным доменов и обучение на основе данных, дополненных знаниями.

после обучения meta использует те же методы, что и текстовые модели, выполняя несколько этапов согласования с точки зрения контролируемой точной настройки, выборки отклонения и прямой оптимизации предпочтений. результатом является набор моделей, которые могут получать как изображения, так и текстовые сигналы, а также глубоко понимать и рассуждать о их сочетании.

для легких моделей с параметрами 1b и 3b meta использует мощную модель учителя для создания небольших моделей с более высокой производительностью, что делает ее одной из первых высокопроизводительных легких моделей llama, которые могут эффективно адаптироваться к устройствам.

meta использует однократное использование структурированной обрезки из llama 3.1 8b, уменьшая размер существующих моделей llama, восстанавливая при этом как можно больше знаний и производительности.

после обучения исследователи использовали подход, аналогичный llama 3.1, для создания окончательной модели чата, выполнив несколько раундов согласования на основе предварительно обученной модели.

meta представляет первый официальный выпуск llama stack, который значительно упростит использование разработчиками моделей llama в различных средах, таких как одноузловая, локальная, облачная и на стороне устройства, обеспечивая расширенную генерацию извлечения (rag) и интегрированные инструменты безопасности, поддерживающие развертывание «под ключ». приложений.

03.

мета-ии: выбирайте из множества голосов знаменитостей,

p-изображения и перевод в реальном времени более удобны

с ламой 3.2,у мета-ии есть голос

теперь используйте свой голос, чтобы поговорить с meta ai, и позвольте ему ответить на ваши вопросы или рассказать анекдоты, которые заставят вас смеяться. мета также добавляет к голосу множество знакомых голосов ии. например, голоса британской актрисы джуди денч.