notícias

os óculos ar holográficos estão aqui! zuckerberg desembalou a caixa no local, jen-hsun huang foi um dos primeiros a experimentá-la e o modelo grande llama 3.2 foi lançado

2024-09-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

autor | cheng qianzer0

editar | xinyuan

zhidongxi informou em 26 de setembro que à 1h15, horário de pequim, a conferência anual "mr circle spring festival gala" meta connect 2024 começou oficialmente.

o ceo da meta, mark zuckerberg, subiu ao palco vestindo uma camiseta preta e divulgou a notícia a todo vapormissão 3sexibição principal,lhama 3.2modelo grande,óculos inteligentes ray-banóculos ar holográficosaguardando novos produtos.

o primeiro novo produto de hardware que zuckerberg revelou foimissão 3s, preço chocanteus$ 299,99(equivalente a aproximadamente rmb 2.110).

embora seu desempenho seja ligeiramente inferior ao da primeira máquina mr multifuncional da meta, quest 3, o preço inicial$ 200 de desconto, aproximadamente igual ao apple vision pro1/11, uma máquina verdadeiramente econômica! ! !

modelos grandes também foram lançados recentemente! modelo meta multimodallhama 3.2lançado, incluindo parâmetros 90b e 11bmodelo visual de linguagem grande, bem como os parâmetros 1b e 3bmodelo de texto simples leve

com lhama 3.2,meta ialançou uma nova função multimodal que suporta interação por voz e possui uma variedade de opções de som (incluindo vozes de algumas celebridades). zuckerberg demonstrou chat de voz ao vivo com meta ai, que foi muito tranquilo.

existem também óculos ar que meta considera os mais avançados de todos os tempos -óculos ar holográficos“órion”

o fundador e ceo da nvidia, jensen huang, já experimentou.

01.

quest 3s: versão acessível e acessível, custando us$300.

o desempenho é quase igual ao da quest 3

em primeiro lugar, a versão acessível do dispositivo quest está aqui!

meta diretamentemissão 3so preço foi reduzido em us$ 200 (equivalente a cerca de 1.406 rmb) e o desempenho é quase o mesmo do quest 3.

a versão meta quest 3s de 128 gb custaus$ 299,99(equivalente a aproximadamente rmb 2.110), a versão de 256 gb custaus$ 399,99(equivalente a aproximadamente rmb 2.813). o quest 3 de 512 gb éus$ 499,99(equivalente a aproximadamente 3.516 rmb).

ambos os fones de ouvido usam o mesmo processador, amboschip qualcomm snapdragon xr2 geração 2. a chave para a queda significativa de preço é que o quest 3s substituiu a lente pancake porlente infinita

a julgar pela demonstração ao vivo, o quest 3s com tela 4k tem uma tela muito nítida e também suporta surround dolby atmos.

metasistema operacional horizon reconstruídopara alcançar a computação espacial, ele pode oferecer melhor suporte aos usuários no uso de aplicativos 2d básicos, como youtube, facebook e instagram.

meta adicionadaáudio espaciale melhoroupassagemo contraste e a cor tornam a apresentação da imagem mais realista e envolvente.

zuckerberg anuncia que meta está trabalhando commicrosoftcooperar, usarpc com windows 11para obter uma experiência de desktop virtual perfeita.

o meta já oferece suporte multitela e a capacidade de interagir diretamente com o que está acontecendo na tela. por exemplo, os usuários podem arrastar diretamente a interface do notebook para o dispositivo quest.

para criar um ambiente metaverso mais realista, meta lançouhiperpaisagem, os usuários só precisam escanear a sala em que estão com seus telefones celulares e, em seguida, usar o fone de ouvido para “reproduzir” a sala a qualquer momento.

este dispositivo de exibição montado na cabeça permite que você se sente na primeira fila para assistir a shows, sente-se no home theater para assistir a sucessos de bilheteria em alta definição, exercícios e muito mais.

além disso, o quest 3s é compatível com milhares de aplicativos e biblioteca completa de jogos do meta, bem como com os próximos jogos exclusivos do quest 3 e 3s, como batman: arkham shadow.

para aqueles que são novos no xr ou estão esperando uma queda no preço dos dispositivos quest e quest 2, o quest 3s pode ser uma escolha melhor.

02.

llama 3.2: o modelo visual alcança o gpt-4o mini,o modelo final 1b é comparável ao gemma

em termos de ia de código aberto, meta lançou um novo grande modelo multimodallhama 3.2

o llama 3.2 possui dois modelos visuais de linguagem grande com especificações de parâmetros 90b e 11b, bem como modelos leves de texto simples 1b e 3b que podem ser executados localmente no dispositivo, incluindo versões pré-treinamento e ajustadas por instrução.

endereço para baixar:https://www.llama.com/

suporte aos modelos 1b e 3b128 mil fichascontexto, adapta-se ao hardware qualcomm e mediatek e tem como alvoprocessador de braçootimizado.

modelo 3bsupera os modelos gemma 2 2.6b e phi 3.5-mini em tarefas como seguir instruções, resumir, reescrever rapidamente e usar ferramentas.modelo 1bo desempenho é comparável ao gemma.

modelos visuais 90b e 11bé um substituto direto para seu modelo de texto correspondente e seu desempenho em tarefas de compreensão de imagens é melhor do que modelos fechados, como claude 3 haiku e gpt-4o mini.

por exemplo, se você perguntar a uma empresa qual mês do ano passado teve as vendas mais altas, o llama 3.2 poderá raciocinar com base nos gráficos disponíveis e fornecer uma resposta rapidamente.

também pode usar mapas para raciocinar e ajudar a responder perguntas, como a distância de um caminho específico marcado no mapa.

os modelos visuais também podem ajudar a contar histórias, extraindo detalhes de uma imagem, compreendendo a cena e, em seguida, produzindo uma ou duas frases como legenda para a imagem.

ao contrário de outros modelos multimodais abertos, tanto os modelos pré-treinados quanto os alinhados podem ser ajustados para aplicativos personalizados usando o torchtune e implantados localmente usando o torchchat.

são necessários modelos multimodais com parâmetros 11b e 90bnova arquitetura de modelo que suporta inferência de imagens

o processo de treinamento do meta consiste em vários estágios, começando com um modelo de texto llama 3.1 pré-treinado, primeiro adicionando adaptadores de imagem e codificadores, depois pré-treinando os dados com ruído em grande escala e, em seguida, pré-treinando em alta qualidade de média escala domínios e treinar em dados aumentados de conhecimento.

no pós-treinamento, meta usa métodos semelhantes aos modelos de texto, realizando múltiplas rodadas de alinhamento em termos de ajuste fino supervisionado, amostragem de rejeição e otimização de preferência direta. o resultado é um conjunto de modelos que podem receber dicas de imagem e texto e compreender e raciocinar profundamente sobre a combinação dos dois.

para modelos leves com parâmetros 1b e 3b, meta usa um poderoso modelo de professor para criar modelos pequenos com melhor desempenho, tornando-o um dos primeiros modelos llama leves de alto desempenho que podem se adaptar eficientemente aos dispositivos.

meta aproveita o uso único da poda estruturada do llama 3.1 8b, reduzindo o tamanho dos modelos existentes do llama enquanto restaura o máximo de conhecimento e desempenho possível.

no pós-treinamento, os pesquisadores usaram uma abordagem semelhante ao llama 3.1 para gerar o modelo de chat final, realizando várias rodadas de alinhamento com base no modelo pré-treinado.

meta está compartilhando o primeiro lançamento oficial do llama stack, que simplificará muito a maneira como os desenvolvedores usam os modelos llama em diferentes ambientes, como nó único, local, nuvem e dispositivo, permitindo geração aprimorada de recuperação (rag) e ferramentas de segurança integradas que suportam implantação pronta para uso. de aplicações.

03.

meta ai: escolha entre uma variedade de vozes de celebridades,

imagens p e tradução em tempo real são mais convenientes

com lhama 3.2,meta ai tem voz

agora, use sua voz para falar com meta ai e deixe-o responder suas perguntas ou contar piadas para fazer você rir. meta também adiciona muitas vozes familiares de ia à voz. como as vozes da atriz britânica judi dench.