minhas informações de contato
correspondência[email protected]
2024-09-30
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
recomendado pelo grande deus kapasi wall crack!
até previu issoaplicação de ia, é possível abrir “uma oportunidade tão grande quanto o chatgpt”.
é um produto experimental de ia do google,caderno lm, equipado com gemini 1.5 pro, o modelo mais poderoso do google no momento.
recentemente, este aplicativo se tornou tão popular quanto possível, tudo por causa do lançamento de um novo recurso——
carregue um arquivo (texto, áudio, vídeo) e a ia pode não apenas ajudar a extrair pontos-chave do texto, mas também converter o arquivo em um podcast de conversa gerado por ia por meio da função visão geral de áudio e conduzir discussões com base no conteúdo do documento.
duas ias, usando vozes e tons de pessoas reais, discutiram apaixonadamente o conteúdo do documento e fizeram as observações finais.
△
kapasi inseriu o código c para treinar o gpt-2 e produziu um podcast de conversação
isso é muito legal!
e kapasi não é o único que se vangloria. depois de navegar em várias plataformas importantes da internet, os internautas geralmente concordam com o notebook lm.
kol @elvis da indústria de ia também deixou uma mensagem na área de comentários do kapasi:
card god disse que isso “lembra um momento chatgpt”, o que definitivamente não é um exagero!
permitir verdadeiramente que vários modelos trabalhem juntos desbloqueará formatos de conteúdo e experiências de usuário exclusivos, como o notebook lm.
como jogar notebook lm?
a jogabilidade é muito simples, basta abrir a página de teste e arrastar e soltar os arquivos que precisam ser processados.
pode ser um documento google, um link para um site ou vídeo, ou até mesmo colar um grande bloco de texto.
cada notebook suporta o upload de 50 arquivos e o conteúdo de cada arquivo é limitado a 500.000 palavras.
aqui carregamos o documento system card do openai o1 e então podemos escolher o conteúdo que precisa ser criado.
suporte integrado para funções de versão de texto, como perguntas e respostas, questionários, índice, linha do tempo, resumo, etc., bem como conteúdo de áudio de conversação aprofundada entre dois hosts.
se você tiver necessidades mais personalizadas, também poderá digitar o prompt você mesmo.
tentamos fazer perguntas em chinês e o resultado foi que a ia consegue entender.
é uma pena que o notebook lmresponder em chinês não é compatível, mesmo que você peça isso deliberadamente.
se você optar por criar áudio, precisará esperar de alguns minutos a dez minutos, dependendo da duração do documento.
aproveite este tempo para aprender sobre o modelo gemini por trás disso ~
notebooklm é compatível com gemini 1.5 pro, que é o atual modelo grande carro-chefe do google.
gemini 1.5 pro suporta contexto ultralongo de 128k, que é a base para a interpretação de documentos longos.
em uma atualização recente, as capacidades matemáticas e de raciocínio do gemini 1.5 pro superaram a versão de visualização do openai o1.
ok, o áudio gerado agora foi processado. amigos que são bons em inglês podem vir e ouvir.
amigos que não são tão bons em inglês também podem dar uma olhada na versão em texto do podcast ai transcrito e traduzido pela matryoshka ai para ter uma ideia.
simplesmente fazer upload de documentos e gerar conteúdo é apenas uma das formas práticas de usar o notebook.
alguém também introduziu um método para os alunos gravarem aulas e usarem ia para resolver os pontos-chave em casa, o que também foi amplamente elogiado.
(não quero dizer que não vou ouvir a aula)
especificamente, você pode seguir as seguintes etapas:,
use seu celular para gravar durante a aula;
não há necessidade de usar computador durante as aulas, basta anotar breves pontos-chave (papel e lápis);
(depois da aula) digitalize a gravação e as notas e carregue-as no notebooklm, e deixe-o expandir as notas com base nos detalhes da gravação.
além disso, você também pode criar uma revisão semanal em áudio dos pontos principais do que aprendeu.
um paradigma interativo diferente do simples chat
na verdade, notebooklm não se tornou um sucesso imediatamente após sua estreia.
já havia aparecido na conferência google i/o em maio do ano passado, mas naquela época, como um projeto de notebook de ia, também era chamadoprojeto tailwind。
somente em julho do ano passado o notebooklm foi alterado para seu nome atual.
no início, ele era compatível apenas com usuários de algumas áreas dos estados unidos. as funções ainda giravam em torno do modo básico de bate-papo.
△
notebooklm gera automaticamente guia de documentação (do site oficial do google)
no dia 11 deste mês, notebooklm anunciou repentinamente que estaria aberto a jogadores de todo o mundo e adicionou novos recursos importantes.visão geral do áudio。
a introdução oficial do google é a seguinte:
"o novo recurso de visão geral de áudio transforma documentos, slides, gráficos e muito mais em discussões envolventes com um clique."
como a forma de interação é muito nova, a voz da ia é realista e a discussão é realmente como um podcast ao vivo, todos se divertem imediatamente.
a partir desses dois dias, o notebook lm não só é capaz de usar vídeos do youtube como entrada, mas também suporta mais de 100 idiomas.
agora, a “demonstração de amor” de kapasi aumentou a popularidade do notebook lm.
como disse kapasi, a principal razão pela qual o notebook lm se tornou tão popular é que ele fornece um paradigma de interação diferente do simples bate-papo.
kapasi disse:o notebook lm elimina duas barreiras principais para aproveitar modelos grandes:
primeiro, conversar é bastante difícil.
algumas pessoas têm dificuldade em comunicar com outras pessoas no seu dia a dia, muito menos em conversar com um chatbot, onde têm de continuar a fazer perguntas.
o bom do notebooklm é que um dos dois podcasts de ia gerados terá a função de fazer perguntas e orientar.
vamos colocar os documentos, áudio e vídeo, esperar que sejam gerados, e meimei ting ai conversará com base nos arquivos.
em segundo lugar, a leitura não é fácil.
na era fragmentada da explosão da informação, é muito mais fácil encontrar uma posição confortável ou ouvir os outros discutirem o que preciso enquanto dirijo do que colocá-la sozinho.
——mesmo se estivermos olhando para a versão condensada que a ia resumiu para nós (ei, sim, somos tão preguiçosos! doge).
no espírito de busca pela excelência, alguns internautas também expressaram suas expectativas de que o notebook lm o leve ao próximo nível.
depois de experimentar, yuchen jin, cofundador e cto da hyperbolic labs, resumiu duas limitações:
um éele "não pode ver", ou seja, as informações da imagem no documento não podem ser processadas.
no entanto, o gemini por trás dele é multimodal. comparado com o notebook lm, não será tarde demais.
o outro éos usuários não podem direcionar o conteúdo dos podcasts de ia。
yuchen jin alimentou-o com dois tweets e gerou quase 13 minutos de conteúdo de áudio, mas o padrão foi para o público em geral, então falou sobre muitos conceitos básicos.
se você puder especificar o grupo-alvo para gerar o podcast, ou falar sobre o tópico, direção e ângulo, isso é realmente um bônus adicional.
mais uma coisa
é tarde demais, mas é tarde demais, os desenvolvedores criaramversão de código aberto do notebooklmentendi!
mas, por enquanto, só posso alimentá-lo em pdf.
digamos apenas que os humanos são realmente interessantes!
no passado, tive dificuldade em converter áudio em texto, buscando a conversão de transmissões, gravações de conferências, etc.
agora estou começando a usar modelos grandes para converter texto em podcasts novamente...
interessante uau interessante uau (cabeça de cachorro).
links de referência:
[1]https://notebooklm.google/
[2]https://x.com/karpathy/status/1840112692910272898
[3]https://x.com/omarsar0/status/1840145774874898506
[4]https://x.com/yuchenj_uw/status/1840203324571943403
[5]https://github.com/gabrielchua/open-notebooklm
— sobre —