notizia

Alibaba guida l'investimento nel primo robot umanoide: Zhuji Dynamics completa il finanziamento di serie A di 100 milioni di yuan per il modello AI di Google Eureka;

2024-07-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

Le notizie finanziarie di oggi

La General Robot Company Zhuji Dynamics ha completato un finanziamento di serie A da 100 milioni di yuan:

Zhuji Dynamics è un'azienda di robotica generale che si concentra sulla ricerca e sviluppo e sulla produzione di robot dotati di gambe e intelligenza incorporata. I suoi prodotti includono bipedi umanoidi, robot a quattro ruote e relative soluzioni software e hardware. Il fondatore, Zhang Wei, è professore di ruolo presso la Southern University of Science and Technology. In precedenza è stato professore di ruolo presso il Dipartimento di ingegneria elettrica e informatica presso la Ohio State University. Questo round di finanziamento è stato guidato da Alibaba, China Merchants Venture Capital e Shangqi Capital, una filiale di SAIC Motor, ed è stato seguito dagli azionisti originali Fengrui Capital, Oasis Capital e Mingshi Capital. Questa è anche la prima azienda di robot umanoidi lanciata da Alibaba.

La startup Soda Data per l'affidabilità dei dati AI raccoglie 14 milioni di dollari:

Il prodotto di punta di Soda Data è una suite di strumenti per la qualità dei dati chiamata "SodaGPT". Combina le capacità di elaborazione del linguaggio naturale dell'intelligenza artificiale generativa con le capacità linguistiche specifiche del dominio di Soda Checks Language, o SodaCL, per trasformare le query degli utenti in semplici test sulla qualità dei dati. Il round è stato guidato dagli investitori esistenti e dai partner strategici Singular e Point Nine.

Lo sviluppatore di prodotti di intelligenza artificiale industriale Whale Cloud Intelligence ha completato decine di milioni di yuan nel round di finanziamento Pre-A:

Fondata nel 2022, Whale Cloud Intelligence è un fornitore di servizi di trasformazione digitale industriale e manifatturiera, che si concentra sulla ricerca tecnologica sulla piattaforma Internet PaaS industriale e sullo sviluppo di prodotti di intelligenza artificiale industriale. Questo round di finanziamento è stato guidato da Yuanhe Origin e seguito da Qianrong Venture Capital. I fondi raccolti verranno utilizzati per ottimizzare continuamente il prodotto principale "Whale Cloud OS Industrial Brain" e per sviluppare e implementare prodotti di intelligenza artificiale industriale concentrandosi sull'applicazione di scenari di processo suddivisi.

Woye Technology, il robot guida turistica intelligente per i punti panoramici, ha ricevuto un investimento strategico di decine di milioni di RMB:

Woye Technology è uno sviluppatore di robot intelligenti per visite guidate per punti panoramici, concentrandosi sulla ricerca, sviluppo, produzione e vendita di robot intelligenti. L'azienda dispone di tecnologie di base come l'identificazione multisensore matura e la tecnologia di navigazione autonoma di posizionamento, la tecnologia di intelligenza artificiale della rete neurale profonda e la modularizzazione dell'azionamento dei sensori dei robot. Recentemente, Woye Technology ha ricevuto decine di milioni di yuan in investimenti strategici dal Jiangsu Guangguang Group.

Il robot da costruzione Fontan Robot ha ricevuto decine di milioni di investimenti strategici:

Fontan Robot è un'azienda di robot da costruzione e un fornitore professionale di prodotti e soluzioni per l'edilizia intelligenti. Al momento, il prodotto principale è un robot di spruzzatura per interni con funzioni integrate di mastice e vernice al lattice. Recentemente ha ricevuto un investimento strategico multimilionario da Century Financial Resources.

Lo sviluppatore di robot Elythor ha ricevuto un investimento strategico:

Lo sviluppatore svizzero di robot Elythor ha ricevuto un investimento strategico da InnoBooster. Fondata il 1° gennaio 2023, Elythor è una società focalizzata sull’utilizzo di velivoli multirotore, droni ad ala fissa e tecnologia di deformazione del volo per sviluppare robot agili in grado di condurre ispezioni delle infrastrutture elettriche in spazi complessi e lunghe distanze.

Easel AI, un pacchetto di emoticon AI generative, ha ricevuto un finanziamento di 2,65 milioni di dollari:

Easel AI è un'APP per la generazione di immagini AI legata a IOS iMessage. È stata fondata a Los Angeles, negli Stati Uniti, nel dicembre 2023. È posizionata come una società startup per la generazione di immagini AI con un totale di 7 dipendenti ed è agli inizi. Rajan Vaish, uno dei cofondatori e CEO, si è laureato alla Stanford University come ricercatore post-dottorato e ha lavorato come capo ricercatore presso lo Snap Research Center. Un altro fondatore, Sven Kratz, è stato anche ricercatore principale presso Snap, promuovendo la ricerca sulla tecnologia AR, lo sviluppo e la manutenzione di APP, ecc. I due lasciarono Snap contemporaneamente e fondarono insieme Easel AI, fungendo da CTO e responsabile dello sviluppo tecnologico.

Easel ha raccolto un totale di 2,65 milioni di dollari in finanziamenti iniziali da Corazon Capital, Unusual Ventures e diversi angel investor. L'azienda è stata selezionata per il primo programma di accelerazione dell'avvio di Google.

(Benvenuto per aggiungere WeChatAlessandra_1970, scopri di più sull'AIGC e sullo stato del finanziamento e parla dei nuovi prodotti AI con amici che la pensano allo stesso modo)

Le voci sulla grande fabbrica di oggi

Il modello AI Eureka di Google è stato esposto in anticipo e Gemini rilascerà presto cinque nuove funzionalità

Google sta per lanciare un nuovo modello di intelligenza artificiale chiamato "Eureka" che funziona bene nella generazione del linguaggio naturale. Il modello è già apparso su LMSYS Arena. Il rilascio ufficiale è previsto per il 18 luglio. Oltre a Eureka, Google Gemini rilascerà presto nuove funzionalità, tra cui Imagen3, GPT personalizzato Gemini, ecc. Lancerà inoltre funzionalità come risposte personalizzate, promemoria di prenotazione, registrazione e integrazione di Google Foto. Google sta intensificando il reclutamento di beta tester per Gemini per iOS e l'aggiornamento iOS potrebbe essere presto disponibile.

Baidu lancia l'APP sociale umana digitale Wen Xiaoyan AI

Baidu ha recentemente lanciato un'APP sociale umana digitale AI chiamata "Wen Xiaoyan". Utilizzando il modello di grandi dimensioni Wenxin, gli utenti possono comunicare e interagire con personaggi virtuali AI in tempo reale, stabilire connessioni emotive e migliorare l'esperienza interattiva. Ogni persona digitale AI fornisce un servizio di chat unico e può diventare l'enciclopedia dell'utente, l'assistente di vita e persino il mentore spirituale. L'essere umano digitale mostra la parola, il testo e il linguaggio del corpo per aumentare il realismo durante la risposta.

Google rilascia Magic Insert: trascina e rilascia con un clic per integrare perfettamente i personaggi in nuovi sfondi

Magic Insert utilizza innanzitutto LoRA e tag di testo appresi per mettere a punto un modello di diffusione testo-immagine pre-addestrato e fonderlo con una rappresentazione CLIP in stile target. Utilizzando la tecnologia Bootstrapped Domain Adaptation, i modelli di inserimento di oggetti fotorealistici specifici del dominio vengono adattati a diversi domini di stile artistico. Questo metodo consente di scegliere tra il grado di stilizzazione e fedeltà ai dettagli del soggetto originale e persino di introdurre più novità nella generazione.

Provalo: https://magicinsert.github.io/demo.html

Progetto: https://magicinsert.github.io

Baidu Intelligent Cloud e l'Università di Finanza ed Economia dello Shandong sviluppano una nuova educazione alle arti liberali e insegnano un grande modello proprietario "AI Talent"

Il grande modello proprietario "AI Talent" per l'istruzione e l'insegnamento è stato sviluppato congiuntamente dall'Università di Finanza ed Economia dello Shandong in collaborazione con Baidu Intelligent Cloud e Shandong Yinrui Technology. Questo modello di grandi dimensioni può costruire un ambiente scientifico e educativo intelligente attraverso tecnologie chiave come big data, apprendimento automatico e mappe della conoscenza. Può condurre un’analisi strutturata di materiali didattici professionali, dati di ricerca scientifica, casi di tirocinio e altre conoscenze sul modello di grandi dimensioni piattaforma per formare la propria conoscenza.

OggiNovità sul prodotto

Caccia al prodottoLista caldaSemplifica il processo creativo AI Web Designer

AI Web Designer semplifica il processo di progettazione web tramite l'intelligenza artificiale. Gli utenti devono solo inserire il nome del dominio del sito web per ottenere un nuovo design generato dall'intelligenza artificiale. La piattaforma non solo fornisce servizi gratuiti di generazione del design della home page, ma supporta anche funzioni come la modifica del design, l'esportazione di Figma e l'acquisizione del codice HTML originale. Offre agli utenti la possibilità di ottenere un design per un intero sito Web, fornendo al contempo un servizio white label alle agenzie per vendere i design come propri prodotti.

https://aiwebdesigner.io/?ref=producthunt

Tendenze di GitHubLista caldaTempesta per la creazione di rapporti di ricerca sull'intelligenza artificiale

Il sistema Storm, reso open source da un gruppo di ricerca dell'Università di Stanford, utilizza la tecnologia del modello linguistico su larga scala per ricercare automaticamente argomenti specifici e generare report completi con citazioni. Storm crea articoli di alta qualità simili a Wikipedia attraverso due fasi di pre-scrittura e scrittura, combinando ricerche su Internet e ponendo domande da più angolazioni. La flessibilità di Storm si riflette nel supporto di più API di motori di ricerca e modelli linguistici, che gli utenti possono personalizzare in base alle proprie esigenze. Il sistema non solo fornisce a ricercatori e creatori di contenuti potenti strumenti, ma apre anche nuove possibilità nel campo della scrittura assistita dall’intelligenza artificiale.

https://storm-project.stanford.edu/

Consigli per gli sviluppatori

1.ReadLecture trasforma istantaneamente i contenuti video in note essenziali

ReadLecture è uno strumento AI di conversione di testo in immagine che può migliorare notevolmente l'efficienza degli utenti nella visione dei video. Bastano solo 5 minuti per comprendere l'intero contenuto video da una lezione video originale di 2 ore. Questo strumento integra tecnologie all'avanguardia come modelli linguistici di grandi dimensioni, sintesi vocale e visione artificiale. Può trascrivere accuratamente trascrizioni vocali ed estrarre fotogrammi chiave (come le lezioni PPT) e fornire riepiloghi dettagliati, traduzioni e note di riflessione. .

Lo strumento fornisce tre formati di output, adatti alla lettura immersiva, alla navigazione veloce e all'analisi approfondita. ReadLecture può anche fornire varie forme di riepilogo dei contenuti, come mappe mentali, comprensione di domande e risposte e pensiero dialettico.

www.readlecture.cn


2.SmartCrawl: utilizza la tecnologia AI per convertire tutti i dati del sito Web in API

Mendable.ai e la comunità Firecrawl hanno unito le forze per lanciare lo strumento open source mendableai/firecrawl, che fornisce agli sviluppatori di intelligenza artificiale potenti funzionalità di elaborazione dei contenuti dei siti Web. Questo strumento può convertire l'intero sito web in formato Markdown o dati strutturati adatti a modelli linguistici di grandi dimensioni e implementare funzioni di web scraping, crawling ed estrazione dati attraverso un'unica API. Sebbene siano ancora nelle fasi iniziali di sviluppo, sono già disponibili diversi SDK e supporto per l’integrazione con gli strumenti di intelligenza artificiale tradizionali. Gli sviluppatori possono utilizzare Python o Node SDK per implementare facilmente funzioni come la scansione dei siti Web, l'estrazione dei dati e la ricerca di contenuti.

Italiano: https://github.com/mendableai/firecrawl

3.PDF-Extract-Kit: nuovo strumento di estrazione dei contenuti PDF basato sull'intelligenza artificiale

Il team di Opendatalab ha lanciato PDF-Extract-Kit, un toolkit open source progettato per migliorare la qualità e l'efficienza dell'estrazione del contenuto dei documenti PDF. Questo set completo di strumenti utilizza LayoutLMv3 per l'analisi del layout, YOLOv8 per il rilevamento delle formule, UniMERNet per il riconoscimento delle formule e PaddleOCR per il riconoscimento del testo. PDF-Extract-Kit è progettato pensando a una varietà di tipi di documenti, che vanno dai documenti accademici ai rendiconti finanziari. Funziona bene quando si gestiscono documenti con scarsa qualità di scansione o filigrane, dimostrando una forte adattabilità.

https://github.com/opendatalab/PDF-Extract-Kit

4.Conversione video AI: Live2Diff implementa l'elaborazione del flusso in tempo reale

Il gruppo di ricerca scientifica dello Shanghai Artificial Intelligence Laboratory, del Saarland Computer Science Center e del Maxpult Institute of Computer Science, nonché dell'S-Lab della Nanyang Technological University, hanno sviluppato congiuntamente una tecnologia innovativa chiamata Live2Diff per fornire streaming video in tempo reale conversione. Questa tecnologia applica abilmente un meccanismo di attenzione unidirezionale al modello di diffusione video, consentendo l'elaborazione video in tempo reale di alta qualità senza fare affidamento su fotogrammi futuri.

Live2Diff può raggiungere una velocità di elaborazione di 16FPS su GPU RTX 4090, mostrando prestazioni eccellenti. Impiegando efficienti schemi di denoising ed elaborazione della pipeline, questa tecnica supera i metodi esistenti in termini di fluidità temporale, efficienza e qualità di generazione.

Italiano: https://live2diff.github.io/

Attenzione speciale

Il 55% del fatturato annuo di OpenAI, pari a 3,4 miliardi di dollari, proviene da utenti paganti del lato C

L'organizzazione di ricerca FutureSearch ha pubblicato un rapporto sulle entrate di OpenAI. Il rapporto mostra che le entrate ricorrenti annuali di OpenAI raggiungono i 3,4 miliardi di dollari, più della metà dei quali proviene dai pagamenti degli abbonamenti a ChatGPT, mentre le entrate API provenienti da aziende e sviluppatori rappresentano solo circa il 15%.

Gli utenti paganti di ChatGPT Plus rappresentano il 55% delle entrate di OpenAI, ovvero 1,9 miliardi di dollari, da 7,7 milioni di abbonati in tutto il mondo, ciascuno pagante 20 dollari al mese.

ChatGPT Enterprise rappresenta il 21% delle entrate totali, ovvero 714 milioni di dollari, da 1,2 milioni di utenti aziendali, ciascuno dei quali paga 50 dollari al mese.

Le entrate dell'API rappresentano il 15%, ovvero 510 milioni di dollari, da sviluppatori e aziende che utilizzano l'API ChatGPT.

ChatGPT Team rappresenta l'8% delle entrate totali, ovvero 290 milioni di dollari, da 980.000 abbonati, ciascuno dei quali paga 25 dollari al mese.

https://futuresearch.ai/request-openai-report

Restate sintonizzati per gli ultimi aggiornamenti di domani!

L'AI Intelligence Bureau sta reclutando partner di intelligence per raccogliere indizi preziosi ed esclusivi! Se puoi fornire informazioni sugli ultimi risultati dell'intelligenza artificiale, informazioni privilegiate del settore e prodotti unici, aggiungi il tuo account WeChat operativo:Alessandra_1970Prendi nota delle posizioni del settore.

StandardBots ha ricevuto finanziamenti per 63 milioni di dollari; 7 persone chiave dietro Kuaishou Keling sono state smascherate; il progetto top secret OpenAI è stato denunciato e l'accordo segreto è stato nuovamente segnalato dall'AI Intelligence Bureau

Groq ha ricevuto un investimento di 300 milioni di dollari da BlackRock, con una valutazione ultima di 2,2 miliardi di dollari; Hayden AI ha ricevuto 90 milioni di dollari in finanziamenti di serie C da AI Intelligence Agency

Skild AI ha raccolto 300 milioni di dollari per sviluppare cervelli robotici; Keling AI ha 700.000 utenti; Alibaba Tongyi Qianwen è al primo posto nel paese, superando tutti i modelli open source e closed source di AI Intelligence Bureau