Le mie informazioni di contatto
Posta[email protected]
2024-08-16
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
(Fonte immagine: unsplash)
Novità sull'app Titanium Media il 16 agostoLa startup nazionale di intelligenza artificiale "Shanghai MiTa Network Technology Co., Ltd." (denominata "MiTa Technology") ha rilasciato una dichiarazione in cui afferma che CNKI ha recentemente emesso una lettera in cui avverte la startup di ricerca di intelligenza artificiale MiTa Technology per aver presentato informazioni accademiche nei risultati di ricerca di intelligenza artificiale senza autorizzazione. Il titolo, l'indice e l'estratto del documento costituiscono una violazione grave e la lettera di notifica della violazione è lunga 28 pagine.
Secret Tower Technology sottolinea,Anche se non comprende questo comportamento, l’azienda rispetta la scelta di CNKI. D'ora in poi, Secret Tower AI Search non includerà più dati bibliografici e astratti di documenti CNKI, ma includerà invece dati bibliografici e astratti di altre autorevoli basi di conoscenza cinese e inglese. Anche altri database sono invitati a collaborare e discutere.
È stato riferito che MiTa Technology è stata fondata nel 2018. Il CEO dell'azienda, Min Kerui, è stato in precedenza lo scienziato capo di Cheetah Mobile ed è attualmente lo scienziato capo intelligente del Laboratorio di intelligenza artificiale legale dell'Università di Pechino.
Nel 2018, MiTa ha lanciato successivamente il prodotto di traduzione legale basato sull'intelligenza artificiale "MiTa Translation" e il prodotto per la correzione degli errori e la correzione di bozze "MiTa Writing Cat". Nel 2022 ha lanciato il prodotto per la generazione di articoli "Quantum Sketch", con utenti giornalieri che superano i 10.000 in una settimana; di andare online.
Da marzo di quest'anno, il "Mita AI Search" creato da Mita Technology è diventato improvvisamente popolare e ha attirato l'attenzione del mercato. Il sito web è stato visitato più di 7 milioni di volte in quel mese. Secondo Similar Web, una piattaforma di monitoraggio dei dati di accesso ai siti web, il numero di visite a MiTa Search nel mese di marzo si è classificato al terzo posto tra un gruppo di prodotti IA in Cina, secondo solo a Baidu Wenxin Yiyanhe.lato oscuro della lunaKimi;Il tasso di crescita del mese ha raggiunto il 550%.
Nell'agosto di quest'anno, MiTa Technology ha annunciato il completamento di un finanziamento di serie A di oltre 100 milioni di RMB, guidato da Ant Group, con una valutazione post-money di 150 milioni di dollari (circa 1,077 miliardi di RMB). I precedenti vecchi azionisti di Secret Tower includono Mingshi Capital, Cheetah Mobile e Fengyuan Capital.
Dal punto di vista del prodotto, rispetto ai motori di ricerca tradizionali, la ricerca AI fornisce direttamente agli utenti risposte alle domande e allega collegamenti alla fonte. Il sito web ufficiale di ricerca MiTa AI fornisce tre modalità di risposta: "concisa", "approfondita" e "ricerca" e l'ambito della ricerca può essere impostato su "intera rete", "biblioteca", "accademico", "podcast" e altre fonti.
Per quanto riguarda il seguito dato alla lettera di notifica, secondo il Southern Metropolis Daily, Wang Yiwei, direttore operativo di Mita Technology, ha dichiarato che CNKI non ha specificato nella lettera di notifica quali diritti avesse violato. La ricerca MiTa AI per la sezione "accademica" di CNKI può anche portare traffico a CNKI. Alcuni utenti attivano i propri account CNKI tramite la ricerca MiTA AI e pagano per CNKI, il che di per sé è un vantaggio per CNKI. In considerazione della richiesta di CNKI di disconnettersi, “non forzeremo alcun incrocio”.
Secondo Wang Yiwei, i precedenti risultati di ricerca dell'intelligenza artificiale non solo si collegavano a CNKI, ma altri autorevoli database cinesi e inglesi non hanno ancora richiesto di disconnettersi.Tuttavia, la disconnessione del collegamento CNKI non influirà sull'esperienza dei prodotti MiTa.
L'app Titanium Media ha appreso che,Tongfang CNKI (Beijing) Technology Co., Ltd., la società madre di CNKI, ha recentemente collaborato con Huawei per creare un modello chiamato Chinese Knowledge Big Model (Huazhi Big Model), in grado di supportare servizi di conoscenza, ricerca scientifica, apprendimento tramite ricerca, produzione e funzionamento, diagnosi e trattamento ausiliari, scenari in campi come la giustizia intelligente.
Zhang Hongwei, direttore generale di Tongfang CNKI, ha rivelato nel luglio di quest'anno che CNKI è una società leader nel settore dell'editoria digitale e dei servizi di conoscenza con utenti in più di 90 paesi in tutto il mondo, tra cui istruzione, ricerca scientifica, think tank, governi, imprese e gli istituti di ricerca scientifica, in particolare gli istituti di ricerca e di istruzione nazionali, detengono sostanzialmente una quota di mercato del 100%. Attualmente, Tongfang CNKI è affiliata alla China National Nuclear Corporation ed è un'impresa di proprietà statale. L'organizzazione ha stabilito rapporti di cooperazione con oltre 20.000 organizzazioni editoriali in più di 70 paesi in tutto il mondo. Inizialmente ha costruito una conoscenza mondiale dei big data sistema e gestisce la più grande biblioteca di risorse di conoscenza cinese del mondo.
Zhang Hongwei ha sottolineato che, sulla base del modello di grandi dimensioni Huazhi, l'azienda ha effettuato una trasformazione approfondita dell'intera linea di prodotti CNKI, dall'elaborazione e annotazione all'aggiunta di questo strumento alla piattaforma di servizi per vari settori. Da quando è stato ufficialmente aperto al pubblico a metà maggio di quest'anno, il numero di utenti Huazhi è cresciuto rapidamente e il numero attuale di singoli utenti ha superato i 10 milioni.
Tuttavia, CNKI è stata multata più volte e l'industria nutre alcuni dubbi sul suo modello di sviluppo. Il 26 dicembre 2022, l'Amministrazione statale per la regolamentazione del mercato ha adottato una decisione sanzionatoria amministrativa conformemente alla legge, ordinando a CNKI di cessare le attività illegali e imponendo una multa pari al 5% delle sue vendite nazionali in Cina di 1,752 miliardi di yuan nel 2021, per un totale di 87,6 milioni di yuan; nel settembre 2023, l'Amministrazione cinese del cyberspazio ha deciso sulle sanzioni amministrative relative al controllo della sicurezza della rete nei confronti di CNKI in conformità con la legge, ordinandole di interrompere il trattamento illegale dei dati personali e imponendo una multa di 50 RMB. milioni, citando le operazioni mobili di CNKI e CNKI che gestisce. Tutte le 14 app sono state accusate di avere problemi correlati, tra cui la raccolta di informazioni personali in violazione del principio di necessità, la raccolta di informazioni personali senza consenso, la mancata divulgazione o dichiarazione esplicita delle regole di raccolta e utilizzo. , non fornire una funzione di cancellazione dell'account e non eliminare le informazioni personali dell'utente in modo tempestivo dopo che l'utente ha cancellato le informazioni sull'account, ecc.
Liu Wenjie, professore presso l'Istituto di diritto comparato dell'Università cinese di scienze politiche e diritto, ritiene che un abstract sia un riassunto concentrato del contenuto di un articolo, in particolare dei pensieri e delle idee se vengono forniti servizi di ricerca agli utenti di Internet e la scansione di dati pubblici su Internet per fornire estratti di documenti, dovrebbe essere considerato un uso corretto ai sensi della legge sul copyright, in genere non costituisce violazione del copyright.
Recentemente, Elizabeth Gibney, direttrice della rivista di fama internazionale Nature, ha pubblicato un articolo in cui afferma che sempre più editori accademici concedono in licenza documenti di ricerca ad aziende tecnologiche per la formazione del modello di intelligenza artificiale. Un editore accademico ne ha ricavato 23 milioni di dollari, mentre l’autore ha guadagnato zero. Queste transazioni, in molti casi senza consultare gli autori, hanno suscitato forte insoddisfazione tra alcuni ricercatori.
"Se il tuo articolo non è stato utilizzato come dato di formazione sull'intelligenza artificiale, è probabile che diventi presto parte della formazione." Elizabeth Jipney ha sottolineato nell'articolo che attualmente gli autori di articoli accademici non hanno quasi alcuna scelta quando devono affrontare gli editori che vendono le loro opere protette da copyright. interferenza. Per gli articoli pubblicati pubblicamente non esiste alcun meccanismo per confermare se questi contenuti vengono utilizzati come dati di addestramento sull’intelligenza artificiale. Nell’uso di ampi modelli linguistici, come stabilire un meccanismo più equo per proteggere i diritti e gli interessi dei creatori merita un’ampia discussione nei circoli accademici e di diritto d’autore.
Modello linguistico di grandi dimensioni (Laurea Magistrale in Giurisprudenza) di solito si affidano a grandi quantità di dati prelevati da Internet per la formazione. Questi dati includono miliardi di informazioni linguistiche (chiamate "token") e, analizzando i modelli tra questi token, il modello è in grado di generare testo fluente. A causa del loro ricco contenuto e dell’elevata densità di informazioni, i documenti accademici sono più preziosi di grandi quantità di dati ordinari e rappresentano un’importante fonte di dati nella formazione sull’intelligenza artificiale. Stefan Baack, analista di dati della Mozilla Foundation, ha analizzato che gli articoli scientifici sono molto utili per la formazione di modelli linguistici di grandi dimensioni, soprattutto in termini di capacità di ragionamento su argomenti scientifici. È proprio a causa dell’elevato valore dei dati che le principali aziende tecnologiche hanno speso ingenti somme di denaro per acquistare set di dati.
You Yunting, socio senior e avvocato dello studio legale Shanghai Dabang, ha affermato che il problema più grande con la sezione "accademica" della ricerca MiTa AI è che può visualizzare completamente il contenuto dell'articolo "Il PDF del documento è incluso i risultati della ricerca, sebbene non possa essere scaricato, l'utente può trovarlo nella pagina dei risultati." È possibile visualizzare il testo completo di questo articolo facendo clic sul collegamento PDF, che viola il diritto dell'articolo di diffondere informazioni online. "Ma. se l'intelligenza artificiale assorbe l'essenza dell'articolo e la trasmette all'utente a modo suo, secondo la legge sul copyright stabilisce che una citazione ragionevole di parte dell'opera per spiegare un determinato problema è considerata fair use.
Per quanto riguarda l'uso di dati cartacei per la formazione di modelli di grandi dimensioni, You Yunting ha affermato che questo comportamento non viola l'infrastruttura nazionale della conoscenza cinese. Secondo la legge sul copyright, il processo di formazione è copiare e apprendere. Copiare significa copiare articoli da Internet sul server per la formazione. Attualmente non esiste un giudizio legale chiaro per determinare se l'apprendimento costituisce una violazione. Tuttavia, che si tratti del diritto di riproduzione, di studio o di altri diritti legati al diritto d'autore, CNKI non è il titolare dei diritti del documento.
Zhang Hongwei ha affermato francamente che nell’era dei grandi modelli di intelligenza artificiale, CNKI deve stabilire un ecosistema e una cooperazione.
"Se non esiste un settore a monte, né un'industria editoriale, né una fornitura continua di dati di alta qualità da parte dell'industria dei dati, sarà effettivamente difficile per il nostro settore dell'intelligenza artificiale sostenere uno sviluppo di alta qualità. Per risolvere un problema del genere, dobbiamo effettivamente Abbiamo bisogno che tutto il nostro settore metta alla prova la saggezza. Dobbiamo lavorare insieme per costruire aAIGCLa buona ecologia dei tempi promuoverà congiuntamente lo sviluppo di alta qualità di questo settore. Noi, CNKI, siamo disposti a collaborare con tutti in questo aspetto per promuovere lo sviluppo sostenibile e di alta qualità del settore. "Ha detto Zhang Hongwei.