le mie informazioni di contatto
posta[email protected]
2024-09-26
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
testo |. piccione bianco
redattore|wang yisu
"la logica alla base dell'ai for science è diversa dall'attuale logica di formazione dei grandi modelli linguistici." lu jintan, direttore tecnico di shenzhen technology, ha affermato senza mezzi termini che l'attuale logica dell'intelligenza artificiale nel campo della ricerca scientifica è diversa da quella dell'intelligenza artificiale. modelli linguistici di grandi dimensioni in altri settori. non è la stessa cosa.
è risaputo nel settore che la formazione del modello linguistico di grandi dimensioni si basa sull'"alimentazione" di dati di alta qualità. maggiore è la quantità di dati, maggiore è la capacità del modello linguistico di grandi dimensioni. tuttavia, in alcune aree specifiche della ricerca scientifica, la quantità di dati è relativamente scarsa. ad esempio, per alcuni tipi di strutture proteiche, potrebbero essere necessari diversi anni per ottenere centinaia di dati sperimentali di alta qualità.
ciò significa anche che l’applicazione dell’ia nel campo della ricerca scientifica richiede relativamente meno dati per ottenere effetti modello migliori.
quindi, in che modo esattamente l’intelligenza artificiale cambia la scienza? e come affrontare il modello di business? essendo una delle aziende rappresentative di ai for science, shenzhen technology ha fornito il proprio pensiero e le proprie soluzioni.
nel calcolo scientifico tradizionale, se si desidera prevedere le proprietà fisiche di molecole e atomi attraverso le loro informazioni strutturali, di solito è necessario eseguire calcoli microscopici in combinazione con problemi pratici. attualmente, l’industria non riesce ancora a realizzare questa capacità di calcolo su scala trasversale e si affida maggiormente al giudizio empirico e alla verifica sperimentale.
allo stesso tempo, con l'espansione della scala dei sistemi informatici, la quantità di calcoli scientifici tradizionali è aumentata in modo esponenziale, raggiungendo spesso decine di migliaia o addirittura centinaia di milioni di sistemi su scala atomica, se i calcoli dipendono completamente dalla fisica convenzionale modelli, il tempo di calcolo complessivo sarà il ciclo può essere molto lungo.
"la tecnologia di shenzhen può far sì che il modello produca risultati di calcolo vicini alla precisione del modello fisico e allo stesso tempo migliori notevolmente le prestazioni di calcolo", ha affermato lu jintan: "utilizziamo l'intelligenza artificiale per adattare questi metodi fisici, che potrebbero avere." in precedenza richiedeva una grande quantità di calcoli. le cose diventano più veloci."
prendendo come esempio il riconoscimento delle immagini, il suo nucleo è analizzare le informazioni sui pixel dell'immagine. introducendo una rete neurale convoluzionale, può estrarre caratteristiche locali nell'immagine, scomporre l'immagine originale in diverse mappe di caratteristiche ed eseguire soluzioni approssimative attraverso le caratteristiche. combinazione. questa è in realtà un'analisi di riduzione della dimensionalità.
in effetti, l’intelligenza artificiale è anche un’applicazione di riduzione della dimensionalità in campo scientifico. riduce la complessità computazionale attraverso le sue potenti capacità di modellazione, soprattutto nelle prime fasi che coinvolgono calcoli su scala trasversale. allo stesso tempo, in base alla capacità del modello multimodale di grandi dimensioni, è possibile ottenere anche analisi multidimensionali e previsione di vari tipi di dati come struttura molecolare, proprietà fisiche, dati sperimentali, ecc.
ad esempio, nel processo di scoperta di farmaci, di solito è necessario prima analizzare la struttura proteica e i punti bersaglio, quindi selezionare i composti candidati con elevata affinità per i punti bersaglio da centinaia di migliaia o addirittura milioni di librerie di composti. vengono solitamente eseguite valutazioni multidimensionali, tra cui analisi di affinità, previsione e valutazione delle proprietà chimiche farmaceutiche (come tossicità, assorbimento, metabolismo, ecc.).
"nel campo dell'intelligenza artificiale per la scienza, la chiave per modelli di grandi dimensioni che supportano calcoli su scala trasversale risiede nella loro enorme scala di parametri e nelle forti capacità di generalizzazione. l'enorme numero di parametri del modello consente di catturare fenomeni fisici, chimici e biologici complessi, e la forte capacità di generalizzazione "il modello di base può prevedere le proprietà rilevanti del farmaco in base alla sua microstruttura e può anche essere applicato al campo materiale." analizzando la microstruttura dei materiali, possiamo prevedere la stabilità e altri stati fisici di materiali a diverse temperature e pressioni”.
pertanto, la comprensione da parte della shenzhen technology dei modelli generali di base dell’intelligenza artificiale per la scienza risiede più nel disporre di una serie di modelli di pre-formazione di base. questo modello può essere applicato a vari campi industriali per risolvere i problemi attraverso la messa a punto.
diversi modelli di base attualmente studiati da shenzhen technology possono ancora ottenere buoni risultati con un addestramento limitato dei dati e possono essere ulteriormente ottimizzati e rivisti sulla base dei dati di qualità superiore ottenuti. con questo sistema modello, consentire all’ia di apprendere da sola i principi scientifici di base e attraverso una formazione aggiuntiva con una piccola quantità di dati di dominio può già ottenere buoni risultati, il che è leggermente diverso dai modelli linguistici di grandi dimensioni.
lu jintan ha dichiarato a light cone intelligence: “le fonti di dati nel campo del calcolo scientifico non sono diffuse e non ci sono molti set di dati pubblici, quindi gran parte del nostro lavoro ora è come sfruttare maggiormente l’effetto formativo del modello più efficace sulla base di piccoli set di dati, meglio è.
negli ultimi due anni, shenzhen technology ha anche lanciato con successo una serie di grandi modelli industriali, come il modello di simulazione molecolare dpa, il modello di conformazione molecolare 3d uni-mol, il modello di ripiegamento proteico uni-fold, il modello di struttura dell'acido nucleico uni-rna, uni -dock motore di docking per molecole di farmaci ad alte prestazioni e modello linguistico multimodale di letteratura scientifica uni-smart, ecc.
secondo lu jintan, la shenzhen technology dispone attualmente di centinaia di modelli nei campi dei materiali e dei farmaci, e questi modelli sono stati integrati con successo anche nella piattaforma di prodotti della shenzhen technology.allo stesso tempo, shenzhen technology ha anche raggiunto una cooperazione strategica con dozzine di aziende farmaceutiche leader nel settore e raggiungerà anche progressi nella commercializzazione nel 2023, con ricavi superiori a 100 milioni.
al momento, l'attività di shenzhen technology copre l'istruzione intelligente nelle università, la ricerca e lo sviluppo biomedico e nuovi materiali per batterie.
tuttavia, secondo l’attuale classificazione dell’algoritmo dell’ia per la scienza, lo sviluppo complessivo è ancora allo stadio l2, che è vicino all’accuratezza sperimentale. è ancora più orientato alle persone, utilizzando calcoli di modelli per assistere gli esseri umani e ridurre lo stress.
nella fase l3, l’intelligenza artificiale può fornire risultati direttamente e, in alcuni scenari, può sostituire direttamente gli esperimenti umani.
se vuoi passare da l2 a l3, "la difficoltà principale è che la precisione di ciascun collegamento deve raggiungere una certa altezza. allo stesso tempo, anche come integrare gli algoritmi in ciascun collegamento è una grande sfida per lu jintan." disse.
guardando al futuro, lu jintan ritiene che lo spazio di mercato per l’intelligenza artificiale per la scienza sia abbastanza ampio, che si tratti di istruzione e ricerca scientifica, biomedicina o materiali per batterie, l’aggiunta dell’intelligenza artificiale può effettivamente risolvere molti problemi fondamentali, almeno a livello sperimentale. e responsabilizzare le persone. l’industria, l’esplorazione delle frontiere, ecc. forniscono più idee e punti di ingresso.
quella che segue è la conversazione dettagliata tra guangcone intelligence e lu jintan, direttore tecnico di shenzhen technology (cancellata e modificata da guangcone intelligence):
la tecnologia di shenzhen utilizza l'intelligenza artificiale
migliorare la qualità e l’efficienza della ricerca e dello sviluppo scientifico
d: i modelli di grandi dimensioni hanno cambiato l'elaborazione del linguaggio naturale e la generazione di video e immagini. come hanno cambiato la scienza?
un:i modelli linguistici di grandi dimensioni hanno iniziato a essere utilizzati nell'estrazione di informazioni sulla letteratura, nelle informazioni sui brevetti e in altri campi. li chiamiamo modelli linguistici di grandi dimensioni. abbiamo anche alcuni risultati di ricerca in questo campo. oltre a utilizzarli per estrarre informazioni sui composti più professionali, lo faremo eseguire anche alcune applicazioni multimodali come l'interpretazione di immagini e grafici.
nell'informatica scientifica tradizionale, i problemi spesso incontrati vanno dalla scala micro alla macro. per risolvere i problemi vengono utilizzati diversi modelli fisici, ma in alcuni scenari informatici su scala trasversale le capacità sono ancora carenti. ad esempio, se vogliamo prevedere le proprietà macroscopiche di una molecola attraverso le informazioni strutturali dei suoi atomi, abbiamo bisogno della capacità di modellare su più scale.
l'intelligenza artificiale comprende modelli di grandi dimensioni, che possono ottenere una modellazione su scala trasversale. imparando questi modelli fisici e quindi applicandoli a problemi specifici, questi problemi possono essere risolti bene.
di solito dobbiamo eseguire calcoli ad ampio spettro, spesso su sistemi con decine di migliaia o addirittura centinaia di milioni di atomi. se i calcoli sono basati su modelli fisici, il periodo di tempo sarà relativamente lungo. ciò che shenshi technology sta facendo qui è consentire al modello di produrre risultati di calcolo vicini alla precisione del modello fisico e, allo stesso tempo, può migliorare notevolmente le prestazioni di calcolo.
d: come convertire i calcoli su una scala di sistema di centinaia di milioni di atomi in calcoli nel campo dei modelli di grandi dimensioni? qual è la quantità approssimativa di calcoli?
un:su scala microscopica, l'interazione tra due atomi può essere analizzata attraverso modelli fisici, ad esempio attraverso la meccanica classica o le equazioni della meccanica quantistica, per calcolare la forza di interazione e la traiettoria di movimento tra di loro. a questo punto, il calcolo deve solo considerare l'influenza reciproca di due atomi e il problema è relativamente semplice. tuttavia, all’aumentare del numero di atomi nel sistema, la situazione diventa più complicata. ad esempio, quando viene introdotto un terzo atomo, oltre a considerare l'interazione a coppie tra ciascun atomo, deve essere analizzato anche l'effetto a molti corpi tra i tre. in questo momento, l'interazione e la traiettoria tra gli atomi non dipendono solo dai due atomi, ma sono determinate congiuntamente dallo stato dell'intero sistema e la quantità di calcoli aumenta in modo non lineare. gli scienziati spesso introducono algoritmi di approssimazione, come la teoria del funzionale della densità o simulazioni di dinamica molecolare, per gestire in modo efficiente i calcoli su scale diverse.
ciò che la nostra intelligenza artificiale ha fatto all’inizio è stato in realtà utilizzare l’intelligenza artificiale per adattare queste equazioni fisiche e migliorare le prestazioni di calcolo. può essere paragonato al riconoscimento delle immagini. il suo punto principale è che analizza vari pixel. dopo aver aggiunto una rete neurale convoluzionale, dividerà un'immagine in immagini caratteristiche e quindi eseguirà una soluzione approssimativa. ciò che abbiamo fatto agli albori dell’intelligenza artificiale nel campo del calcolo scientifico può essere visto anche come un’azione di riduzione della dimensionalità, ovvero rendere più veloci cose che in precedenza potevano richiedere una grande quantità di calcoli.
d: qual è la differenza tra i metodi di calcolo dell'ia tradizionale e l'avvento dei modelli di grandi dimensioni?
un:la definizione di modello di grandi dimensioni è relativamente vaga e il numero di parametri viene generalmente utilizzato come indicatore. maggiore è il numero di parametri, maggiore è la quantità di calcolo. per noi si tratta più di fornire calcoli multiscala. il nostro attuale modello di pre-addestramento, uni-mol, si basa sulla struttura tridimensionale di molecole e atomi, prevede proprietà fisiche rilevanti, stabilisce relazioni struttura-attività e le risolve direttamente. in passato, le previsioni spesso si basavano su esperimenti e esperienza. questo metodo combina calcoli su scale diverse e fornisce nuovi metodi di calcolo per campi come la scienza dei materiali.
quando trattiamo modelli di grandi dimensioni, generalmente poniamo maggiore enfasi sulle capacità di generalizzazione del modello. nel campo dell’intelligenza artificiale per la scienza, è relativamente comune. ad esempio, il modello di base può prevedere alcune proprietà correlate ai farmaci in base alla microstruttura. se questo modello viene migrato, può essere applicato al campo dei materiali. tuttavia, le proprietà interessate potrebbero non essere proprietà medicinali, ma le sue proprietà temperature e pressioni diverse, quindi la nostra comprensione del modello generale di base in ai for science è più un insieme di modelli di pre-formazione di base. questo modello può essere applicato a vari campi industriali per risolvere i problemi attraverso la messa a punto.
d: qual è il ruolo principale della multimodalità?
un:implica la combinazione di diversi tipi di dati, come struttura molecolare, proprietà fisiche, dati sperimentali, ecc., per un'analisi completa. ad esempio, nel processo di scoperta di farmaci, di solito è necessario prima analizzare la struttura proteica e i punti target, quindi selezionare i composti con elevata affinità per i punti target da centinaia di migliaia o addirittura milioni di librerie di composti durante il processo di screening il processo può includere analisi di affinità, analisi delle proprietà medicinali, se è tossico, se è benefico per l'assorbimento del corpo umano, ecc. può essere un'analisi in più dimensioni. pertanto, se si desidera ottenere un effetto di schermatura migliore, è necessario analizzarlo da più angolazioni e più proprietà.
problemi multimodali comuni come immagini e video potrebbero essere più vicini alle nostre applicazioni multimodali nel data mining della letteratura. ad esempio, in un articolo, è necessario leggere non solo le informazioni di testo nel documento, ma anche le informazioni sull'immagine e le informazioni sull'immagine devono essere lette. eseguire un'estrazione approfondita, quindi integrarla con informazioni di testo e infine restituire i risultati. in letteratura applichiamo anche questa comune capacità multimodale.
d: quanto è grande la richiesta di dati modello nel campo dell’intelligenza artificiale per la scienza?
un:campi diversi sono diversi. naturalmente, più sono, meglio è. c'è anche il problema della difficoltà nel ottenerli. ad esempio, nelle applicazioni segmentate nel campo biomedico e nel campo delle batterie, la difficoltà di ottenere dati è diversa. nelle industrie con lunghi cicli di ricerca e sviluppo e di verifica, l’output dei dati sarà relativamente piccolo e la quantità assoluta di dati sarà limitata. . ad esempio, per alcuni tipi specifici di strutture proteiche, potrebbero esserci solo poche centinaia di registrazioni in pochi anni, ma in altri campi i dati sono decisamente di più.
tuttavia, i modelli fisici di base possono generare più dati. diversi modelli di base che stiamo attualmente studiando possono ancora ottenere buoni risultati con un addestramento limitato dei dati e possono essere ottimizzati e corretti sulla base dei dati di qualità superiore ottenuti in futuro. con il nostro sistema modello, consentire all’ia di apprendere da sola i principi scientifici di base e attraverso una formazione aggiuntiva con una piccola quantità di dati di dominio può già ottenere buoni risultati, il che è leggermente diverso dai modelli linguistici di grandi dimensioni.
d: come fare in modo che l'ia impari la logica scientifica di base e quindi risolva problemi applicativi specifici?
un:in genere, alcuni modelli fisici vengono utilizzati per eseguire direttamente i calcoli, quindi i dati risultanti vengono addestrati e infine i modelli fisici vengono simulati.
d: qual è la relazione tra il modello di base di grandi dimensioni e i modelli di grandi dimensioni di ciascun tipo verticale? devo addestrare personalmente il modello di grandi dimensioni di base o utilizzare un modello di grandi dimensioni open source di terze parti?
un:scenari diversi sono diversi. se si riferisce a un modello linguistico di grandi dimensioni, è più utilizzato nell'interpretazione di documenti, come l'interpretazione cartacea. l'applicazione di base è interpretare un singolo articolo. per ragioni di costo, verranno utilizzati alcuni modelli generali di grandi dimensioni per aiutarmi a interpretare l'articolo. se desideriamo interpretare più articoli o anche eseguire una ricerca complessiva nella nostra ampia libreria di documenti, inclusa la ricerca e l'analisi dei brevetti, utilizzeremo il nostro modello di letteratura auto-sviluppato per condurre un'interpretazione più dettagliata dell'articolo.
stiamo quindi ancora lavorando sui prodotti per gli utenti. potremo decidere quale modello è più adatto ai nostri prodotti e faremo una scelta anche in base a considerazioni sui costi.
ora chiamiamo molti modelli modelli di pre-addestramento. ad esempio, il dpa che abbiamo rilasciato l'anno scorso è un insieme di modelli di pre-addestramento per il calcolo delle funzioni potenziali tra atomi di diversi elementi. qualche tempo fa abbiamo anche lanciato il progetto del modello di atomo grande openlam , sperando di passare. per mobilitare alcune forze open source, possiamo contribuire e condividere insieme i dati per addestrare il modello a essere più maturo.
d: quanti modelli ha ora la shenzhen technology?
un:ora disponiamo di centinaia di modelli nei settori dei materiali e della medicina combinati.
i ricavi hanno superato i 100 milioni, lavorando con decine di aziende farmaceutiche
il modello di business di shenzhen technology
d: puoi condividere gli ultimi progressi di ricerca e sviluppo della tecnologia di shenzhen nel campo della medicina basata sull'intelligenza artificiale?
un:nel campo della medicina, attualmente ci stiamo concentrando sulla ricerca preclinica, coprendo quasi tutti gli scenari informatici preclinici, come la scoperta precoce di target e l'analisi della struttura delle proteine, l'analisi dei target, lo screening molecolare e l'analisi di affinità, la previsione delle proprietà, ecc questa serie di collegamenti contiene molti di questi metodi di calcolo e ora abbiamo implementato gli algoritmi.
in combinazione con lo scenario medico, confezioniamo tutti questi algoritmi in un unico prodotto, che è la nostra piattaforma di progettazione farmaceutica hermite. ora collaboriamo sostanzialmente con le prime 50 aziende farmaceutiche nazionali in diversi campi, coinvolgendo principalmente tre aspetti, uno è la biotecnologia (biotecnologia). , una è cro (organizzazione di ricerca clinica) e una è pharma (azienda farmaceutica), ognuna delle quali ha una propria azienda rappresentativa.
la settimana scorsa abbiamo appena firmato un accordo di cooperazione con una società nazionale quotata in borsa, la eastern sunshine, che produce il farmaco antinfluenzale oseltamivir. inoltre, ha appena ricevuto tre certificazioni di prima classe negli stati uniti. continueremo a lavorare con loro sugli obiettivi. affari correlati.
oltre alle tipiche aziende del settore biomedico come dongguang sunshine, collaboriamo anche con molti istituti di ricerca scientifica e università impegnate nella ricerca e nello sviluppo di farmaci, come la west china university of medical sciences, lo xiangya hospital e il medical college.
d: i nostri prodotti attuali possono effettivamente essere utilizzati direttamente utilizzando un browser e anche la distribuzione complessiva è molto leggera. tutti i metodi di distribuzione dei prodotti principali sono simili a questo?
un:sì, la maggior parte di ciò che eseguiamo online è lavoro di inferenza dell'intelligenza artificiale. il lavoro di formazione viene solitamente completato offline, quindi la quantità di dati da trasferire non è così grande. ci saranno anche una piccola quantità di scenari di formazione ed è più basato sulla messa a punto del modello pre-addestrato. può essere effettuato anche con piccoli lotti di dati e anche la pressione di trasmissione dei dati è ridotta. una distribuzione leggera non significa che non utilizziamo sufficiente potenza di calcolo. il sistema utilizza il cloud ibrido e la potenza di calcolo hpc dietro il sistema, ma è confezionato come accesso tramite browser per gli utenti. se si tratta di scenari di privatizzazione, dobbiamo anche implementare il sistema di potenza di calcolo dietro di esso, che non è richiesto su saas.
in generale, le grandi imprese devono essere privatizzate. poiché hanno requisiti particolarmente elevati in termini di riservatezza dei dati, in alcuni scenari simili all’insegnamento o in alcuni istituti di ricerca, possono essere utilizzati temporaneamente per un determinato argomento senza un’implementazione privatizzata.
d: come sono i progressi effettivi del progetto con le attuali imprese cooperative? in quale fase esattamente?
un:la nostra collaborazione con le aziende farmaceutiche riguarda principalmente il processo di calcolo. l'azienda non produce farmaci, quindi non partecipa al processo di sviluppo dei farmaci delle aziende farmaceutiche.
siamo fondamentalmente un carico a tutto tondo. ora stiamo provando anche alcune nuove aree ed esplorazioni, come l’integrazione di software in laboratori automatizzati che si concentrano sulla ricerca e sullo sviluppo di hardware, in modo da servire congiuntamente più aziende, perché le esigenze delle aziende farmaceutiche sono. ancora abbastanza grande. che complicato.
e in termini di entrate, le nostre entrate lo scorso anno hanno superato i 100 milioni.
esistono due modelli di business per la nostra cooperazione con le aziende farmaceutiche: uno è la vendita di software e l'altro è la ricerca e sviluppo congiunti.
molte grandi aziende si dispiegheranno a livello locale e possono permettersi di supportare i propri team e disporre di fondi sufficienti per sostenere l'acquisto di software. tuttavia, alcune potrebbero essere aziende farmaceutiche di medie dimensioni o nuove e innovative che non dispongono di strumenti di produzione avanzati e dei talenti corrispondenti per sostenerli utilizzano questi strumenti, scelgono di svilupparli insieme a noi. possiamo aiutarli a fare più calcoli poiché si tratta di sicurezza dei dati e delle informazioni, l'integrazione tra le due parti è particolarmente stretta.
ma molte grandi aziende farmaceutiche dispongono di fondi e talento sufficienti e sperano persino che possiamo fornire loro alcuni servizi personalizzati fornendo loro saas.
il futuro dell’intelligenza artificiale per la scienza
d: ho visto diverse classificazioni attuali degli algoritmi, che sono molto simili alle cinque classificazioni della guida autonoma. quale stato possiamo raggiungere nella fase l2? in che misura può sostituire il precedente modello sperimentale? puoi fornire un esempio di uno scenario specifico?
un:nello scenario l2, lo chiamiamo più vicino all'accuratezza sperimentale e più orientato alle persone, per assistere gli esseri umani e ridurre la pressione sperimentale. poiché esistono grandi differenze tra i diversi sistemi nella progettazione dei farmaci, in alcuni sistemi siamo stati in grado di raggiungere un'accuratezza prossima a quella sperimentale. quindi non è che gli utenti non abbiano bisogno di fare esperimenti, ma posso aiutare gli utenti a fare cose più basilari, come lo screening molecolare. potrebbero essere 1 milione di composti farmaceutici che l'intelligenza artificiale può aiutare gli utenti a individuare centinaia di migliaia fine, forse il resto richiede che i ricercatori scientifici conducano una verifica sperimentale e la portata sperimentale sarà notevolmente ridotta.
d: quali sono le difficoltà nel passaggio da l2 a l3?
un:la mia comprensione di questo l3 è che l’intelligenza artificiale può fornire risultati direttamente, il che equivale a sostituire direttamente gli esperimenti umani in determinati scenari. la difficoltà di raggiungere l3 risiede principalmente nel fatto che la precisione di ciascun collegamento deve raggiungere un certo livello. inoltre, sono coinvolti molti algoritmi e anche l'integrazione di vari algoritmi è una difficoltà. l'integrazione degli algoritmi è in realtà simile a un sistema di flusso di lavoro completo e questo sistema può revisionarsi e ottimizzarsi continuamente.
d: ci sono iterazioni nella tecnologia complessiva dal passato al presente? e ci saranno dei colli di bottiglia nello sviluppo del modello attuale?
un:al momento, eseguiamo costantemente l'iterazione di vari algoritmi basati sui dati, in particolare sui prodotti comunemente utilizzati dagli utenti. l'iterazione dell'algoritmo è più veloce. ad esempio, il nostro prodotto dpa è stato aggiornato dalla 1a generazione alla 2a generazione è che la prima generazione può supportare la pre-formazione in un unico campo, mentre la seconda generazione può eseguire contemporaneamente la formazione parallela sulla base di set di dati con metodi di annotazione diversi.
il collo di bottiglia deriva principalmente dai dati. nel campo dell’informatica scientifica, le fonti di dati non sono diffuse e non ci sono molti set di dati pubblici. pertanto, gran parte del nostro lavoro ora è come migliorare sempre di più l’effetto formativo del modello sulla base di piccoli set di dati.
inoltre, c'è un'altra cosa a cui prestare attenzione, ovvero la questione dell'interpretabilità. poiché i requisiti del calcolo scientifico sono più rigorosi e i requisiti per l'interpretabilità sono più elevati, stiamo ora cercando di migliorare l'interpretabilità del modello esponendo parametri. percorsi di traduzione, ecc. sesso.
d: come risolvere il problema della scarsità di dati?
un:nel campo dell'intelligenza artificiale per la scienza, sia nel campo dei materiali che in quello della medicina, i principi fisici più basilari a livello micro sono gli stessi, quindi il vantaggio è che i dati in alcuni campi dei materiali possono essere riutilizzati direttamente in campo medico. ad esempio, dpa 2 può essere basato su i dati forniti in diversi sistemi standard aiutano gli utenti ad addestrare un modello unificato. quindi, quando questo insieme di modelli viene applicato specificamente al settore, una piccola quantità di dati può essere utilizzata per la messa a punto.
non siamo ancora stati coinvolti nel mercato del toc, ma il nostro sistema ha già coperto alcuni scenari di insegnamento. disponiamo di una piattaforma di ricerca scientifica che integra insegnamento, ricerca e applicazione. i clienti attuali che affrontiamo principalmente sono le università e alcuni utenti più orientati al consumatore. per i college e le università avremo una piattaforma di formazione pratica simile per gli insegnanti. questa piattaforma può supportare tutto, dall'insegnamento agli studenti che frequentano le lezioni, all'utilizzo e persino all'implementazione dei risultati della ricerca.
domanda: ai fqual è il futuro spazio di sviluppo del mercato della scienza?
un:penso che lo spazio di mercato sia abbastanza grande. che si tratti di ricerca scientifica, medicina o materiali, l’aggiunta dell’intelligenza artificiale, almeno a livello sperimentale, può effettivamente risolvere problemi, aiutare i ricercatori scientifici a migliorare i risultati sperimentali e ridurre il carico sperimentale.
in termini di accettazione complessiva da parte dei clienti, parte del costo per noi in molti scenari è educare gli utenti. ad esempio, nel campo dei farmaci, stabiliamo rapporti di cooperazione a lungo termine con i clienti perché dobbiamo accompagnarli attraverso l'intero ciclo di verifica. .
in confronto, il campo dei materiali è molto più veloce: ad esempio, il ciclo di ricerca e sviluppo delle batterie è molto veloce. se l’effetto del rapporto elettrolitico è previsto dall’intelligenza artificiale, sarà sufficiente effettuare la verifica della preparazione.
a livello nazionale, il ministero della scienza e della tecnologia, insieme alla natural science foundation of china, ha lanciato uno speciale dispiegamento di al for science. ciò dimostra inoltre che tutti, dal livello socioeconomico alla macropolitica nazionale, sono ottimisti e lo sostengono fortemente. questa è sicuramente una direzione futura, senza dubbio.
d: l’intelligenza artificiale per la scienza è ancora nelle sue fasi iniziali. a quale stadio si svilupperà nei prossimi tre anni?
un:penso che almeno tutti i clienti avranno una comprensione unificata di questa questione. ora tutti hanno iniziato ad abbracciare attivamente l’intelligenza artificiale e la loro comprensione dell’intelligenza artificiale ha raggiunto un livello più elevato. tutti i settori non si sentiranno estranei o disgustati da questa parola e avranno un atteggiamento relativamente positivo. il prossimo passo è come possiamo stabilire un rapporto di cooperazione simile alla co-creazione con i nostri clienti. dopotutto, questo settore è sensibile ai dati. al traguardo dei tre anni, speriamo anche di essere in grado di aiutare i clienti a elaborare alcuni scenari pratici di implementazione.
in effetti, penso che se si considera il valore in modo più chiaro, l'accettazione da parte dei clienti è ancora piuttosto elevata, perché in generale, che si tratti delle aziende farmaceutiche o delle nuove energie appena menzionate, tutti prestano sempre più attenzione agli investimenti in innovazione. speriamo anche di contribuire a innovare l'intero paradigma della ricerca scientifica, comprese le infrastrutture di ricerca scientifica e gli scenari di livello superiore. attraverso la nostra piattaforma di ricerca scientifica, possiamo collegarli e potenziare vari settori.