νέα

πώς να χρησιμοποιήσετε την τεχνητή νοημοσύνη για να αλλάξετε την επιστήμη;

2024-09-26

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

κείμενο |. λευκό περιστέρι

συντάκτης|wang yisu

«η υποκείμενη λογική της τεχνητής νοημοσύνης για την επιστήμη είναι διαφορετική από την τρέχουσα λογική εκπαίδευσης των μεγάλων γλωσσικών μοντέλων, ο lu jintan, τεχνικός διευθυντής της shenzhen technology, είπε ωμά ότι η τρέχουσα λογική της τεχνητής νοημοσύνης στον τομέα της επιστημονικής έρευνας και της εφαρμογής μεγάλων γλωσσών». τα γλωσσικά μοντέλα σε άλλους κλάδους δεν είναι τα ίδια.

είναι γνωστό στη βιομηχανία ότι η εκπαίδευση μεγάλων γλωσσικών μοντέλων βασίζεται στην «τροφοδοσία» δεδομένων υψηλής ποιότητας, τόσο ισχυρότερη είναι η ικανότητα του μεγάλου γλωσσικού μοντέλου. ωστόσο, σε ορισμένους συγκεκριμένους τομείς επιστημονικής έρευνας, ο όγκος των δεδομένων είναι σχετικά περιορισμένος. για παράδειγμα, για ορισμένους τύπους πρωτεϊνικών δομών, μπορεί να χρειαστούν αρκετά χρόνια για να ληφθούν εκατοντάδες πειραματικά δεδομένα υψηλής ποιότητας.

αυτό σημαίνει επίσης ότι η εφαρμογή της τεχνητής νοημοσύνης στον τομέα της επιστημονικής έρευνας απαιτεί σχετικά λιγότερα δεδομένα για να επιτευχθούν καλύτερα αποτελέσματα μοντέλων.

πώς ακριβώς αλλάζει η τεχνητή νοημοσύνη την επιστήμη; και πώς να διατρέξετε το επιχειρηματικό μοντέλο; ως μία από τις αντιπροσωπευτικές εταιρείες της ai για την επιστήμη, η shenzhen technology έχει δώσει τη δική της σκέψη και λύσεις.

στην παραδοσιακή επιστημονική πληροφορική, εάν θέλετε να προβλέψετε τις φυσικές ιδιότητες των μορίων και των ατόμων μέσω των δομικών τους πληροφοριών, συνήθως χρειάζεται να κάνετε μικροσκοπικούς υπολογισμούς σε συνδυασμό με πρακτικά προβλήματα. επί του παρόντος, ο κλάδος εξακολουθεί να λείπει από την πραγματοποίηση αυτής της υπολογιστικής ικανότητας πολλαπλής κλίμακας και βασίζεται περισσότερο στην εμπειρική κρίση και την πειραματική επαλήθευση.

ταυτόχρονα, με την επέκταση της κλίμακας των υπολογιστικών συστημάτων, ο αριθμός των υπολογισμών στους παραδοσιακούς επιστημονικούς υπολογισμούς έχει αυξηθεί εκθετικά, φτάνοντας συχνά σε δεκάδες χιλιάδες ή και εκατοντάδες εκατομμύρια συστήματα ατομικής κλίμακας μοντέλα, ο συνολικός χρόνος υπολογισμού θα είναι ο κύκλος μπορεί να είναι πολύ μεγάλος.

«η τεχνολογία shenzhen μπορεί να κάνει το μοντέλο να παράγει αποτελέσματα υπολογισμού που είναι κοντά στην ακρίβεια του φυσικού μοντέλου και ταυτόχρονα να βελτιώσει σημαντικά την απόδοση υπολογισμού, είπε ο lu jintan: «χρησιμοποιούμε τεχνητή νοημοσύνη για να ταιριάξουμε αυτές τις φυσικές μεθόδους προηγουμένως απαιτούσαν μεγάλους υπολογισμούς τα πράγματα γίνονται πιο γρήγορα».

λαμβάνοντας ως παράδειγμα την αναγνώριση εικόνας, ο πυρήνας της είναι να αναλύσει τις πληροφορίες εικονοστοιχείων της εικόνας εισάγοντας ένα συνελικτικό νευρωνικό δίκτυο, μπορεί να εξαγάγει τοπικά χαρακτηριστικά στην εικόνα, να αποσυνθέτει την αρχική εικόνα σε διαφορετικούς χάρτες χαρακτηριστικών και να εκτελεί κατά προσέγγιση λύση μέσω χαρακτηριστικών. συνδυασμός αυτό είναι στην πραγματικότητα είναι μια ανάλυση μείωσης διαστάσεων.

στην πραγματικότητα, η τεχνητή νοημοσύνη είναι επίσης μια εφαρμογή μείωσης διαστάσεων στον επιστημονικό τομέα. ταυτόχρονα, με βάση την πολυτροπική ικανότητα μεγάλου μοντέλου, μπορεί επίσης να επιτευχθεί πολυδιάστατη ανάλυση και πρόβλεψη διαφόρων τύπων δεδομένων όπως μοριακή δομή, φυσικές ιδιότητες, πειραματικά δεδομένα κ.λπ.

για παράδειγμα, στη διαδικασία ανακάλυψης φαρμάκου, είναι συνήθως απαραίτητο να αναλυθεί πρώτα η δομή της πρωτεΐνης και τα σημεία-στόχοι και στη συνέχεια να εξακριβωθούν υποψήφιες ενώσεις με υψηλή συγγένεια στα σημεία στόχου από εκατοντάδες χιλιάδες ή και εκατομμύρια βιβλιοθήκες ενώσεων. συνήθως πραγματοποιούνται πολυδιάστατες αξιολογήσεις, συμπεριλαμβανομένης της ανάλυσης συγγένειας, της πρόβλεψης και της αξιολόγησης των φαρμακευτικών χημικών ιδιοτήτων (όπως τοξικότητα, απορρόφηση, μεταβολισμός κ.λπ.).

"στον τομέα της τεχνητής νοημοσύνης για την επιστήμη, το κλειδί για μεγάλα μοντέλα που υποστηρίζουν υπολογισμούς διασταυρούμενης κλίμακας έγκειται στην τεράστια κλίμακα παραμέτρων και τις ισχυρές δυνατότητες γενίκευσης. ο τεράστιος αριθμός παραμέτρων του μοντέλου του επιτρέπει να καταγράφει πολύπλοκα φυσικά, χημικά και βιολογικά φαινόμενα. και η ισχυρή ικανότητα γενίκευσης "το βασικό μοντέλο μπορεί να προβλέψει τις σχετικές ιδιότητες του φαρμάκου με βάση τη μικροδομή του, και μπορεί επίσης να εφαρμοστεί στο πεδίο των υλικών όταν το μοντέλο μεταφέρεται. αναλύοντας τη μικροδομή των υλικών, μπορούμε να προβλέψουμε." τη σταθερότητα και άλλες φυσικές καταστάσεις των υλικών κάτω από διαφορετικές θερμοκρασίες και πιέσεις».

επομένως, η κατανόηση των βασικών γενικών μοντέλων στο ai for science από την shenzhen technology έγκειται περισσότερο στην ύπαρξη ενός συνόλου βασικών μοντέλων προ-εκπαίδευσης αυτό το μοντέλο μπορεί να εφαρμοστεί σε διάφορους βιομηχανικούς τομείς για την επίλυση προβλημάτων μέσω λεπτομέρειας.

πολλά βασικά μοντέλα που μελετώνται επί του παρόντος από την τεχνολογία shenzhen εξακολουθούν να έχουν καλά αποτελέσματα με περιορισμένη εκπαίδευση δεδομένων και μπορούν να βελτιστοποιηθούν περαιτέρω και να αναθεωρηθούν με βάση τα δεδομένα υψηλότερης ποιότητας που λαμβάνονται. στο πλαίσιο αυτού του συστήματος μοντέλων, το να επιτραπεί στην τεχνητή νοημοσύνη να μάθει η ίδια βασικές επιστημονικές αρχές και μέσω πρόσθετης εκπαίδευσης με μικρό όγκο δεδομένων τομέα μπορεί ήδη να επιτύχει καλά αποτελέσματα, κάτι που είναι ελαφρώς διαφορετικό από τα μεγάλα γλωσσικά μοντέλα.

ο lu jintan είπε στο light cone intelligence, «οι πηγές δεδομένων στον τομέα των επιστημονικών υπολογιστών δεν είναι ευρέως διαδεδομένες και δεν υπάρχουν πολλά δημόσια σύνολα δεδομένων, επομένως ένα μεγάλο μέρος της δουλειάς μας τώρα είναι πώς να κάνουμε το αποτέλεσμα εκπαίδευσης του μοντέλου περισσότερο και πιο αποτελεσματικό με βάση μικρά σύνολα δεδομένων, τόσο το καλύτερο.

τα τελευταία δύο χρόνια, η shenzhen technology κυκλοφόρησε επίσης με επιτυχία μια σειρά από μεγάλα βιομηχανικά μοντέλα, όπως το μοντέλο μοριακής προσομοίωσης dpa, το μοντέλο μοριακής διαμόρφωσης 3d uni-mol, το μοντέλο αναδίπλωσης πρωτεΐνης uni-fold, το μοντέλο δομής νουκλεϊκού οξέος uni-rna, το uni -βάλε μηχανή σύνδεσης μορίων φαρμάκου υψηλής απόδοσης και επιστημονική βιβλιογραφία uni-smart πολυτροπικό μοντέλο μεγάλης γλώσσας κ.λπ.

σύμφωνα με τον lu jintan, η shenzhen technology διαθέτει επί του παρόντος εκατοντάδες μοντέλα στους τομείς των υλικών και των φαρμάκων, και αυτά τα μοντέλα έχουν επίσης ενσωματωθεί με επιτυχία στην πλατφόρμα προϊόντων της shenzhen technology.ταυτόχρονα, η shenzhen technology έχει επίσης πετύχει στρατηγική συνεργασία με δεκάδες κορυφαίες φαρμακευτικές εταιρείες του κλάδου και θα επιτύχει καινοτομίες στην εμπορευματοποίηση το 2023, με έσοδα που ξεπερνούν τα 100 εκατομμύρια.

προς το παρόν, η επιχείρηση της shenzhen technology έχει καλύψει την έξυπνη εκπαίδευση σε πανεπιστήμια, τη βιοϊατρική έρευνα και ανάπτυξη και νέα υλικά μπαταρίας.

ωστόσο, σύμφωνα με την τρέχουσα ταξινόμηση αλγορίθμου της τεχνητής νοημοσύνης για την επιστήμη, η συνολική ανάπτυξη βρίσκεται ακόμη στο στάδιο l2, το οποίο είναι κοντά στην πειραματική ακρίβεια, είναι ακόμα πιο προσανατολισμένο στους ανθρώπους, χρησιμοποιώντας υπολογισμούς μοντέλων για να βοηθήσει τους ανθρώπους και να μειώσει το άγχος.

στο στάδιο l3, η τεχνητή νοημοσύνη μπορεί να δώσει άμεσα αποτελέσματα και σε ορισμένα σενάρια μπορεί να αντικαταστήσει άμεσα τα ανθρώπινα πειράματα.

εάν θέλετε να μετακινηθείτε από το l2 στο l3, "η κύρια δυσκολία είναι ότι η ακρίβεια κάθε συνδέσμου πρέπει να φτάσει ένα ορισμένο ύψος. ταυτόχρονα, το πώς να ενσωματώσετε τους αλγόριθμους σε κάθε σύνδεσμο είναι επίσης μια μεγάλη πρόκληση." είπε.

αντιμετωπίζοντας το μέλλον, ο lu jintan πιστεύει ότι ο χώρος της αγοράς για την τεχνητή νοημοσύνη για την επιστήμη είναι αρκετά μεγάλος είτε πρόκειται για εκπαίδευση και επιστημονική έρευνα, βιοϊατρική ή υλικά μπαταρίας, η προσθήκη της τεχνητής νοημοσύνης μπορεί πραγματικά να λύσει πολλά θεμελιώδη προβλήματα, τουλάχιστον σε πειραματικό επίπεδο. , και ενδυναμώστε τους ανθρώπους η βιομηχανία, η εξερεύνηση στα σύνορα κ.λπ. παρέχουν περισσότερες ιδέες και σημεία εισόδου.

ακολουθεί η λεπτομερής συνομιλία μεταξύ της guangcone intelligence και του lu jintan, του τεχνικού διευθυντή της shenzhen technology (διαγράφηκε και επεξεργάστηκε από την guangcone intelligence):

η τεχνολογία shenzhen χρησιμοποιεί ai

βελτίωση της ποιότητας και της αποτελεσματικότητας για την επιστημονική έρευνα και ανάπτυξη

ε: τα μεγάλα μοντέλα έχουν αλλάξει την επεξεργασία της φυσικής γλώσσας, τη δημιουργία βίντεο και εικόνων πώς έχουν αλλάξει την επιστήμη;

ενα:τα μεγάλα γλωσσικά μοντέλα έχουν αρχίσει να χρησιμοποιούνται σε πληροφορίες για την εξόρυξη διπλωμάτων ευρεσιτεχνίας και άλλα πεδία. τα ονομάζουμε λογοτεχνικά μεγάλα μοντέλα θα κάνει επίσης μερικές πολυτροπικές εφαρμογές, όπως ερμηνεία εικόνων και γραφημάτων.

στην παραδοσιακή επιστημονική πληροφορική, τα προβλήματα που αντιμετωπίζονται συχνά είναι από μικροκλίμακες έως μακροοικονομικές κλίμακες. χρησιμοποιούνται διαφορετικά φυσικά μοντέλα για την επίλυση προβλημάτων, αλλά οι δυνατότητες εξακολουθούν να λείπουν σε ορισμένα υπολογιστικά σενάρια. για παράδειγμα, αν θέλουμε να προβλέψουμε τις μακροσκοπικές ιδιότητες ενός μορίου μέσω των δομικών πληροφοριών των ατόμων του, χρειαζόμαστε την ικανότητα να μοντελοποιούμε σε κλίμακες.

η τεχνητή νοημοσύνη περιλαμβάνει μεγάλα μοντέλα, τα οποία μπορούν να επιτύχουν διασταυρούμενη μοντελοποίηση με την εκμάθηση αυτών των φυσικών μοντέλων και στη συνέχεια την εφαρμογή τους σε συγκεκριμένα προβλήματα, αυτά τα προβλήματα μπορούν να λυθούν καλά.

συνήθως χρειάζεται να εκτελούμε υπολογισμούς μεγάλης απόδοσης, συχνά σε συστήματα με δεκάδες χιλιάδες ή και εκατοντάδες εκατομμύρια άτομα εάν οι υπολογισμοί βασίζονται σε φυσικά μοντέλα, η χρονική περίοδος θα είναι σχετικά μεγάλη. αυτό που κάνει η shenshi technology εδώ είναι να επιτρέπει στο μοντέλο να παράγει αποτελέσματα υπολογισμού που είναι κοντά στην ακρίβεια του φυσικού μοντέλου και ταυτόχρονα μπορεί να βελτιώσει σημαντικά την απόδοση του υπολογιστή.

ε: πώς να μετατρέψετε υπολογισμούς σε κλίμακα συστήματος εκατοντάδων εκατομμυρίων ατόμων σε υπολογισμούς στο πεδίο μεγάλων μοντέλων ποιος είναι κατά προσέγγιση ο αριθμός των υπολογισμών;

ενα:σε μικροσκοπική κλίμακα, η αλληλεπίδραση μεταξύ δύο ατόμων μπορεί να αναλυθεί μέσω φυσικών μοντέλων, όπως μέσω της κλασικής μηχανικής ή των εξισώσεων της κβαντομηχανικής, για τον υπολογισμό της δύναμης αλληλεπίδρασης και της τροχιάς κίνησης μεταξύ τους. αυτή τη στιγμή, ο υπολογισμός χρειάζεται μόνο να εξετάσει την αμοιβαία επίδραση δύο ατόμων και το πρόβλημα είναι σχετικά απλό. ωστόσο, όσο αυξάνεται ο αριθμός των ατόμων στο σύστημα, η κατάσταση γίνεται πιο περίπλοκη. για παράδειγμα, όταν εισάγεται ένα τρίτο άτομο, εκτός από την εξέταση της αλληλεπίδρασης ανά ζεύγη μεταξύ κάθε ατόμου, πρέπει επίσης να αναλυθεί το φαινόμενο πολλών σωμάτων μεταξύ των τριών. αυτή τη στιγμή, η αλληλεπίδραση και η τροχιά μεταξύ των ατόμων όχι μόνο εξαρτώνται από τα δύο άτομα, αλλά καθορίζονται από κοινού από την κατάσταση ολόκληρου του συστήματος και το ποσό του υπολογισμού αυξάνεται μη γραμμικά. οι επιστήμονες εισάγουν συχνά αλγόριθμους προσέγγισης, όπως η συναρτησιακή θεωρία πυκνότητας ή προσομοιώσεις μοριακής δυναμικής, για να χειριστούν αποτελεσματικά τους υπολογισμούς σε διαφορετικές κλίμακες.

αυτό που έκανε η τεχνητή νοημοσύνη μας τις πρώτες μέρες ήταν στην πραγματικότητα να χρησιμοποιήσει την τεχνητή νοημοσύνη για να χωρέσει αυτές τις φυσικές εξισώσεις και να βελτιώσει την απόδοση των υπολογιστών. μπορεί να συγκριθεί με την αναγνώριση εικόνας το βασικό του σημείο είναι ότι αναλύει διάφορα εικονοστοιχεία. αυτό που κάναμε στις πρώτες μέρες της τεχνητής νοημοσύνης στον τομέα των επιστημονικών υπολογιστών μπορεί επίσης να θεωρηθεί ως μια δράση μείωσης διαστάσεων, δηλαδή να κάνουμε πράγματα που μπορεί να απαιτούσαν προηγουμένως μεγάλο αριθμό υπολογισμών πιο γρήγορα.

ε: ποια είναι η διαφορά μεταξύ των μεθόδων υπολογισμού της παραδοσιακής τεχνητής νοημοσύνης και της εμφάνισης μεγάλων μοντέλων;

ενα:ο ορισμός ενός μεγάλου μοντέλου είναι σχετικά ασαφής και ο αριθμός των παραμέτρων χρησιμοποιείται γενικά ως δείκτης όσο περισσότερες παράμετροι, τόσο μεγαλύτερος είναι ο υπολογισμός. για εμάς, έχει να κάνει περισσότερο με την παροχή υπολογισμών πολλαπλής κλίμακας. το τρέχον προεκπαιδευτικό μας μοντέλο, uni-mol, βασίζεται στην τρισδιάστατη δομή των μορίων και των ατόμων, προβλέπει σχετικές φυσικές ιδιότητες, καθιερώνει σχέσεις δομής-δραστηριότητας και τις λύνει απευθείας στο παρελθόν, οι προβλέψεις βασίζονταν συχνά σε πειράματα και εμπειρία. αυτή η μέθοδος συνδυάζει υπολογισμούς σε διαφορετικές κλίμακες και παρέχει νέες μεθόδους υπολογισμού για πεδία όπως η επιστήμη των υλικών.

όταν αντιμετωπίζουμε μεγάλα μοντέλα, γενικά δίνουμε μεγαλύτερη έμφαση στις δυνατότητες γενίκευσης μοντέλων. στον τομέα της τεχνητής νοημοσύνης για την επιστήμη, είναι σχετικά κοινό. για παράδειγμα, το βασικό μοντέλο μπορεί να προβλέψει ορισμένες ιδιότητες που σχετίζονται με το φάρμακο με βάση τη μικροδομή διαφορετικές θερμοκρασίες και πιέσεις, επομένως η κατανόησή μας για το βασικό γενικό μοντέλο της τεχνητής νοημοσύνης για την επιστήμη είναι περισσότερο ένα σύνολο βασικών μοντέλων προ-εκπαίδευσης.

ε: ποιος είναι ο κύριος ρόλος της πολυτροπικότητας;

ενα:περιλαμβάνει το συνδυασμό διαφορετικών τύπων δεδομένων, όπως μοριακή δομή, φυσικές ιδιότητες, πειραματικά δεδομένα κ.λπ., για ολοκληρωμένη ανάλυση. για παράδειγμα, στη διαδικασία ανακάλυψης φαρμάκου, είναι συνήθως απαραίτητο να αναλυθεί πρώτα η δομή της πρωτεΐνης και τα σημεία-στόχοι και στη συνέχεια να εξακριβωθούν ενώσεις με υψηλή συγγένεια με τα σημεία στόχου από εκατοντάδες χιλιάδες ή και εκατομμύρια βιβλιοθήκες ενώσεων , η διαδικασία μπορεί να περιλαμβάνει ανάλυση συγγένειας, ανάλυση φαρμακευτικών ιδιοτήτων, εάν είναι τοξική, εάν είναι ευεργετική για την απορρόφηση του ανθρώπινου σώματος κ.λπ. μπορεί να είναι μια πολυδιάστατη ανάλυση. επομένως, εάν θέλετε να επιτύχετε ένα καλύτερο αποτέλεσμα διαλογής, πρέπει να το αναλύσετε από πολλές γωνίες και ιδιότητες.

τα συνήθη προβλήματα πολλαπλών τρόπων, όπως εικόνες και βίντεο, μπορεί να είναι πιο κοντά στις πολυτροπικές εφαρμογές μας στην εξόρυξη δεδομένων εγγράφων , και οι πληροφορίες εικόνας πρέπει να πραγματοποιηθούν σε βάθος εξόρυξης, στη συνέχεια να ενσωματωθούν με πληροφορίες κειμένου και, τέλος, να εξάγονται τα αποτελέσματα. στη βιβλιογραφία, εφαρμόζουμε επίσης αυτή την κοινή πολυτροπική ικανότητα.

ε: πόσο μεγάλη είναι η ζήτηση για δεδομένα μοντέλων στον τομέα της τεχνητής νοημοσύνης για την επιστήμη;

ενα:διαφορετικά πεδία βέβαια, όσο περισσότερα τόσο καλύτερα υπάρχει και το θέμα της δυσκολίας απόκτησής τους. για παράδειγμα, στις τμηματοποιημένες εφαρμογές στον τομέα της βιοϊατρικής και στο πεδίο της μπαταρίας, η δυσκολία λήψης δεδομένων είναι διαφορετική σε βιομηχανίες με μεγάλους κύκλους ε&α και επαλήθευσης, η παραγωγή δεδομένων θα είναι σχετικά μικρή και η απόλυτη ποσότητα δεδομένων θα είναι περιορισμένη. . για παράδειγμα, για ορισμένους συγκεκριμένους τύπους πρωτεϊνικών δομών, μπορεί να υπάρχουν μόνο μερικές εκατοντάδες εγγραφές σε λίγα χρόνια, αλλά σε άλλους τομείς, τα δεδομένα είναι σίγουρα περισσότερα από αυτό.

ωστόσο, τα βασικά φυσικά μοντέλα μπορούν να δημιουργήσουν περισσότερα δεδομένα. σύμφωνα με το σύστημα μοντέλων μας, επιτρέποντας στην τεχνητή νοημοσύνη να μαθαίνει η ίδια βασικές επιστημονικές αρχές και μέσω πρόσθετης εκπαίδευσης με μικρό αριθμό δεδομένων τομέα μπορεί ήδη να επιτύχει καλά αποτελέσματα, κάτι που είναι ελαφρώς διαφορετικό από τα μεγάλα γλωσσικά μοντέλα.

ε: πώς να κάνετε την τεχνητή νοημοσύνη να μάθει τη βασική επιστημονική λογική και στη συνέχεια να λύσει συγκεκριμένα προβλήματα εφαρμογής;

ενα:γενικά, ορισμένα φυσικά μοντέλα χρησιμοποιούνται για την απευθείας εκτέλεση υπολογισμών και στη συνέχεια εκπαιδεύονται τα δεδομένα που προκύπτουν και στη συνέχεια προσομοιώνονται τα φυσικά μοντέλα.

ε: ποια είναι η σχέση μεταξύ του βασικού μεγάλου μοντέλου και των μεγάλων μοντέλων κάθε κάθετου τύπου; πρέπει να εκπαιδεύσω μόνος μου το βασικό μοντέλο μεγάλου μεγέθους ή να χρησιμοποιήσω ένα μεγάλο μοντέλο ανοιχτού κώδικα τρίτων;

ενα:τα διαφορετικά σενάρια είναι διαφορετικά εάν αναφέρεται σε ένα μεγάλο γλωσσικό μοντέλο, χρησιμοποιείται περισσότερο στην ερμηνεία εγγράφων, όπως η διερμηνεία σε χαρτί. η βασική εφαρμογή είναι η ερμηνεία ενός μόνο χαρτιού λόγω κόστους, θα χρησιμοποιηθούν ορισμένα γενικά μεγάλα μοντέλα για να με βοηθήσουν να ερμηνεύσω το χαρτί. εάν θέλουμε να ερμηνεύσουμε πολλαπλές εργασίες ή ακόμη και να πραγματοποιήσουμε μια συνολική αναζήτηση στη μεγάλη βιβλιοθήκη χαρτιού μας, συμπεριλαμβανομένης της αναζήτησης και ανάλυσης διπλωμάτων ευρεσιτεχνίας, τότε θα χρησιμοποιήσουμε το μοντέλο της βιβλιογραφίας που έχουμε αναπτύξει μόνοι μας για να διεξάγουμε πιο λεπτομερή ερμηνεία του χαρτιού.

ως εκ τούτου, εξακολουθούμε να εργαζόμαστε σε προϊόντα για τους χρήστες ενδέχεται να αποφασίσουμε ποιο μοντέλο είναι πιο κατάλληλο για τα προϊόντα μας και θα κάνουμε επίσης μια επιλογή με βάση το κόστος.

σήμερα, ονομάζουμε πολλά μοντέλα πιο προ-εκπαιδευτικά μοντέλα για παράδειγμα, το dpa που κυκλοφόρησε πέρυσι είναι ένα σύνολο μοντέλων προ-εκπαίδευσης για τον υπολογισμό πιθανών συναρτήσεων μεταξύ ατόμων διαφορετικών στοιχείων πριν από καιρό, ελπίζοντας ότι μπορεί να περάσει για να κινητοποιήσουμε κάποιες δυνάμεις ανοιχτού κώδικα, μπορούμε να συνεισφέρουμε και να μοιραστούμε δεδομένα μαζί για να εκπαιδεύσουμε το μοντέλο ώστε να είναι πιο ώριμο.

ε: πόσα μοντέλα έχει τώρα η shenzhen technology;

ενα:τώρα έχουμε εκατοντάδες μοντέλα στους τομείς των υλικών και της ιατρικής συνδυαστικά.

τα έσοδα ξεπέρασαν τα 100 εκατομμύρια, συνεργαζόμενοι με δεκάδες φαρμακευτικές εταιρείες

το επιχειρηματικό μοντέλο της shenzhen technology

ε: μπορείτε να μοιραστείτε την τελευταία πρόοδο έρευνας και ανάπτυξης της τεχνολογίας shenzhen στον τομέα της ιατρικής τεχνητής νοημοσύνης;

ενα:στον τομέα της ιατρικής, επί του παρόντος εστιάζουμε στην προκλινική έρευνα, καλύπτοντας σχεδόν όλα τα προκλινικά σενάρια υπολογιστών, όπως πρώιμη ανακάλυψη στόχων και ανάλυση δομής πρωτεΐνης, έως ανάλυση στόχων, μοριακό έλεγχο και ανάλυση συγγένειας, κ.λπ αυτή η σειρά συνδέσμων περιέχει πολλές τέτοιες μεθόδους υπολογισμού και τώρα έχουμε εφαρμόσει αλγόριθμους.

σε συνδυασμό με το ιατρικό σενάριο, συσκευάζουμε όλους αυτούς τους αλγόριθμους σε ένα προϊόν, το οποίο είναι η πλατφόρμα σχεδιασμού φαρμάκων μας, τώρα βασικά συνεργαζόμαστε με τις κορυφαίες 50 εγχώριες φαρμακευτικές εταιρείες σε διαφορετικούς τομείς, που αφορούν κυρίως τρεις πτυχές, η μία είναι η βιοτεχνολογία. , η μία είναι η cro (οργανισμός κλινικής έρευνας), και η άλλη η pharma (φαρμακευτική εταιρεία), καθεμία από τις οποίες έχει τη δική της αντιπροσωπευτική εταιρεία.

την περασμένη εβδομάδα, υπογράψαμε μια συμφωνία συνεργασίας με μια εγχώρια εισηγμένη εταιρεία, την eastern sunshine, η οποία παράγει το φάρμακο για τη γρίπη. επίσης, μόλις έλαβε τρεις πιστοποιήσεις πρώτης κατηγορίας στις ηνωμένες πολιτείες. συνεργασία.

εκτός από τυπικές εταιρείες στον βιοϊατρικό τομέα, όπως η dongguang sunshine, στην πραγματικότητα συνεργαζόμαστε με πολλά επιστημονικά ερευνητικά ιδρύματα και πανεπιστήμια που ασχολούνται με την έρευνα και την ανάπτυξη φαρμάκων, όπως το πανεπιστήμιο ιατρικών επιστημών της δυτικής κίνας, το νοσοκομείο xiangya και το ιατρικό κολλέγιο.

ε: τα τρέχοντα προϊόντα μας μπορούν πραγματικά να χρησιμοποιηθούν απευθείας χρησιμοποιώντας ένα πρόγραμμα περιήγησης και η συνολική ανάπτυξη είναι επίσης πολύ ελαφριά όλες οι βασικές μέθοδοι ανάπτυξης προϊόντων;

εναναι, τα περισσότερα από αυτά που εκτελούμε στο διαδίκτυο είναι εργασίες συμπερασμάτων τεχνητής νοημοσύνης σχετικά με τη λεπτή ρύθμιση του προ-εκπαιδευμένου μοντέλου μπορεί επίσης να πραγματοποιηθεί με μικρές παρτίδες δεδομένων και η πίεση μετάδοσης δεδομένων είναι επίσης μικρή. η ελαφριά ανάπτυξη δεν σημαίνει ότι δεν χρησιμοποιούμε αρκετή υπολογιστική ισχύ. εάν πρόκειται για κάποια σενάρια ιδιωτικοποίησης, πρέπει επίσης να αναπτύξουμε το σύστημα υπολογιστικής ισχύος πίσω από αυτό, το οποίο δεν απαιτείται στο saas.

σε γενικές γραμμές, οι μεγάλες επιχειρήσεις πρέπει να ιδιωτικοποιηθούν. επειδή έχουν ιδιαίτερα υψηλές απαιτήσεις για το απόρρητο των δεδομένων, σε ορισμένα σενάρια παρόμοια με τη διδασκαλία ή σε ορισμένα ερευνητικά ιδρύματα, ενδέχεται να χρησιμοποιηθούν προσωρινά για ένα συγκεκριμένο θέμα χωρίς την ανάγκη ιδιωτικοποιημένης ανάπτυξης.

ερ.: πώς είναι η πραγματική πρόοδος του έργου με τις σημερινές συνεταιριστικές επιχειρήσεις; σε ποιο στάδιο ακριβώς;

ενα:η συνεργασία μας με τις φαρμακευτικές εταιρείες είναι κυρίως στη διαδικασία υπολογισμού η εταιρεία δεν παράγει φάρμακα, άρα δεν συμμετέχει στη διαδικασία ανάπτυξης φαρμάκων των φαρμακευτικών εταιρειών.

βασικά είμαστε ένα φορτίο πλήρους συνδέσμου τώρα δοκιμάζουμε επίσης ορισμένους νέους τομείς και εξερευνήσεις, όπως η ενσωμάτωση λογισμικού σε αυτοματοποιημένα εργαστήρια που επικεντρώνονται στην έρευνα και ανάπτυξη υλικού, έτσι ώστε να εξυπηρετούνται από κοινού περισσότερες εταιρείες, επειδή οι ανάγκες των φαρμακευτικών εταιρειών είναι. ακόμα αρκετά μεγάλο.

και από πλευράς εσόδων, τα έσοδά μας πέρυσι ξεπέρασαν τα 100 εκατομμύρια.

υπάρχουν δύο επιχειρηματικά μοντέλα για τη συνεργασία μας με φαρμακευτικές εταιρείες, το ένα είναι η πώληση λογισμικού και το άλλο η κοινή έρευνα και ανάπτυξη.

πολλές μεγάλες εταιρείες θα αναπτύξουν τοπικά και μπορούν να αντέξουν οικονομικά να υποστηρίξουν τις δικές τους ομάδες και να έχουν επαρκή κεφάλαια για να υποστηρίξουν την αγορά λογισμικού με τη χρήση αυτών των εργαλείων, επιλέγουν να αναπτύξουν από κοινού μαζί μας. μπορούμε να τους βοηθήσουμε να κάνουν περισσότερους υπολογισμούς.

ωστόσο, πολλές μεγάλες φαρμακευτικές εταιρείες έχουν επαρκή κεφάλαια και ταλέντο, και ελπίζουν ακόμη ότι μπορούμε να τους παρέχουμε ορισμένες προσαρμοσμένες υπηρεσίες ενώ τους παρέχουμε saas.

το μέλλον της τεχνητής νοημοσύνης για την επιστήμη

ε: έχω δει πολλές τρέχουσες ταξινομήσεις αλγορίθμων, οι οποίες μοιάζουν πολύ με τις πέντε ταξινομήσεις της αυτόνομης οδήγησης σε ποια κατάσταση μπορούμε να φτάσουμε στο στάδιο l2; σε ποιο βαθμό μπορεί να αντικαταστήσει το προηγούμενο πειραματικό μοντέλο; μπορείτε να δώσετε ένα παράδειγμα περίπτωσης συγκεκριμένου σεναρίου;

ενα:στο σενάριο l2, το ονομάζουμε πιο κοντά στην πειραματική ακρίβεια και πιο προσανατολισμένο στους ανθρώπους, υπολογιστές για να βοηθήσουν τους ανθρώπους και να μειώσουν την πειραματική πίεση. επειδή υπάρχουν μεγάλες διαφορές μεταξύ διαφορετικών συστημάτων στον σχεδιασμό φαρμάκων, μπορέσαμε να επιτύχουμε σχεδόν πειραματική ακρίβεια σε ορισμένα συστήματα. δεν είναι λοιπόν ότι οι χρήστες δεν χρειάζεται να κάνουν καθόλου πειράματα, αλλά μπορώ να βοηθήσω τους χρήστες να κάνουν πιο βασικά πράγματα, όπως ο μοριακός έλεγχος. μπορεί να είναι 1 εκατομμύριο ενώσεις φαρμάκων τέλος, ίσως το υπόλοιπο απαιτεί από επιστημονικούς ερευνητές να διεξάγουν πειραματική επαλήθευση, και το πειραματικό μέγεθος θα μειωθεί πολύ.

ε: ποιες είναι οι δυσκολίες στη μετάβαση από το l2 στο l3;

ενα:η κατανόηση αυτού του l3 είναι ότι η τεχνητή νοημοσύνη μπορεί να δώσει άμεσα αποτελέσματα, κάτι που ισοδυναμεί με την άμεση αντικατάσταση ανθρώπινων πειραμάτων σε ορισμένα σενάρια. η δυσκολία επίτευξης l3 έγκειται κυρίως στο γεγονός ότι η ακρίβεια κάθε συνδέσμου πρέπει να φτάσει σε ένα ορισμένο επίπεδο, επιπλέον, εμπλέκονται πολλοί αλγόριθμοι και η ενσωμάτωση διαφόρων αλγορίθμων είναι επίσης μια δυσκολία. η ενοποίηση των αλγορίθμων είναι στην πραγματικότητα παρόμοια με ένα πλήρες σύστημα ροής εργασιών και αυτό το σύστημα μπορεί να επανεξετάζει και να βελτιστοποιεί συνεχώς τον εαυτό του.

ε: υπάρχουν επαναλήψεις στη συνολική τεχνολογία από το παρελθόν μέχρι σήμερα; και θα υπάρξουν εμπόδια στην ανάπτυξη του τρέχοντος μοντέλου;

ενα:επί του παρόντος, επαναλαμβάνουμε διαρκώς διάφορους αλγόριθμους που βασίζονται σε δεδομένα, ειδικά σε προϊόντα που χρησιμοποιούνται συνήθως από τους χρήστες είναι ότι η 1η γενιά μπορεί να υποστηρίζει προεκπαίδευση σε ένα μόνο πεδίο και η δεύτερη γενιά μπορεί να εκτελεί παράλληλη εκπαίδευση ταυτόχρονα με βάση σύνολα δεδομένων με διαφορετικές μεθόδους σχολιασμού.

η συμφόρηση προέρχεται κυρίως από δεδομένα στον τομέα των επιστημονικών υπολογιστών, οι πηγές δεδομένων δεν είναι ευρέως διαδεδομένες και δεν υπάρχουν πολλά δημόσια σύνολα δεδομένων βασίζονται σε μικρά σύνολα δεδομένων.

επιπλέον, υπάρχει ένα άλλο πρόσθετο πράγμα που πρέπει να προσέξουμε, το οποίο είναι το θέμα της ερμηνείας, επειδή οι επιστημονικές απαιτήσεις υπολογισμού είναι πιο αυστηρές και οι απαιτήσεις για ερμηνευτικότητα είναι υψηλότερες, προσπαθούμε τώρα να βελτιώσουμε την ερμηνευσιμότητα του μοντέλου εκθέτοντας παραμέτρους. μεταφραστικές διαδρομές κλπ. σεξ.

ε: πώς να λύσετε το πρόβλημα της σπανιότητας δεδομένων;

ενα:στον τομέα της τεχνητής νοημοσύνης για την επιστήμη, είτε είναι στον τομέα των υλικών είτε της ιατρικής, οι πιο βασικές φυσικές αρχές μικροεπιπέδου είναι οι ίδιες, επομένως το πλεονέκτημα είναι ότι τα δεδομένα σε ορισμένα πεδία υλικών μπορούν να επαναχρησιμοποιηθούν απευθείας στον ιατρικό τομέα. για παράδειγμα, το dpa 2 μπορεί να βασίζεται στο τα δεδομένα που παρέχονται σε διαφορετικά τυπικά συστήματα βοηθούν τους χρήστες να εκπαιδεύσουν ένα ενοποιημένο μοντέλο. στη συνέχεια, όταν αυτό το σύνολο μοντέλων εφαρμόζεται ειδικά στον κλάδο, μπορεί να χρησιμοποιηθεί ένας μικρός όγκος δεδομένων για τη λεπτομέρεια.

δεν έχουμε ακόμη εμπλακεί στην αγορά toc, αλλά το σύστημά μας έχει ήδη καλύψει ορισμένα σενάρια διδασκαλίας. έχουμε μια πλατφόρμα επιστημονικής έρευνας που ενσωματώνει τη διδασκαλία, την έρευνα και την εφαρμογή οι τρέχοντες πελάτες που αντιμετωπίζουμε κυρίως είναι πανεπιστήμια και ορισμένοι χρήστες που είναι πιο προσανατολισμένοι στον καταναλωτή. για τα κολέγια και τα πανεπιστήμια, θα έχουμε μια παρόμοια πλατφόρμα πρακτικής κατάρτισης για εκπαιδευτικούς αυτή η πλατφόρμα μπορεί να υποστηρίξει τα πάντα, από τη διδασκαλία έως τους μαθητές που παρακολουθούν μαθήματα, τη χρήση και ακόμη και την υλοποίηση ερευνητικών αποτελεσμάτων.

ε: ai fποιος είναι ο μελλοντικός χώρος ανάπτυξης της αγοράς ή της επιστήμης;

ενα:νομίζω ότι ο χώρος της αγοράς είναι αρκετά μεγάλος. είτε πρόκειται για επιστημονική έρευνα, ιατρική ή υλικά, η προσθήκη τεχνητής νοημοσύνης, τουλάχιστον σε πειραματικό επίπεδο, μπορεί πραγματικά να λύσει προβλήματα, να βοηθήσει τους επιστημονικούς ερευνητές να βελτιώσουν τα πειραματικά αποτελέσματα και να μειώσει τον πειραματικό φόρτο.

όσον αφορά τη συνολική αποδοχή των πελατών, μέρος του κόστους για εμάς σε πολλά σενάρια είναι η εκπαίδευση των χρηστών. για παράδειγμα, στον τομέα των ναρκωτικών, καθιερώνουμε μακροχρόνιες σχέσεις συνεργασίας με τους πελάτες, επειδή πρέπει να συνοδεύουμε τους πελάτες σε ολόκληρο τον κύκλο επαλήθευσης. .

συγκριτικά, το πεδίο των υλικών είναι πολύ πιο γρήγορο. για παράδειγμα, ο κύκλος έρευνας και ανάπτυξης των μπαταριών είναι πολύ γρήγορος.

σε εθνικό επίπεδο, το υπουργείο επιστήμης και τεχνολογίας, μαζί με το ίδρυμα φυσικών επιστημών της κίνας, ξεκίνησε το ειδικό έργο ανάπτυξης al for science. αυτό δείχνει επίσης ότι όλοι, από το κοινωνικοοικονομικό επίπεδο μέχρι την εθνική μακροπολιτική, είναι αισιόδοξοι και το υποστηρίζουν σθεναρά. αυτή είναι σίγουρα μια μελλοντική κατεύθυνση.

ε: η τεχνητή νοημοσύνη για την επιστήμη βρίσκεται ακόμα στα αρχικά της στάδια.

ενα:νομίζω ότι τουλάχιστον όλοι οι πελάτες θα έχουν ενιαία κατανόηση αυτού του θέματος. τώρα όλοι έχουν αρχίσει να αγκαλιάζουν ενεργά την τεχνητή νοημοσύνη και η κατανόησή τους για την τεχνητή νοημοσύνη έχει φτάσει σε υψηλότερο επίπεδο. όλες οι βιομηχανίες δεν θα αισθάνονται άγνωστοι ή απωθημένοι από αυτή τη λέξη και έχουν μια σχετικά θετική στάση. το επόμενο βήμα είναι πώς μπορούμε να δημιουργήσουμε μια σχέση συνεργασίας παρόμοια με τη συν-δημιουργία με τους πελάτες μας. στην τριετία, ελπίζουμε επίσης να μπορέσουμε να βοηθήσουμε τους πελάτες να βρουν κάποια πρακτικά σενάρια εφαρμογής.

στην πραγματικότητα, νομίζω ότι αν το σημείο αξίας μπορεί να εξεταστεί πιο ξεκάθαρα, η αποδοχή των πελατών εξακολουθεί να είναι αρκετά υψηλή, γιατί γενικά, είτε πρόκειται για φαρμακευτικές εταιρείες είτε για τη νέα ενέργεια που μόλις αναφέρθηκε, όλοι δίνουν όλο και μεγαλύτερη προσοχή στις επενδύσεις καινοτομίας. ελπίζουμε επίσης να βοηθήσουμε στην καινοτομία ολόκληρου του παραδείγματος επιστημονικής έρευνας, συμπεριλαμβανομένων των υποδομών επιστημονικής έρευνας και των σεναρίων ανώτερου επιπέδου μέσω της επιστημονικής μας ερευνητικής πλατφόρμας, μπορούμε να τα συνδέσουμε και να ενισχύσουμε διάφορες βιομηχανίες.