νέα

τι να κάνετε εάν οι άνθρωποι ξεμείνουν από δεδομένα; ο xiao yanghua, καθηγητής στο πανεπιστήμιο fudan, πρότεινε δύο λύσεις:

2024-09-07

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

το red star capital bureau ανέφερε στις 7 σεπτεμβρίου ότι στην εποχή των μεγάλων δεδομένων, η αξία των δεδομένων δεν έχει ακόμη διερευνηθεί πλήρως. τεχνολογία δεδομένων ένα καυτό πεδίο. σύμφωνα με μια έκθεση που κυκλοφόρησε από τον ερευνητικό οργανισμό epoch ai τον ιούνιο, από το 2026, ο όγκος των νέων δεδομένων που θα δημιουργούνται από τον άνθρωπο θα είναι μικρότερος από τον όγκο των νέων δεδομένων που μαθαίνουν τα μοντέλα δεδομένα μέχρι το 2028.
τα δεδομένα καθορίζουν το ανώτερο όριο της νοημοσύνης σε κάποιο βαθμό, γεγονός που κάνει όσο περισσότερες ανακαλύψεις στην τεχνολογία μεγάλων μοντέλων, τόσο περισσότερη τεχνολογία δεδομένων πρέπει να «ευθυγραμμίζεται» με αυτήν.
κατά τη διάρκεια της διάσκεψης bund του 2024, ο xiao yanghua, καθηγητής στο πανεπιστήμιο fudan και διευθυντής του βασικού εργαστηρίου δεδομένων της σαγκάης, είπε σε συνέντευξή του στο red star capital bureau και άλλα μέσα ενημέρωσης ότι μπορεί να υπάρχουν δύο δρόμοι για να λυθεί το πρόβλημα της εξάντλησης δεδομένων στο μέλλον. το πρώτο είναι συνθετικά δεδομένα και το άλλο πηγαίνει στον ιδιωτικό τομέα.
xiao yanghua
"πολλοί άνθρωποι έχουν σχολιάσει τα τέσσερα βιβλία και τα πέντε κλασικά. η διαδικασία σχολιασμού είναι σαν τη διαδικασία σύνθεσης δεδομένων. μπορούμε συνεχώς να σκεφτόμαστε, να συσχετίζουμε και να ενσωματώνουμε τα αρχικά δεδομένα για να δημιουργήσουμε περισσότερα δεδομένα. αυτά είναι συνθετικά δεδομένα." , τα συνθετικά δεδομένα είναι μια πολύ σημαντική ιδέα. όχι μόνο για να μετριάσει το πρόβλημα της εξάντλησης δεδομένων, έχει επίσης πολύ σημαντική σημασία.
«τα περισσότερα από τα δεδομένα που συνθέτουμε είναι τα δεδομένα της διαδικασίας σκέψης μας, μέσω των συνθετικών δεδομένων, εκφράζεται ένας μεγάλος όγκος δεδομένων που είναι άρρητοι, μη εκφρασμένες και εστιασμένες στη σκέψη ικανότητα μεγάλων μοντέλων.
ο xiao yanghua ανέφερε ότι το τρέχον μεγάλο μοντέλο μας "έχει μόνο ευφυΐα και δεν έχει ορθολογισμό". τα συνθετικά δεδομένα είναι μια πολύ σημαντική ιδέα για τη βελτίωση της ορθολογικής ικανότητας.
"χρησιμοποιήστε συνθετικά δεδομένα που προσομοιώνουν τη διαδικασία σκέψης για να εκπαιδεύσετε ένα μεγάλο μοντέλο, έτσι ώστε να μπορεί να ξέρει πώς να σκέφτεται τα προβλήματα. επομένως, τα συνθετικά δεδομένα δεν είναι μόνο για να ανακουφίσουν τον "λιμό" δεδομένων, αλλά και για να βελτιώσουν την ορθολογική ικανότητα του μεγάλου μοντέλου ."
μια άλλη πολύ σημαντική ιδέα που αναφέρθηκε από τον xiao yanghua είναι να μεταβείτε στον ιδιωτικό τομέα. "περισσότερα δεδομένα υψηλής ποιότητας, υψηλής αξίας βρίσκονται στον ιδιωτικό τομέα, σε κάθετες βιομηχανίες, σε χιλιάδες κλάδους και πιο κάτω είναι προσωπικά δεδομένα. έτσι, ο ιδιωτικός τομέας και τα άτομα εξακολουθούν να έχουν πολλά πολύτιμα, πολύ πρωτότυπα και πραγματικά δεδομένα, όμως, δεν έχουμε ενεργοποιήσει αυτά τα δεδομένα και δεν τα έχουμε εγχύσει ακόμη στο μεγάλο μοντέλο πράγμα στο μέλλον».
ο xiao yanghua είπε ότι όλα τα δεδομένα ιδιωτικού τομέα βρίσκονται σε συστήματα βάσεων δεδομένων. εάν μπορείτε να χρησιμοποιήσετε δεδομένα ιδιωτικού τομέα για να εκπαιδεύσετε μεγάλα μοντέλα, είναι δυνατό να μετατρέψετε μεγάλα μοντέλα σε ειδικούς του κλάδου.
"τα σημερινά μεγάλα μοντέλα διαθέτουν μόνο γενικές γνώσεις και δεν διαθέτουν τα προσόντα για επαγγελματικές εργασίες. για να επιτευχθεί αυτό, η καλή χρήση δεδομένων ιδιωτικού τομέα μπορεί να είναι το κλειδί, επομένως οι δυνατότητες αξιοποίησης δεδομένων είναι ακόμα πολύ μεγάλες."
ο xiao yanghua ανυπομονούσε επίσης για τα "προσωπικά δεδομένα". πιστεύει ότι το επόμενο βήμα πρέπει να είναι ο συνδυασμός προσωπικών δεδομένων με μεγάλα μοντέλα υπάρχουν ακόμη μεγάλες δυνατότητες υπάρχει ακόμη πολύς δρόμος.
ο ρεπόρτερ του red star news wang tian
συντάκτης deng lingyao
(κατεβάστε red star news και υποβάλετε τις αναφορές σας για να κερδίσετε βραβεία!)
αναφορά/σχόλια