Νέα

Οι εταιρείες με αστέρια τεχνητής νοημοσύνης παλεύουν για μικρά μοντέλα, το κόστος πέφτει κατακόρυφα και εξοικονομούν περισσότερα στους λογαριασμούς ρεύματος, επιταχύνοντας τη διάδοση της τεχνητής νοημοσύνης

2024-07-22

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Έξυπνα πράγματα (δημόσιος λογαριασμός:zhidxcom
Συντάχθηκε από τον Meng Qiang
Συντάκτης Yunpeng

Σύμφωνα με αναφορές της Venture Beat, την περασμένη εβδομάδα, οι Hugging Face, Mistral AI και OpenAI παρουσίασαν τα αντίστοιχα μικρά μοντέλα τους (SLM) στις 16 και 18 Ιουλίου, υποσχόμενοι να φέρουν τις προηγμένες δυνατότητες επεξεργασίας φυσικής γλώσσας. Στο παρελθόν, οι εταιρείες τεχνολογίας έχουν ανταγωνιστεί για την επιδίωξη μεγαλύτερων και πιο σύνθετων νευρωνικών δικτύων στη μεγάλη γλωσσική πίστα μοντέλων Η Venture Beat πιστεύει ότι αυτά τα μικρά μοντέλα έχουν ανοίξει νέα κομμάτια και μπορεί επίσης να επηρεάσουν τον τρόπο με τον οποίο οι επιχειρήσεις χρησιμοποιούν λύσεις τεχνητής νοημοσύνης.

Τα μικρά μοντέλα, όπως υποδηλώνει το όνομα, είναι σχετικά με τα μεγάλα γλωσσικά μοντέλα (LLM). Σε σύγκριση με μεγάλα γλωσσικά μοντέλα με παραμέτρους συχνά εκατοντάδες δισεκατομμύρια ή και τρισεκατομμύρια, οι παράμετροι των τριών νέων μικρών μοντέλων: SmolLM, Mistral NeMo και GPT-4o mini μπορεί να κυμαίνονται από εκατοντάδες εκατομμύρια έως δεκάδες δισεκατομμύρια, ανάλογα με την εκπαίδευση. Η κατανάλωση ενέργειας είναι χαμηλότερη από αυτή των μεγάλων γλωσσικών μοντέλων. Αν και τα τρία μοντέλα χρησιμοποιούν διαφορετικές μεθόδους για τη διάδοση της τεχνητής νοημοσύνης, όλα έχουν έναν κοινό στόχο: να φέρουν ισχυρές δυνατότητες επεξεργασίας γλώσσας σε περισσότερες συσκευές και εφαρμογές.

1. Πώς τα μικρά μοντέλα αλλάζουν τον υπολογισμό ακμών

Η Venture Beat πιστεύει ότι το Hugging Face's SmolLM είναι το πιο καινοτόμο από τα τρία. Είναι ειδικά σχεδιασμένο για να λειτουργεί σε κινητές συσκευές και έχει τρεις προδιαγραφές: 135 εκατομμύρια, 360 εκατομμύρια και 1,7 δισεκατομμύρια παραμέτρους, που διευκολύνει την επεξεργασία τεχνητής νοημοσύνης σε συσκευές αιχμής και επιλύει τα βασικά ζητήματα του απορρήτου και της καθυστέρησης δεδομένων.

Η σημασία του SmolLM υπερβαίνει κατά πολύ τη βελτίωση της αποτελεσματικότητας. Επιτρέποντας στις συσκευές αιχμής να χρησιμοποιούν επεξεργασία τεχνητής νοημοσύνης, μπορεί να επιτραπεί η εκτέλεση εφαρμογών συσκευών με βάση τη χαμηλή καθυστέρηση και την υψηλή προστασία απορρήτου. Στο παρελθόν, πολλές σύνθετες λειτουργίες τεχνητής νοημοσύνης δεν μπορούσαν να πραγματοποιηθούν λόγω προβλημάτων απορρήτου ή σύνδεσης Με το SmolLM, αυτές οι λειτουργίες μπορεί να γίνουν πραγματικότητα.

Επιπλέον, η Mistral AI παρουσίασε το μοντέλο Mistral NeMo, το οποίο έχει 12 δισεκατομμύρια παραμέτρους και ένα παράθυρο περιβάλλοντος έως και 128k. Το Mistral NeMo απευθύνεται σε επιτραπέζιους υπολογιστές και είναι τοποθετημένο ανάμεσα σε μεγάλα μοντέλα cloud και εξαιρετικά συμπαγή φορητή τεχνητή νοημοσύνη. όπως ένα κινητό τηλέφωνο και φορητές συσκευές).

Η Venture Beat είπε ότι η υπολογιστική μέθοδος του Mistral NeMo μπορεί να φέρει σημαντικές αλλαγές στον επιχειρηματικό τομέα. Το μοντέλο έχει τη δυνατότητα να αξιοποιήσει υλικό καταναλωτικής ποιότητας για τον εκδημοκρατισμό σύνθετων δυνατοτήτων τεχνητής νοημοσύνης που κάποτε αποτελούσαν ιδιοκτησία τεχνολογικών κολοσσών και καλά χρηματοδοτούμενων ερευνητικών ιδρυμάτων. Αυτό μπορεί να βοηθήσει διάφορες βιομηχανίες να διαδώσουν εφαρμογές που βασίζονται στην τεχνητή νοημοσύνη, όπως η βελτιστοποίηση της εξυπηρέτησης πελατών και η παροχή πιο εξελιγμένων εργαλείων ανάλυσης δεδομένων.

2. Το αποδοτικό μικρό μοντέλο GPT-4o mini της OpenAI έχει μια όμορφη τιμή

Το OpenAI εντάχθηκε επίσης στον ανταγωνισμό των μικρών μοντέλων με την κυκλοφορία του GPT-4o mini, το οποίο ονομάζεται το πιο οικονομικό μικρό μοντέλο στην αγορά. Κοστίζει μόνο 15 σεντς ανά εκατομμύριο μάρκες για την είσοδο και 60 σεντ ανά εκατομμύριο μάρκες για την έξοδο.

Πέρα από αυτό, η στρατηγική τιμολόγησης του GPT-4o mini θα μπορούσε να προκαλέσει ένα νέο κύμα καινοτομίας με γνώμονα την τεχνητή νοημοσύνη, ειδικά μεταξύ νεοφυών επιχειρήσεων και μικρών επιχειρήσεων. Μειώνοντας σημαντικά το κόστος της ενσωμάτωσης της τεχνητής νοημοσύνης, αυτό το μοντέλο μειώνει αποτελεσματικά το εμπόδιο εισόδου για την υιοθέτηση λύσεων που βασίζονται στην τεχνητή νοημοσύνη. Η Ventrue Beat πιστεύει ότι αυτό μπορεί να επιταχύνει την τεχνολογική καινοτομία και τη μεταρρύθμιση σε πολλούς κλάδους. Επιπλέον, αυτή η στροφή προς μικρότερα μοντέλα αντανακλά τις νέες τάσεις στην κοινότητα της τεχνητής νοημοσύνης: οι ερευνητές και οι προγραμματιστές εστιάζουν όλο και περισσότερο στην αποτελεσματικότητα, την προσβασιμότητα και τις εξειδικευμένες εφαρμογές. Αυτή η τάση μπορεί να οδηγήσει σε πιο στοχευμένες και αποτελεσματικές λύσεις τεχνητής νοημοσύνης, βελτιστοποιημένες για συγκεκριμένες εργασίες και κλάδους.

3. Τα μικρά μοντέλα προωθούν την καινοτομία της πράσινης τεχνολογίας και μειώνουν το τεχνολογικό αποτύπωμα άνθρακα

Η στροφή προς μικρότερα μοντέλα ευθυγραμμίζεται επίσης με τις αυξανόμενες ανησυχίες σχετικά με τις περιβαλλοντικές επιπτώσεις της τεχνητής νοημοσύνης. Η εκπαίδευση και η λειτουργία μικρών μοντέλων καταναλώνουν λιγότερη ενέργεια, γεγονός που μπορεί να μειώσει το αποτύπωμα άνθρακα της τεχνολογίας AI. Καθώς οι εταιρείες τεχνολογίας αντιμετωπίζουν αυξανόμενη πίεση για να είναι βιώσιμες, η Venture Beat πιστεύει ότι η χαμηλή κατανάλωση ενέργειας και οι χαμηλές εκπομπές ρύπων του μικρού μοντέλου θα μπορούσαν να γίνουν ένα σημαντικό σημείο πώλησης.

Οι περιβαλλοντικές επιπτώσεις αυτής της στροφής προς μικρότερα μοντέλα θα μπορούσαν να είναι βαθιές. Καθώς η τεχνητή νοημοσύνη γίνεται πιο διαδεδομένη, η εξοικονόμηση ενέργειας από τη διάδοση πιο αποδοτικών μοντέλων θα μπορούσε να είναι τεράστια. Αυτό μπορεί να επιτρέψει στην τεχνητή νοημοσύνη να αναλάβει ηγετικό ρόλο στην πράσινη καινοτομία αντί να συνεχίσει να συμβάλλει στην υπερθέρμανση του πλανήτη.

Ωστόσο, η άνοδος των μικρών μοντέλων δεν είναι χωρίς προκλήσεις. Καθώς η τεχνητή νοημοσύνη γίνεται πιο πανταχού παρούσα, τα ζητήματα μεροληψίας, λογοδοσίας και ηθικής χρήσης γίνονται πιο πιεστικά. Εάν αφεθεί χωρίς ρύθμιση, η διάδοση της τεχνητής νοημοσύνης μέσω μικρών μοντέλων θα μπορούσε να ενισχύσει τις υπάρχουσες προκαταλήψεις ή να δημιουργήσει νέα ηθικά διλήμματα. Για τους προγραμματιστές και τους χρήστες μικρών μοντέλων, εκτός από τις τεχνικές δυνατότητες, πρέπει να δοθεί προτεραιότητα και σε ηθικά ζητήματα.

Συμπέρασμα: Το μέλλον της ανάπτυξης της τεχνητής νοημοσύνης δείχνει τη διαφοροποίηση και την εξειδίκευση

Αν και τα μικρά μοντέλα έχουν πλεονεκτήματα στην αποτελεσματικότητα και τη γενίκευση, η επεξεργαστική τους ισχύς μπορεί να μην ταιριάζει με αυτή των μεγάλων μοντέλων γλώσσας σε πολλές εργασίες λόγω περιορισμών στον αριθμό των παραμέτρων. Η Venture Beat είπε ότι αυτό δείχνει ότι στο μελλοντικό τοπίο ανάπτυξης της τεχνητής νοημοσύνης θα υπάρχουν μοντέλα γλώσσας διαφόρων μεγεθών και τα μικρότερα μοντέλα θα έχουν συγκεκριμένες πτυχές στις οποίες είναι καλά.

Κοιτάζοντας προς τα εμπρός, αναμένουμε να δούμε την ανάπτυξη των μοντέλων τεχνητής νοημοσύνης είτε πρόκειται για ένα μεγάλο μοντέλο γλώσσας είτε για ένα μικρό μοντέλο, μια προσέγγιση που ταιριάζει σε όλους δεν είναι σκόπιμο να βρεθεί μια ισορροπία μεταξύ του μεγέθους του μοντέλου. απόδοση και ειδικές απαιτήσεις εφαρμογής. Για τις επιχειρήσεις και τους υπεύθυνους λήψης τεχνικών αποφάσεων, αυτά τα τρία μικρά μοντέλα αντιπροσωπεύουν μια στροφή προς πιο αποτελεσματικές, επαγγελματικές και εφαρμόσιμες λύσεις τεχνητής νοημοσύνης, παρέχοντας νέες δυνατότητες για την ενσωμάτωση της τεχνητής νοημοσύνης σε εταιρικά περιβάλλοντα. Όσο για το αν τα μικρά μοντέλα μπορούν να αντικαταστήσουν την τρέχουσα κυριαρχία των μεγάλων μοντέλων στο cloud, είναι ακόμα πολύ νωρίς για να βγάλουμε συμπεράσματα.

Πηγή: VentureBeat