νέα

γιατί το google gemini δεν είναι δημοφιλές στους προγραμματιστές; η ικανότητα εκτέλεσης πολύπλοκων λειτουργιών δεν είναι αρκετά εξαιρετική

2024-09-18

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

tencent technology news σύμφωνα με αναφορές ξένων μέσων, η google έχει κάνει τεράστιες επενδύσεις σε μεγάλα γλωσσικά μοντέλα, αλλά η gemini εξακολουθεί να αντιμετωπίζει τις διπλές προκλήσεις των πολύπλοκων λειτουργιών και την τάση των προγραμματιστών να επιλέγουν ανταγωνιστικά προϊόντα η ανάπτυξη παίρνει το φόρο της. το gemini έχει σημειώσει κάποια πρόοδο από την κυκλοφορία του, αλλά εξακολουθεί να υπάρχει ένα σημαντικό κενό σε σύγκριση με ανταγωνιστές όπως το openai όσον αφορά την αξιοπιστία και το μερίδιο αγοράς.

ορισμένοι προγραμματιστές και υπάλληλοι της google έχουν παραπονεθεί ότι η συνομιλητική τεχνητή νοημοσύνη gemini της google είναι πολύ περίπλοκη για χρήση σε σύγκριση με ανταγωνιστικές τεχνολογίες. μεταξύ των προγραμματιστών που παραπονέθηκαν για το gemini ήταν ο aidan mclaughlin, ο ιδρυτής της startup topology. η εταιρεία αναπτύσσει λογισμικό για τη βελτίωση των συλλογιστικών ικανοτήτων των υπαρχόντων μοντέλων τεχνητής νοημοσύνης.

είπε ότι την πρώτη φορά που προσπάθησε να χρησιμοποιήσει το api του openai, χρειάστηκε μόνο 30 δευτερόλεπτα, αλλά χρειάστηκαν τέσσερις ώρες με το gemini, επειδή η google του ζήτησε να δημιουργήσει έναν λογαριασμό cloud και να κάνει πολλές ρυθμίσεις. επιπλέον, κάποιες ευπάθειες στα συστήματα της google τον ανάγκασαν μερικές φορές να κάνει πίσω. ο mclaughlin είπε: "εάν το μοντέλο που παρέχει η google ξεπερνά σημαντικά τα μοντέλα που παρέχει η openai και η anthropic όσον αφορά τις δυνατότητες, είμαι πρόθυμος να ξεπεράσω όλες αυτές τις δυσκολίες. το πιο σημαντικό πράγμα στον κόσμο είναι η ποιότητα του μοντέλου, αλλά εκτός από ορισμένες ειδικές περιστάσεις, το μοντέλο της google φαίνεται να κατατάσσεται στην τρίτη θέση."

οι δυσκολίες που αντιμετωπίζουν οι προγραμματιστές όταν χρησιμοποιούν το gemini ενδέχεται να έχουν αντίκτυπο στην επιχείρηση cloud της google, καθώς η google ελπίζει να χρησιμοποιήσει το gemini για να προσελκύσει περισσότερους πελάτες στην επιχείρηση ενοικίασης διακομιστών της. επιπλέον, ορισμένοι υπάλληλοι της google είπαν ότι αυτό μπορεί επίσης να προκαλέσει πιθανά προβλήματα στην ανάπτυξη της τεχνητής νοημοσύνης της google. προσελκύοντας εκατομμύρια χρήστες που πληρώνουν για να αγοράσουν τα μοντέλα τεχνητής νοημοσύνης του ή να χρησιμοποιήσουν το chatgpt, το openai λαμβάνει μεγάλο αριθμό σιωπηρών και ρητών σχολίων σχετικά με την απόδοση της τεχνητής νοημοσύνης του, επιτρέποντάς του να βελτιώσει περαιτέρω τα μοντέλα του. εάν το gemini της google δεν έχει το ίδιο επίπεδο χρήσης, η εταιρεία θα μπορούσε να χρησιμοποιήσει έναν πιο ασαφή οδικό χάρτη για τις ίδιες βελτιώσεις.

το gemini είναι επίσης σημαντικό για την ανάπτυξη των καταναλωτικών και διαφημιστικών προϊόντων της google, τα οποία απαιτούν αναζήτηση απαντήσεων συνομιλίας και βοηθούς φωνής. «το να έχουν οι προγραμματιστές να χρησιμοποιούν το gemini για την επίλυση σύνθετων προβλημάτων του πραγματικού κόσμου είναι κρίσιμης σημασίας σχόλια για την επόμενη γενιά του gemini», δήλωσε ο bindu reddy, διευθύνων σύμβουλος της abacus ai. το λογισμικό της εταιρείας βοηθά τους προγραμματιστές να δημιουργήσουν εφαρμογές τεχνητής νοημοσύνης. «όσο περισσότερα σχόλια έχετε, τόσο το καλύτερο», είπε.

αν και το gemini έχει βελτιωθεί πολύ φέτος, εξακολουθεί να μην είναι τόσο αξιόπιστο όσο τα ανταγωνιστικά μοντέλα όσον αφορά την τροφοδοσία εμπορικών εφαρμογών τεχνητής νοημοσύνης. ένας εκπρόσωπος της google είπε ότι τα σχόλια των προγραμματιστών είναι σημαντικά για τη βελτίωση του μοντέλου gemini, αλλά δεν είναι η μόνη πηγή δεδομένων. ορισμένοι ερευνητές της τεχνητής νοημοσύνης λένε επίσης ότι είναι δυνατό να επιτευχθούν σημαντικές βελτιώσεις διδάσκοντας την τεχνητή νοημοσύνη να μαθαίνει από ανθρώπους ειδικούς σε διάφορους τομείς.

μικροί προγραμματιστές και μεγάλες εταιρείες υιοθετούν μεγάλα γλωσσικά μοντέλα όπως το gpt-4 του openai για να αναπτύξουν εφαρμογές που μπορούν να αυτοματοποιήσουν τα πάντα, από την εξυπηρέτηση πελατών και την ανάλυση δεδομένων μέχρι τον εντοπισμό απάτης και τη δημιουργία κώδικα υπολογιστή. η openai και η microsoft κερδίζουν περίπου 100 εκατομμύρια δολάρια το μήνα παρέχοντας υπηρεσίες μεγάλων γλωσσικών μοντέλων σε προγραμματιστές. αυτοί οι προγραμματιστές περιλαμβάνουν ποσοτικές εμπορικές εταιρείες όπως η jane street, τράπεζες όπως η morgan stanley και εταιρείες χρηματοοικονομικής τεχνολογίας όπως η stripe.

η google αναφέρει επίσης αρκετούς πελάτες gemini, συμπεριλαμβανομένων των mercedes-benz, goldman sachs και uber. οι εταιρείες ανέφεραν σε δηλώσεις τους ότι χρησιμοποιούν τεχνητή νοημοσύνη για να τροφοδοτήσουν τα πάντα, από την εξυπηρέτηση πελατών έως την υποστήριξη κωδικοποίησης, αν και η έκταση των αγορών τους είναι άγνωστη (η google είχε θέσει στο παρελθόν στόχο να ξεκινήσει μια υπηρεσία cloud ai στη βόρεια αμερική φέτος, έχει έσοδα 1 δισεκατομμύριο δολάρια , αλλά πουλά περισσότερες υπηρεσίες ai παρά απλά μοντέλα μεγάλων γλωσσών.

ο sundar pichai, διευθύνων σύμβουλος της μητρικής alphabet της google, δήλωσε κατά τη διάρκεια της κλήσης για τα κέρδη του δεύτερου τριμήνου της εταιρείας τον ιούλιο ότι περισσότεροι από 2 εκατομμύρια προγραμματιστές έχουν χρησιμοποιήσει το gemini από την αρχή του έτους, αλλά προς το παρόν δεν είναι σαφές εάν αυτό περιλαμβάνει προγραμματιστές που έχουν δοκιμάσει μόνο το μοντέλο. μία ή δύο φορές.

σε σχέση με τα μοντέλα του openai, η αντιδημοφιλία του gemini μεταξύ των προγραμματιστών φαίνεται να είναι ένα ανοιχτό μυστικό στη βιομηχανία. ωστόσο, το gemini της google συνεχίζει να σημειώνει πρόοδο και η εταιρεία λαμβάνει ενεργά μέτρα για να βελτιώσει την απόδοση και την αξιοπιστία της σε μια προσπάθεια να παραμείνει ανταγωνιστική στον χώρο της τεχνητής νοημοσύνης.

ανταγωνιστικό πλεονέκτημα

για παράδειγμα, μια έρευνα του ιουνίου σε περισσότερους από 750 εργαζομένους στον τομέα της τεχνολογίας από την startup εταιρικού λογισμικού retool διαπίστωσε ότι μόνο το 2,6% των ερωτηθέντων δήλωσε ότι χρησιμοποιεί συχνότερα το gemini για τη δημιουργία εφαρμογών τεχνητής νοημοσύνης, ενώ το 76% δήλωσε ότι χρησιμοποιεί συχνότερα το gemini για τη δημιουργία εφαρμογών ai. είπε ότι χρησιμοποιούν openai. ο δίδυμος ξεπέρασε οριακά τον κλοντ του anthropic, ο οποίος έλαβε το 2,3% των ψήφων. αλλά αξίζει να σημειωθεί ότι η χρήση του claude έχει υπερτετραπλασιαστεί από την αναφορά του retool τον νοέμβριο του 2023. το gemini δεν ήταν διαθέσιμο στους προγραμματιστές μέχρι τον δεκέμβριο του περασμένου έτους.

το similarweb, το οποίο παρακολουθεί την επισκεψιμότητα του ιστότοπου, είπε ότι η σελίδα προγραμματιστών εφαρμογών του openai έλαβε 82,8 εκατομμύρια επισκέψεις από τον ιούνιο έως τον αύγουστο, ενώ η σελίδα της google είχε μόνο 8,4 εκατομμύρια προβολές κατά την ίδια περίοδο. μικρότερες έρευνες έχουν δώσει παρόμοια στοιχεία. στα τέλη του περασμένου μήνα, ο ιδρυτής της finetune, julian saks, ρώτησε 50 προγραμματιστές startup τεχνητής νοημοσύνης στον κοινόχρηστο χώρο εργασίας του στο σαν φρανσίσκο ποια μοντέλα συνομιλίας ai χρησιμοποιούν πιο συχνά. σχεδόν όλοι είπαν ότι χρησιμοποιούσαν κυρίως μοντέλα από το anthropic ή το openai και κανένας δεν χρησιμοποιούσε κυρίως το gemini. ο σακς δεν εξεπλάγη από τα αποτελέσματα. «νιώθω ότι ο gemini δεν ξεχωρίζει σε σύγκριση με άλλα μοντέλα όσον αφορά την κωδικοποίηση», είπε.

η google χρειάστηκε σχεδόν ένα χρόνο και μια σημαντική αναδιοργάνωση για να λανσάρει ένα μοντέλο που μπορεί να ανταγωνιστεί την κυκλοφορία gpt-4 του openai στις αρχές του 2023. η google θα αρχίσει να δίνει στους προγραμματιστές πρόσβαση στα μοντέλα gemini τον δεκέμβριο του 2023 και η απόδοσή τους είναι παρόμοια με τα μοντέλα του openai σε δημοφιλείς συγκριτικές αξιολογήσεις.

ωστόσο, ορισμένοι υπάλληλοι της google λένε ότι η πρώτη κίνηση του openai του κέρδισε την αναγνώριση της επωνυμίας μεταξύ των προγραμματιστών. η anthropic, μια άλλη νέα νεοσύστατη εταιρεία τεχνητής νοημοσύνης, απόλαυσε μια άνοδο στο μάρκετινγκ από στόμα σε στόμα φέτος, καθώς οι προγραμματιστές έκαναν όνομα ως εναλλακτική λύση στο openai, ιδιαίτερα για τη βοήθεια κωδικοποίησης.

προβλήματα προγραμματιστή

ο δίδυμος δεν φαίνεται να τραβάει πολύ την προσοχή. οι προγραμματιστές που συμμετείχαν στην έρευνα είπαν ότι τα μοντέλα gemini είναι χρήσιμα κατά την ανάλυση μεγάλων εγγράφων ή βάσεων κώδικα, επειδή μπορούν να επεξεργαστούν περισσότερες πληροφορίες ταυτόχρονα από άλλα μοντέλα. ωστόσο, τόνισαν επίσης ότι η google προσφέρει μπερδεμένες επιλογές χρήσης και πολλά βήματα σε σύγκριση με τους ανταγωνιστές και ότι το σύστημα προγραμματιστή της διαφέρει από το openai, καθιστώντας πιο δύσκολη τη χρήση αυτών των μοντέλων.

μερικές φορές, οι διαφορετικές επιλογές που προσφέρει η google για τη χρήση του gemini ανταγωνίζονται μεταξύ τους ακόμη και στα αποτελέσματα αναζήτησης της google. για λίγο αυτή την άνοιξη, το vertex ai studio —μια υπηρεσία που προωθεί η google σε μεγάλες επιχειρήσεις που μπορεί να θέλουν να χρησιμοποιήσουν το gemini — έγινε ένα χορηγούμενο αποτέλεσμα του google ai studio, ενός απλούστερου εργαλείου που επιτρέπει στους προγραμματιστές να χρησιμοποιούν το gemini.

«οι άνθρωποι μπερδεύονται όταν προσπαθούν να βρουν τις επιλογές», δήλωσε ο alex atallah, πρώην επικεφαλής τεχνολογίας της opensea. αντιμετώπισε παρόμοιες δυσκολίες όταν προσπάθησε να χρησιμοποιήσει το gemini για την εκκίνηση openrouter, η οποία παράγει λογισμικό για προγραμματιστές που εργάζονται με μεγάλα μοντέλα γλώσσας.

αν και η google κυκλοφόρησε την υπηρεσία ai studio τον δεκέμβριο για να διευκολύνει τους προγραμματιστές να χρησιμοποιούν το gemini, πρέπει να χρησιμοποιούν διαφορετική μέθοδο αποστολής ερωτημάτων από το gpt και τον claude, που έχουν παρόμοια μορφή. ο mclaughlin είπε ότι αυτή η διαφορά καθιστά λιγότερο ελκυστικό για τους προγραμματιστές να μεταβούν στο gemini.

ο δίδυμος δέχεται συχνά κριτική στα μέσα κοινωνικής δικτύωσης - ειδικά στην πλατφόρμα κοινωνικών μέσων x. ο brendan dolan-gavitt, ερευνητής τεχνητής νοημοσύνης στην εκκίνηση ασφαλείας xbow, δημοσίευσε στο x νωρίτερα αυτό το μήνα σχετικά με το ταξίδι του μέσω της vertex, μιας άλλης από τις εφαρμογές ανάπτυξης εφαρμογών ai της google αναρτήσεις σχετικά με τα πολλά βήματα που απαιτούνται για τη χρήση του gemini έχουν προσελκύσει ευρεία προσοχή. άλλοι προγραμματιστές έχουν επίσης ενταχθεί στις τάξεις των καταγγελιών και εξέφρασαν τη δυσαρέσκειά τους για το google gemini.

σταθερό μερίδιο αγοράς

η google προσπαθεί να αλλάξει αυτή την εικόνα, συμπεριλαμβανομένου του x για να απαντήσει στους επικριτές του gemini. διοργανώνει επίσης εκδηλώσεις για προγραμματιστές για την προώθηση του gemini. η google πειραματίζεται επίσης με άλλα κίνητρα, όπως η διεξαγωγή διαγωνισμού προγραμματιστών για την κατασκευή της καλύτερης εφαρμογής gemini ο πρώτος νικητής θα λάβει ένα εξατομικευμένο ηλεκτρικό όχημα με την επωνυμία delorean με τον αριθμό πινακίδας "g3m1n1". σύμφωνα με το σχέδιο, η google θα ανακοινώσει τα τελικά αποτελέσματα των βραβείων στο τέλος του τρέχοντος έτους.

ο logan kilpatrick, ο οποίος εργάζεται στην ανάπτυξη προϊόντων στην google, αποκάλυψε ότι η google εξετάζει επίσης τη συγχώνευση χαρακτηριστικών ορισμένων επικαλυπτόμενων προϊόντων δημιουργίας εφαρμογών για να μειώσει τη σύγχυση μεταξύ των προγραμματιστών. "το openai παρέχει στους προγραμματιστές κάτι χρήσιμο για λίγο περισσότερο χρόνο, λίγο περισσότερο από την google, στο πλαίσιο ενός μεγάλου μοντέλου api γλώσσας", είπε εντάχθηκε στην google τον απρίλιο ως επικεφαλής προϊόντων για το ai studio και στο παρελθόν εργάστηκε στο openai responsible για προγραμματιστές. συγγένειες. «πρέπει να παλέψουμε ενάντια στο σταθερό μερίδιο αγοράς που έχουν αυτή τη στιγμή μεταξύ των προγραμματιστών».

αυτή την εβδομάδα, το openai κυκλοφόρησε το o1-preview, ένα μοντέλο συμπερασμάτων που ξεπερνά τα μεγάλα γλωσσικά μοντέλα σε ορισμένες τεχνικές ή σύνθετες εργασίες. αυτό θα μπορούσε να ασκήσει πίεση στην google να κυκλοφορήσει παρόμοια τεχνολογία ή να κινδυνεύσει να χάσει περισσότερο έδαφος στην κοινή γνώμη των προγραμματιστών.

υπηρεσία "λευκό γάντι".

η google αναπτύσσει ενεργά την έκδοση 2.0 του gemini, με στόχο να επιτύχει μια παρατεταμένη νίκη στον ανταγωνισμό στον τομέα της τεχνητής νοημοσύνης, ελπίζοντας να φτάσει ή ακόμα και να ξεπεράσει την τεχνολογία του openai. ωστόσο, το gemini έχει κερδίσει ορισμένους θαυμαστές, ειδικά επειδή ξεπερνά τα άλλα μοντέλα όσον αφορά τον όγκο των πληροφοριών που μπορεί να διαχειριστεί. η ιδρυτής της starcycle, jaclyn siu, δήλωσε ότι η εταιρεία της χρησιμοποιεί το gemini 1.5 pro, το πιο προηγμένο μοντέλο μεγάλης γλώσσας της google για προγραμματιστές, κυρίως για την εξαγωγή δεδομένων από έγγραφα. η thomson reuters χρησιμοποιεί επίσης το gemini για να βοηθήσει με νομικά εργαλεία που μπορούν να συγκρίνουν μεγάλα νομικά έγγραφα και να εντοπίσουν ασυνέπειες.

για μεγαλύτερες εταιρείες, η δυσκολία χρήσης της google ai δεν αποτελεί σημαντικό εμπόδιο. η fiona tan, επικεφαλής τεχνολογίας της wayfair, αποκάλυψε ότι η εταιρεία απολαμβάνει υπηρεσίες «λευκού γαντιού» που παρέχονται από υπαλλήλους της google, οι οποίοι βοηθούν την εταιρεία να χρησιμοποιήσει το gemini για να μετατρέψει τις παραδοσιακές βάσεις δεδομένων σε μια πιο φιλική προς τον χρήστη μορφή. η λεγόμενη υπηρεσία "λευκού γαντιού" αναφέρεται συνήθως στο είδος της πολύ προσεγμένης υπηρεσίας που απαιτεί μεγάλη προσοχή και προσοχή στις λεπτομέρειες.

ωστόσο, ορισμένοι προγραμματιστές δεν σχεδιάζουν να δοκιμάσουν το gemini επειδή οι υπάρχουσες λύσεις τους είναι αρκετά αποτελεσματικές. ο martyn strydom, ο οποίος αναπτύσσει μια εφαρμογή που ονομάζεται dots, σημείωσε ότι η εταιρεία του προτιμά να χρησιμοποιεί τον claude ως βοηθό κωδικοποίησης και το παλαιότερο μοντέλο gpt του openai για να ανταποκρίνεται στους πελάτες, επειδή δεν έχουν τον χρόνο να πηγαίνουν και να δοκιμάζουν συνεχώς διαφορετικά μοντέλα.

είπε: "αυτή τη στιγμή, σχεδόν όλοι χρησιμοποιούν openai, claude ή cursor. εάν οι κορυφαίοι μηχανικοί στον κόσμο χρησιμοποιούν αυτά τα εργαλεία, γιατί πρέπει να δοκιμάσουμε άλλα εργαλεία τεχνητής νοημοσύνης που τροφοδοτείται από μοντέλα openai και anthropic". βοηθός κώδικα. (συντάχθηκε/wuji)