νέα

πριν από το φθινοπωρινό συνέδριο της apple, μια εις βάθος ανασκόπηση του πανοράματος apple intelligence

2024-09-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

συγγραφέας tencent technology guo xiaojing wu bin

σχεδιασμός βίντεο wu bin

συντάκτης zheng kejun

πριν από τη συνέντευξη τύπου της apple, τακτοποιήσαμε το πανόραμα apple intelligence

στο wwdc24 (apple worldwide developers conference) τον ιούνιο του τρέχοντος έτους, ο κόσμος άκουσε τον όρο «apple intelligence» για πρώτη φορά η apple χρησιμοποίησε το ομοφωνικό στέλεχος της τεχνητής νοημοσύνης (ai) για να ορίσει το δικό της apple ai. προηγουμένως, η apple απέφευγε να χρησιμοποιεί τον όρο "ai" όταν συζητούσε τις λειτουργίες της που σχετίζονται με τη μηχανική εκμάθηση.

μέχρι σήμερα, στην τελευταία επιστολή πρόσκλησης για το φθινοπωρινό συνέδριο της apple, αν και δεν υπάρχει «ai», όλα αποκαλύπτουν διάφορες γεύσεις του «ai».

σημείωση: στα αριστερά είναι η επιστολή πρόσκλησης για το φθινοπωρινό συνέδριο παρουσίασης νέων προϊόντων της apple το 2024 και στα δεξιά είναι η επιστολή πρόσκλησης για το wwdc24

για παράδειγμα, το θέμα της πρόσκλησης είναι "highlight moment".

λεζάντα: το νέο εικονίδιο του siri, εφέ εμφάνισης iphone μετά την αφύπνιση του siri

και το χρώμα του siri αλλάζει επίσης μπορείτε να δείτε ότι το νέο του λογότυπο και ο συνδυασμός χρωμάτων μετά την αφύπνιση του siri είναι εντελώς διαφορετικά από το παλιό siri.

legend: apple autumn conference 2023, επιστολή πρόσκλησης wwdc23, παλιό λογότυπο siri, μπορείτε να δείτε προφανείς διαφορές στο συνδυασμό χρωμάτων

ζήτησα μάλιστα από ένα προϊόν τεχνητής νοημοσύνης να με βοηθήσει να αναλύσω τα στοιχεία που σχετίζονται με την τεχνητή νοημοσύνη στην επιστολή πρόσκλησης για το φθινοπωρινό συνέδριο και μου είπε:

από πλευράς γραφικού σχεδιασμού: το λογότυπο αποτελείται από γραμμές που περιβάλλουν το κλασικό περίγραμμα της apple και η δυναμική αίσθηση προσομοιώνει την έξυπνη αλληλεπίδραση της τεχνητής νοημοσύνης.

χρωματικός τόνος: το λογότυπο της πρόσκλησης χρησιμοποιεί τόνους νέον, όπως το μπλε, το μωβ, το πορτοκαλί και το ροζ -σχετικές λειτουργίες σε προϊόντα apple υπάρχει συσχέτιση.

οπτική συσχέτιση: η οπτική συσχέτιση μεταξύ της πρόσκλησης και του siri μπορεί να υποδηλώνει τη βασική θέση της τεχνολογίας ai στα προϊόντα της apple και ότι το siri μπορεί να αναβαθμιστεί περαιτέρω και να βελτιστοποιηθεί στο μέλλον για να ενσωματωθεί καλύτερα με άλλες λειτουργίες ai για να παρέχει στους χρήστες εξυπνότερες, βολικές υπηρεσίες ;

από τη μη αναφορά της τεχνητής νοημοσύνης μέχρι και το όνομα που έχει ομοφωνικό «ai», ακόμη και το χρώμα της πρόσκλησης πρέπει να είναι συνεπές με το «ai». προφανώς, αυτά τα σχέδια δεν είναι τυχαία.

ποια είναι λοιπόν η δύναμη της apple intelligence; σε αυτό το άρθρο, θα σας μιλήσουμε αναλυτικά για τα ακόλουθα ζητήματα:

σύντομη εισαγωγή: πώς φαίνεται η μεγάλη εικόνα του apple intelligence με βάση τις διαθέσιμες πληροφορίες;

ανασκόπηση προόδου: πώς εξελίσσεται το apple intelligence από τον ιούνιο έως τον αύγουστο;

μαντέψτε: τι είδους apple intelligence θα δούμε σύντομα;

βαθιά σκέψη: με το "ai" της apple, πώς θα εξελιχθεί το μελλοντικό οικοσύστημα;

ενημερωτικό φύλλο: απόλυτα ιδιωτικό και ασφαλές

στο wwdc24, αυτή η ομιλία του κουκ είναι πολύ σημαντική:

«είμαστε στην ευχάριστη θέση να ξεκινήσουμεένα νέο κεφάλαιο στην καινοτομία της apple.apple intelligenceθα αλλάξει τον τρόπο με τον οποίο οι χρήστες χρησιμοποιούν τα προϊόντα μας——και τι μπορούν να κάνουν τα προϊόντα μας για τους χρήστες,η μοναδική μας προσέγγισησυνδυάζει τη γενετική τεχνητή νοημοσύνη με τις ανάγκες των χρηστών για να παρέχει πραγματικήχρήσιμη νοημοσύνη. μπορείεντελώς ιδιωτικός και ασφαλής τρόποςπρόσβαση σε αυτές τις πληροφορίες για να βοηθήσετε τους χρήστες να κάνουν ό,τι έχει μεγαλύτερη σημασία για αυτούς. αυτό είναιai που μόνο η apple μπορεί να προσφέρει, ανυπομονούμε να γνωρίσουν οι χρήστες τι μπορεί να κάνει. "

υπάρχουν τρία βασικά σημεία σε αυτό το απόσπασμα (σημειώστε τις λέξεις-κλειδιά που επισημαίνονται με μπλε):

1. συνδυάστε τη γενετική τεχνητή νοημοσύνη και τις ανάγκες των χρηστών για παροχήχρήσιμοςέξυπνος

2. ναιμοναδικόςμέθοδο, αυτή είναι η τεχνητή νοημοσύνη που μόνο η apple μπορεί να παρέχει

3、εντελώς ιδιωτικό και ασφαλέςτρόπος

αν θέλετε να το κάνετε αυτό, πρέπει να το λύσετετέσσερα βασικά ζητήματα που αντιμετωπίζουν όλα τα ai από την πλευρά της συσκευής:

πρώτον, χρήσιμο: ταιριάζει απόλυτα στις ανάγκες των χρηστών, όχι στις κατασκευαστικές ανάγκες, και επίσης να σκεφτείτε πώς να αλληλεπιδράσετε.

δεύτερον, ασφάλεια: το μοντέλο πρέπει να εκτελείται τοπικά

τρίτον, ομαλότητα: για προβλήματα που δεν μπορούν να αντιμετωπιστούν από το τοπικό υλικό, χρησιμοποιείται ένα μεγαλύτερο μοντέλο στο cloud για την αντιμετώπισή του.

τέταρτον, ασφάλεια και πλήρη προστασία της ιδιωτικής ζωής: μόλις χρησιμοποιηθεί το μοντέλο cloud, μεγάλος αριθμός προσωπικών πληροφοριών στο κινητό τηλέφωνο κινδυνεύει να διαρρεύσει

προφανώς, η επανειλημμένα αναφερόμενη ασφάλεια και απόρρητο είναι οι μεγαλύτερες προϋποθέσεις για οποιαδήποτε υπηρεσία θέλει να παρέχει η apple στους χρήστες.

μπορούμε να πούμε ότι πριν από την apple, κανένας κατασκευαστής δεν είχε προτείνει μια πολύ ολοκληρωμένη λύση.

τι πιστεύει λοιπόν η apple για αυτό; ας ρίξουμε μια ματιά στο πανόραμα της apple intelligence και ίσως πάρουμε μια γεύση από τη συνολική λογική της apple στο ai.

λεζάντα: πανόραμα apple intelligence, μετάφραση tencent technology

το επίπεδο συστήματος προσωπικής νοημοσύνης συνδέει το ανώτερο επίπεδο εφαρμογής που είναι γνωστό στους χρήστες και το επίπεδο τσιπ που έχει αναπτύξει η apple.

το επίπεδο συστήματος προσωπικής νοημοσύνης μπορούμε να πούμε ότι είναι η βασική δομή του apple intelligence.

το πρώτο μέρος είναι afm-on-device (μοντέλο τελικής πλευράς apple fondation model).αυτό είναι ένα μοντέλο παραμέτρων 3 δισεκατομμυρίων, το οποίο είναι το πιο σημαντικό μέρος της τεχνητής νοημοσύνης στην τελική πλευρά. λόγω των υψηλών απαιτήσεων για απόρρητο και ασφάλεια, η εκτέλεση του μοντέλου από την πλευρά του πελάτη τοπικά έχει την υψηλότερη προτεραιότητα μόνο πράγματα που δεν μπορεί να κάνει μπορούν να σταλούν στο cloud.

ωστόσο, το μοντέλο από την πλευρά της συσκευής έχει ένα αδύνατο τρίγωνο: απόδοση, όγκος παραμέτρων, μνήμη και κατανάλωση ενέργειας, το οποίο είναι επίσης το πιο ενοχλητικό ζήτημα για διάφορους κατασκευαστές.

η εξαιρετική απόδοση απαιτεί μεγάλο αριθμό παραμέτρων που σημαίνει ότι η μεγάλη χρήση μνήμης και η υπερβολική κατανάλωση ενέργειας μπορεί να επηρεάσουν την απόδοση. πώς πρέπει λοιπόν να ισορροπήσουν αυτά τα τρία;

το σχέδιο της apple έχει ως εξής:

παλετοποίηση χαμηλών bit: αυτή η τεχνολογία κάνει το μοντέλο πιο ελαφρύ, όπως ακριβώς η συμπίεση φωτογραφιών υψηλής ευκρίνειας, και δεν καταλαμβάνει πολύ χώρο στο κινητό τηλέφωνο.

προσαρμογείς lora: αυτά τα gadget επιτρέπουν στα μοντέλα να μαθαίνουν γρήγορα νέες δεξιότητες όπως χρειάζεται, παρόμοια με τα τουβλάκια lego που μπορούν να συναρμολογηθούν σε διάφορα σχήματα.

εργαλείο talaria: αυτό το εργαλείο βοηθά στην παρακολούθηση και τη ρύθμιση της κατανάλωσης ενέργειας του μοντέλου για να διασφαλιστεί ότι δεν καταναλώνει υπερβολική ενέργεια.

προσοχή ομαδοποιημένων ερωτημάτων: επιτρέπει στο μοντέλο να εστιάζει γρήγορα σε σημαντικές πληροφορίες, όπως ακριβώς χρησιμοποιώντας ετικέτες για γρήγορη εύρεση βιβλίων.

κοινόχρηστο λεξιλόγιο: με την κοινή χρήση λεξιλογίου, η χρήση της μνήμης μειώνεται, όπως και η χρήση ενός λεξικού για την αναζήτηση λέξεων από όλους, εξοικονομώντας χώρο.

με απλά λόγια, αυτές οι τεχνολογίες βελτιστοποίησης επιτρέπουν το afm στη συσκευήμείνετε έξυπνοι, εξοικονομώντας ενέργεια και ανταποκρίνεστε γρήγορα

το μεγαλύτερο χαρακτηριστικό είναι ο προσαρμογέας lora (προσαρμογέας χαμηλής κατάταξης), ο οποίος είναι ένα τεχνικό εργαλείο που χρησιμοποιείται για τη βελτιστοποίηση μοντέλων μηχανικής εκμάθησης, ειδικά μοντέλων μεγάλων γλωσσών και μοντέλων δημιουργίας. απάντηση στο email" επιτρέπει στα μοντέλα να εκτελούν καλύτερα αυτές τις συγκεκριμένες εργασίες.

βίντεο: διάγραμμα εργασίας προσαρμογέα lora

με αυτόν τον τρόπο, μπορεί να επιτευχθεί, χρησιμοποιώντας 3 δισεκατομμύρια παραμέτρους, να επιτύχει απόδοση ισοδύναμη με άλλα κύρια μοντέλα με κλίμακα μεγαλύτερη από 7 δισεκατομμύρια (αποτελέσματα αξιολόγησης που παρέχονται από τον επίσημο υπάλληλο της apple).

το εργαλείο talaria συνδυάζεται με άλλες τεχνικές (όπως προσοχή σε ομαδικά ερωτήματα, κοινόχρηστο λεξιλόγιο εισόδου και εξόδου, κβαντοποίηση χαμηλού bit, στρατηγική υβριδικής διαμόρφωσης, κβαντοποίηση ενεργοποίησης και ενσωμάτωση κβαντισμού, κ.λπ.). στο iphone 15 pro και με ρυθμό παραγωγής 30 tokens ανά δευτερόλεπτο και ενώ πληροί τις απαιτήσεις απόδοσης, μπορεί επίσης να μειώσει την ισχύ του κινητού τηλεφώνου και την πίεση της μνήμης.

ωστόσο, ακόμα κι έτσι, σύμφωνα με αξιωματούχους της apple, η εκτέλεση του apple intelligence εξακολουθεί να απαιτεί μια ελάχιστη διαμόρφωση του iphone 15 pro. επιπλέον, σύμφωνα με την αντίληψη της tencent technology, απαιτείται τουλάχιστον 8g μνήμης για την υποστήριξη της λειτουργίας apple intelligence.

επομένως, σε αυτό το στάδιο, η ικανότητα του μοντέλου από την πλευρά της συσκευής με 3 δισεκατομμύρια παραμέτρους είναι το ανώτερο όριο των προβλημάτων που μπορεί να λύσει ο τοπικός εγκέφαλος ai των iphone και mac.

επομένως, πολύπλοκοι υπολογισμοί πρέπει να αποστέλλονται στο cloud και να υποβάλλονται σε επεξεργασία μέσω μοντέλων με μεγαλύτερες παραμέτρους.

αυτό είναι το δεύτερο σημαντικό στοιχείο της apple intelligence, το μοντέλο cloud (afm server).

πρέπει να προστεθεί εδώ ότι ο ρόλος του επιπέδου ενορχήστρωσης είναι να προσδιορίζει εάν οι ανάγκες των χρηστών πρέπει να επιλύονται από την πλευρά του πελάτη ή να ανεβαίνουν στο σύννεφο, όπως ένα διοικητή. η apple δεν εκτελεί καμία χειροκίνητη παρέμβαση εδώ και βασίζεται εξ ολοκλήρου στον δικό της αλγόριθμο για να κρίνει εάν τα δεδομένα τους τοποθετούνται μόνο στη συσκευή.

η apple δεν αποκάλυψε τις συγκεκριμένες παραμέτρους του μοντέλου cloud, σε αντίθεση με το μοντέλο από την πλευρά του πελάτη, το οποίο έχει αποσταχθεί από ένα μεγαλύτερο μοντέλο, είναι εκπαιδευμένο από την αρχή. ταυτόχρονα, χρησιμοποιούνται ορισμένες προηγμένες μέθοδοι εκπαίδευσης, κοινές στο μοντέλο της τελικής πλευράς.

το πιο σημαντικό χαρακτηριστικό αυτού του μοντέλου cloud είναι να συνειδητοποιήσει αυτό που ανέφερε ο cook“απόλυτα ιδιωτικό και ασφαλές”, το οποίο παρέχει προστασία μέσω του private cloud compute (pcc).

πώς ακριβώς είναι τόσο μυστικό; υπάρχουν πολλές επαγγελματικές τεχνικές εδώ, ας αναπαράγουμε απλώς την όλη διαδικασία:

ο χρήστης εκκινεί ένα αίτημα: για παράδειγμα, ρωτάτε τη siri στο κινητό σας τηλέφωνο: "τι ώρα πρέπει να πάρω τα παιδιά μου από το σχολείο και να πάω στη συνάντηση της εταιρείας;"

ασφαλής ενθυλάκωση: το τηλέφωνό σας κρυπτογραφεί αμέσως το αίτημα σε ένα "μυστικό πακέτο" που μόνο το pcc μπορεί να αποκρυπτογραφήσει.

μυστική αποστολή: αυτό το "μυστικό πακέτο" αποστέλλεται στο pcc μέσω ενός ασφαλούς μυστικού καναλιού. αυτό το πέρασμα είναι σαν μια σήραγγα με κλειδαριά με κωδικό πρόσβασης και μόνο όσοι γνωρίζουν τον κωδικό μπορούν να περάσουν.

το pcc αποκρυπτογραφεί και επεξεργάζεται: μετά την παραλαβή του πακέτου, το pcc χρησιμοποιεί τον δικό του σούπερ εγκέφαλο (ισχυρό μοντέλο ai) για να κατανοήσει το αίτημά σας και να βρει την απάντηση. κατά τη διάρκεια αυτής της διαδικασίας, το pcc θα χρησιμοποιήσει διάφορες τεχνολογίες για να διασφαλίσει ότι τα δεδομένα σας δεν θα διαρρεύσουν ή θα καταχραστούν.

τα δεδομένα διαγράφονται αμέσως μόλις εξαντληθούν: αφού το pcc βρει την απάντηση, θα διαγράψει αμέσως όλα τα προσωρινά αποθηκευμένα δεδομένα σας, όπως ακριβώς σβήνετε τις λέξεις σε έναν πίνακα με νερό, χωρίς να αφήνετε ίχνη.

αποτέλεσμα επιστροφής: το pcc στη συνέχεια κρυπτογραφεί εκ νέου την απάντηση και την στέλνει πίσω στο τηλέφωνό σας μέσω ενός ασφαλούς καναλιού. ξεκλειδώνεις το τηλέφωνο και μπορείς να βγάλεις το συμπέρασμα.

εν ολίγοις, το pcc κρυπτογραφεί τις ανάγκες σας για εσάς, τις μεταβιβάζει στην τεχνητή νοημοσύνη για επεξεργασία σε ένα μυστικό κανάλι και τις διαγράφει μετά την επεξεργασία. ποιες τεχνολογίες χρησιμοποιεί λοιπόν το pcc για να διασφαλίσει ότι τα δεδομένα των χρηστών δεν θα διαρρεύσουν ή θα καταχραστούν;

για να χρησιμοποιήσετε μια ζωντανή αλλά όχι εντελώς αυστηρή μεταφορά για να καταλάβετε: το pcc είναι σαν ένα ειδικά σχεδιασμένο θησαυροφυλάκιο, είναι δύσκολο να βρείτε πού τοποθετούνται συγκεκριμένα τιμαλφή, επειδή αποθηκεύονται τυχαία γνωστή ως τεχνική «διάδοσης στόχου».

επιπλέον, οι πόρτες και οι κλειδαριές του θησαυροφυλακίου είναι πολύ ισχυρές και μπορούν να ανοίξουν μόνο από επαληθευμένους υπαλλήλους (δηλαδή κόμβους pcc) και κάθε φορά που ανοίγει η πόρτα απαιτείται ειδικό κλειδί (τεχνολογία κρυπτογράφησης). εφάπαξ χρήση καθίσταται άκυρη μετά τη χρήση, οπότε ακόμα κι αν κάποιος κλέψει το κλειδί, η πόρτα δεν μπορεί να ανοίξει.

το πιο σημαντικό είναι ότι ακόμα κι αν μπορείτε να μπείτε στο θησαυροφυλάκιο, αφού τα τιμαλφή σας βγάλουν και τα κοιτάξετε, θα τοποθετηθούν γρήγορα πίσω και θα κλειδωθούν χωρίς να αφήσουν ίχνη, έτσι ακόμα κι αν κάποιος θέλει να βρει την προηγούμενη θέση του είναι αδύνατο .

μόνο η apple έχει επί του παρόντος τις προϋποθέσεις για να εφαρμόσει αυτό το σχέδιο ασφαλείας επίπεδο προς επίπεδο.

αυτό πρέπει να αναφέρουμε το τρίτο σημαντικό μέρος της apple intelligence, το επίπεδο τσιπ που αναπτύσσεται μόνος του.αυτοί οι ασφαλείς διακομιστές χρησιμοποιούν το τσιπ m2 ultra που αναπτύχθηκε από την apple.

αυτά τα τσιπ παρέχουν ισχυρές δυνατότητες κρυπτογράφησης και είναι σε θέση να εκτελούν πολύπλοκους αλγόριθμους κρυπτογράφησης για να εξασφαλίσουν την ασφάλεια των δεδομένων κατά τη μετάδοση και την επεξεργασία. ενσωματώνει επίσης μια ποικιλία χαρακτηριστικών ασφαλείας υλικού, όπως το secure enclave, το οποίο είναι μια απομονωμένη περιοχή υλικού αφιερωμένη στον ασφαλή χειρισμό κλειδιών κρυπτογράφησης και ευαίσθητων λειτουργιών, διασφαλίζοντας ότι τα δεδομένα χρήστη προστατεύονται ακόμη και σε επίπεδο διακομιστή.

επιπλέον, τα τσιπ υποστηρίζουν την τεχνολογία secure boot, η οποία διασφαλίζει ότι οι διακομιστές μπορούν να εκτελούν μόνο λογισμικό υπογεγραμμένο από την apple, αποτρέποντας τη φόρτωση κακόβουλου λογισμικού κατά την εκκίνηση του συστήματος.

είτε πρόκειται για τα τσιπ της σειράς α του iphone είτε για τα τσιπ της σειράς m του mac, έχουν αναπτυχθεί πλήρως από την apple. αυτό σημαίνει ότι αυτά τα τσιπ είναι ενσωματωμένα στο σύστημα της apple από τη στιγμή που γεννιούνται και υποστηρίζουν τέλεια το apple intelligence όσον αφορά την απόδοση, την κατανάλωση ενέργειας, την ασφάλεια κ.λπ. αυτό είναι ένα πλεονέκτημα που άλλοι κατασκευαστές δεν έχουν καθόλου.

αυτά τα τρία χαρακτηριστικά αποτελούν ολόκληρο τον πυρήνα της ευφυΐας της apple: το τοπικά εκτελούμενο μοντέλο πελάτη και μια σειρά βασικών μοντέλων με συγκεκριμένες λειτουργίες, το μοντέλο cloud που παρέχεται μέσω ιδιωτικών υπηρεσιών υπολογιστικού νέφους και το ισχυρό επίπεδο τσιπ που αναπτύσσεται μόνος του.

σε αυτό το σημείο, μπορείτε να ρωτήσετε, πού είναι το openai; δεν υπήρχαν φήμες ότι το βασικό μοντέλο της apple intelligence χρησιμοποιεί το openai;

η apple δεν έχει ανακοινώσει πολλές λεπτομέρειες για τη συνεργασία της με το openai κρίνοντας από τα τρέχοντα αποτελέσματα, το chatgpt δεν είναι προεγκατεστημένο στο σύστημα με τη μορφή μιας ανεξάρτητης εφαρμογής η apple παρέχει στο openai μια διεπαφή προγράμματος μόνο για την ενσωμάτωση του chatgpt. , όπως και η συνεργασία μεταξύ της apple και της αναζήτησης google, το openai δεν θα λάβει υψηλότερα δικαιώματα.

σε αυτή τη διαδικασία, οι χρήστες έχουν το δικαίωμα να επιλέξουν ενεργά εάν θα χρησιμοποιήσουν τις υπηρεσίες του openai μετά την παράδοση των δεδομένων στο openai, η apple δεν θα είναι υπεύθυνη για την επακόλουθη ασφάλεια δεδομένων.

επιπλέον, το openai δεν θα είναι ο μόνος συνεργάτης σύμφωνα με αναφορές ξένων μέσων ενημέρωσης, η apple συζητά επίσης μεγάλη συνεργασία σχετικά με το μοντέλο με την google. επομένως, το openai θα πρέπει να είναι ένας από τους εταίρους στο οικοσύστημα apple intelligence.

σημείωση: το επίσημο διάγραμμα της apple για την ενσωμάτωση του gpt στο iphone

απογραφή προόδου: από ιούνιο έως αύγουστο,

πώς πάει το apple intelligence;

με τέτοια υποστήριξη βάσης, οι χρήστες μπορούν να βιώσουν πλήρως τις λειτουργίες του προϊόντος.

ας εξετάσουμε πρώτα τις συγκεκριμένες λειτουργίες του apple intelligence που ανακοινώθηκαν στο wwdc24 τον ιούνιο, οι οποίες μπορούν να χωριστούν στις ακόλουθες κατηγορίες:

τα εργαλεία γραφής μπορούν να σας βοηθήσουν να διορθώσετε, να ξαναγράψετε περιεχόμενο σύμφωνα με το στυλ, να συνοψίσετε περιεχόμενο κειμένου κ.λπ.

η δημιουργία εικόνων (παιδική χαρά εικόνων) δημιουργεί ενδιαφέρουσες και διασκεδαστικές εικόνες βασισμένες σε προτρεπτικές λέξεις

το genmoji δημιουργεί ενδιαφέροντα εξατομικευμένα emoticon

ένα πιο προηγμένο siri, η αλληλεπίδραση είναι πιο φυσική, πιο εξατομικευμένη και πιο βαθιά ενσωματωμένη στο σύστημα.

μόλις τον περασμένο αύγουστο, προγραμματιστές στη βόρεια αμερικήέχετε ήδη αρχίσει να χρησιμοποιείτε κατάλληλες συσκευές υλικού apple για να απολαύσετε ορισμένες από τις λειτουργίες του apple intelligence.

οι υπάρχουσες λειτουργίες είναι πιο λεπτομερείς από ό,τι όταν ανακοινώθηκαν στο wwdc24, αλλά οι συνολικές λειτουργίες είναι βασικά η βοήθεια κειμένου (γραφή, σύνοψη, απάντηση email, κ.λπ.), η δημιουργία εικόνας (επεξεργασία φωτογραφιών, genmoji), η εγγραφή και οργάνωση τηλεφώνου κ.λπ. ακολουθούν λίστα λειτουργιών που βασίζονται σε ελλιπή στατιστικά στοιχεία της tencent technology με βάση δημόσιες πληροφορίες:

μπορούμε να δούμε ότι η ταχύτερη πρόοδος είναι στις λειτουργίες που σχετίζονται με την επεξεργασία κειμένου.

όσον αφορά την πολυτροπική επεξεργασία, φαίνεται ότι τα αμιγώς άκρα εξαρτήματα είναι πλέον online, όπως η αναζήτηση φωτογραφιών, η εγγραφή κλήσεων κ.λπ. φαίνεται ότι οι πολυτροπικές λειτουργίες που απαιτούν την κινητοποίηση δυνατοτήτων cloud δεν είναι ακόμη έτοιμες.

λειτουργίες που είναι απλώς ενσωματωμένες στο σύστημα, όπως οι λειτουργίες εστίασης και οι σημαντικές ειδοποιήσεις προτεραιότητας, θα πρέπει όλες να υποβάλλονται σε επεξεργασία καθαρά από την τελική πλευρά και να έχουν ήδη ξεκινήσει. έχουν κυκλοφορήσει απλές λειτουργίες, όπως τα νέα ειδικά εφέ διεπαφής χρήστη της siri.

ωστόσο, η πολυαναμενόμενη αναβάθμιση του siri που είναι βαθιά ενσωματωμένη στο σύστημα, η οποία μπορεί να μεταφερθεί μεταξύ διαφορετικών εφαρμογών μέσω φωνητικών εντολών, και η ενσωμάτωση του τρίτου κατασκευαστή openai μεγάλου μοντέλου gpt, δεν έχουν ακόμη κυκλοφορήσει. σύμφωνα με την επίσημη ιστοσελίδα της apple, εντός του επόμενου έτους θα ολοκληρωθούν ενημερώσεις σε άλλες γλώσσες (μη αγγλικά), δυνατότητες πλατφόρμας λογισμικού κ.λπ.

αν κοιτάξετε τη γραμμή προόδου, υπολογίζεται ότι μόνο το 30% περίπου της υπόσχεσης που έδωσε η apple στο wwdc24 έχει ολοκληρωθεί.

αλλά αν οι χρήστες θέλουν να το χρησιμοποιήσουν, υπάρχουν πολύ αυστηρές προϋποθέσεις: η χρησιμοποιούμενη συσκευή πρέπει να είναι το διάδοχο μοντέλο του iphone 15 pro, του iphone 15 pro max ή το ipad και το mac μετά το τσιπ m1. επίσης, η γλώσσα του siri και της συσκευής πρέπει να οριστεί στα αγγλικά (ηνωμένες πολιτείες).

σημείωση: ο επίσημος ιστότοπος της apple ανακοινώνει τις συνθήκες υλικού και συστήματος για την εμπειρία χρήσης των έξυπνων συσκευών της apple

το φετινό φθινοπωρινό συνέδριο παρουσίασης νέων προϊόντων,

τι περιμένεις περισσότερο;

το πρωτότυπο του apple intelligence έχει δημιουργηθεί, αλλά θα χρειαστεί ακόμη πολύς χρόνος μέχρι να το χρησιμοποιήσουν όλοι οι χρήστες της apple.

εάν το προϊόν σας πληροί τις απαιτήσεις υλικού, γλώσσας και περιοχής που αναφέρονται από την apple, μπορείτε να συναντήσετε το apple intelligence για πρώτη φορά το φθινόπωρο.φυσικά, μπορεί να μην είναι το λανσάρισμα του νέου προϊόντος τον σεπτέμβριο.

εκτός από το apple intelligence, μπορούμε επίσης να περιμένουμε με ανυπομονησία το τσιπ a18 που θα εγκατασταθεί στο iphone 16 σε αυτό το φθινοπωρινό λανσάρισμα νέου προϊόντος.

σύμφωνα με τις ειδήσεις που εκτίθενται αυτή τη στιγμή,η apple θα χρησιμοποιήσει την ίδια διαδικασία tsmc n3e με το m4 για το τσιπ a18σε σύγκριση με τη διαδικασία n3b που χρησιμοποιήθηκε στο a17 pro του περασμένου έτους, το n3e έχει μεγαλύτερα πλεονεκτήματα στη βελτίωση της ενεργειακής απόδοσης.

τι είναι η διαδικασία n3e;

είναι ισοδύναμο με εσωτερική αναβάθμιση του τσιπ κινητού τηλεφώνου παρόλο που το μέγεθος του σπιτιού (βασική μονάδα) δεν έχει αλλάξει, οι δρόμοι (κύκλωμα) και οι εγκαταστάσεις (τρανζίστορ) έχουν επανασχεδιαστεί για να κάνουν ολόκληρη την περιοχή (τσιπ) να λειτουργεί περισσότερο. αποτελεσματικά. αυτό είναι σαν να κάνουμε την αστική κυκλοφορία πιο ομαλή και τους κατοίκους να χρησιμοποιούν λιγότερη ηλεκτρική ενέργεια. επομένως, το τσιπ a18 που χρησιμοποιεί αυτή τη διαδικασία μπορεί να επιτρέψει στους χρήστες να αισθάνονται ότι το κινητό τηλέφωνο ανταποκρίνεται πιο γρήγορα, η μπαταρία διαρκεί περισσότερο και μπορεί να χειριστεί πολλές εργασίες πιο ομαλά ταυτόχρονα.

φημολογείται ότι το npu του a18 soc θα αναβαθμιστεί σημαντικά και η συνολική υπολογιστική ισχύς θα είναι υψηλότερη από τα 38 tops του m4.

αυτό σημαίνει ότι η υπολογιστική ισχύς npu του επερχόμενου iphone 16 είναι ήδη συγκρίσιμη με τα καλύτερα συστήματα επιτραπέζιων υπολογιστών της apple. προκειμένου να ανταπεξέλθει στο όριο μνήμης της apple intelligence, το iphone 16 θα αυξήσει επίσης τη μνήμη λειτουργίας του σώματος στα 8 gb για πρώτη φορά.

από τη μνήμη στην κατανάλωση ενέργειας μέχρι την υπολογιστική ισχύ, φαίνεται να έχει σχεδιαστεί για την apple intelligence.

η υπολογιστική ισχύς npu του a17 pro που κυκλοφόρησε η apple πέρυσι ήταν 35 tops και το a18 θα είναι μόνο υψηλότερο

προφανώς, από τον σεπτέμβριο του τρέχοντος έτους, όλα τα μελλοντικά προϊόντα υλικού που θα λανσαριστούν από την apple θα αγκαλιάζουν ενεργά την apple intelligence.

δεν περιορίζεται μόνο σε iphone, mac και ipad, αλλά ακόμη και προϊόντα όπως το apple watch, το homepod και το vision pro ενδέχεται να γίνουν μέρος της στρατηγικής ai της apple στο μέλλον.

στο wwdc24, ο ανώτερος αντιπρόεδρος της apple, κρεγκ, παρουσίασε ένα γρήγορο και σχετικό σενάριο χρήσης της apple ai: λήφθηκε μια προσωρινή ειδοποίηση αλλαγής ώρας συνάντησης και ο siri ρωτήθηκε αν μπορούσε ακόμα να παρακολουθήσει τις δραστηριότητες των παιδιών που ήθελε αρχικά να παρακολουθήσει.

συνέχισε να μιλά με τη siri και η εφαρμογή για κινητά μεταπηδούσε ομαλά ανάμεσα σε πολλές εφαρμογές όπως email, ημερολόγιο και χάρτες. στο τέλος, χωρίς να σηκώσει το δάχτυλό του, το τηλέφωνό του του έκανε μια λογική πρόταση.

αυτή μπορεί να είναι η ιδανική κατάσταση των τελικών συσκευών τεχνητής νοημοσύνης στο μέλλον: με μία μόνο εντολή, μπορεί να καλέσει αυτόματα την απαιτούμενη εφαρμογή και να ολοκληρώσει την επιθυμητή εργασία.

σε αυτή τη σκηνή επίδειξης, βλέπουμε ότι οι εφαρμογές που καλούνται από τη siri είναι όλες επίσημες εφαρμογές της apple. με άλλα λόγια, κινητοποιεί τα "μέλη της οικογένειάς της" για να συνεργαστούν για να κάνουν κάτι. σε αυτήν την περίπτωση, το σύστημα, η αρχιτεκτονική, η διεπαφή, τα πάντα δεν είναι πρόβλημα και δεν εμπλέκονται ζητήματα όπως η διανομή οφελών.

για να είμαστε πιο φανταστικοί, ίσως στο μέλλον το siri να μην χρειάζεται λέξεις εντολών, να περιμένει πάντα συνομιλίες στο παρασκήνιο και μπορεί ακόμη και να παρεμβαίνει όταν οι άνθρωποι επικοινωνούν, ακριβώς όπως ένας πραγματικός φίλος.

apple intelligence

μπορούμε να συνεχίσουμε να είμαστε ο οικολογικός βασιλιάς;

η apple χρησιμοποίησε τη μέθοδο της ελάχιστης αντίστασης για να επιδείξει την ιδανική μελλοντική μέθοδο αλληλεπίδρασης κινητού τηλεφώνου με τεχνητή νοημοσύνη. αλλά αν δεν είναι η δική σας εφαρμογή, μπορείτε ακόμα να κινητοποιήσετε ελεύθερα τα δεδομένα εντός της εφαρμογής;

υπάρχει αυτή η πρόταση στην επίσημη σελίδα εισαγωγής του apple intelligence, "εάν χρησιμοποιείτε τυπικά πλαίσια διεπαφής χρήστη, api και κιτ ανάπτυξης, μπορείτε εύκολα να κάνετε τις εφαρμογές που αναπτύσσετε να έχουν επίσης αυτές τις λειτουργίες ai."

οι προγραμματιστές μπορούν ακόμη και να δουν στο εργαστήριο wwdc24 ότι μπορούν να ενσωματώσουν λειτουργίες ai στις εφαρμογές τους με μόλις τρεις ή τέσσερις γραμμές κώδικα.

υπάρχουν δύο πληροφορίες εδώ: οι εφαρμογές τρίτων είναι ευπρόσδεκτες να ενταχθούν στην τεχνητή νοημοσύνη και η apple θα προετοιμάσει όλα τα κιτ και τα εργαλεία για να επιτρέψει στους προγραμματιστές να χρησιμοποιήσουν το apple intelligence με τον πιο εύκολο τρόπο. αυτό είναι πράγματι ένα νόστιμο "ορεκτικό".

αλλά αν θέλετε να αποκτήσετε πρόσβαση στο apple intelligence, οι εφαρμογές πρέπει να παραδώσουν τα «δεδομένα» τους και να γίνουν ένα μικρό μέλος του οικοσυστήματος της apple. είναι πραγματικά τόσο απλό αυτό;

για την apple, οι τεχνικές ανακαλύψεις στην αρχή του άρθρου είναι τα πιο απλά προβλήματα, ενώ οι οικολογικές δυσκολίες είναι το μεγάλο βουνό μπροστά στην apple.

εάν η αλληλεπίδραση στο κινητό τηλέφωνο είναι πραγματικά όπως αποδεικνύεται από τον κρεγκ, η apple θα γίνει ο "βασιλιάς" με τη μοναδική είσοδο και η siri θα γίνει το μόνο "πολύ ισχυρό" άτομο γύρω από τον βασιλιά, υπεύθυνο για να αποφασίσει ποια εφαρμογή είναι ο "βασιλιάς". θέλει να αποκτήσει πρόσβαση στον χρήστη δεν θέλετε απλώς να γνωρίσετε τη "δική σας οικογένεια";

σε αυτήν την περίπτωση, η apple θα γίνει ο κόσμος όλων των ειδών σούπερ εφαρμογών.

ποιος θα αποφασίσει για την κατανομή των επιδομάτων; θα είναι πρόθυμα τα επιχειρηματικά μοντέλα που δημιουργήθηκαν από τις σούπερ εφαρμογές να εξαλειφθούν από την τεχνητή νοημοσύνη εν μία νυκτί; αυτά τα ερωτήματα περιμένουν ακόμα να τα σκεφτούμε.

γράψε στο τέλος

η siri κουβαλά το ρομαντικό όνειρο του jobs όταν περιγράφει την επαφή του με τον jobs, ο dag kittlaus, ένας από τους ιδρυτές της siri company, είπε κάποτε ότι αυτός και ο jobs «κουβέντιασαν για 3 ώρες» στο σπίτι. ο jobs ήταν γεμάτος οράματα για το μέλλον της τεχνητής νοημοσύνης έπεισε τα ιδρυτικά μέλη της siri ότι «η siri θα αφήσει τελικά το στίγμα της στο σύμπαν».

λεζάντα: dag kittlaus, ένας από τους ιδρυτές της siri

ωστόσο, την επομένη της απελευθέρωσης του siri, ο steve jobs έφυγε από τη ζωή, αφήνοντας πίσω του αυτό το όνειρο της τεχνητής νοημοσύνης και τη siri, που «περιπλανήθηκε για πολλά χρόνια».

σήμερα, ο cook χρησιμοποιεί το apple intelligence για να επαναφέρει το siri στο προσκήνιο, αλλά το όνειρο μπορεί να είναι διαφορετικό.

η σημερινή apple είναι γεμάτη ρεαλισμό - διατηρώντας την τεχνολογική ηγεσία, αποτελεσματική άμυνα, κρατώντας την τιμή της μετοχής από πίεση και περιμένοντας έως ότου διαμορφωθούν οι σούπερ εφαρμογές στην εποχή της τεχνητής νοημοσύνης προτού σκεφτείτε εάν θα αναλάβετε δράση.

ωστόσο, ενώ όλοι ανυπομονούν για τηλέφωνα τεχνητής νοημοσύνης και τα aipc, μπορεί να υπάρχουν πιο εκπληκτικά προϊόντα υλικού με τεχνητή νοημοσύνη που θα ξαναγράψουν εντελώς την ιστορία.

παραπομπές:

παρουσίαση των μοντέλων θεμελίωσης σε συσκευή και διακομιστή της apple - έρευνα μηχανικής εκμάθησης της apple

apple intelligence - apple developer

παρουσιάζουμε το apple intelligence για iphone, ipad και mac - apple

blog - private cloud compute: ένα νέο σύνορο για το απόρρητο της τεχνητής νοημοσύνης στο cloud - apple security research

https://mrmad.com.tw/ios-18-new-function