τα στοιχεία επικοινωνίας μου
ταχυδρομείο[email protected]
2024-09-30
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
η "ηχογράφηση lu wenqing" που εκτέθηκε στο περιστατικό xiao yang προκάλεσε αρχικά δημόσια κατακραυγή λόγω της κλίμακας του περιεχομένου και στη συνέχεια διαπιστώθηκε ότι ήταν όλα πλαστά από ai.
με την πάροδο του χρόνου, η τεχνολογία ai έχει για άλλη μια φορά ωθηθεί στο προσκήνιο.
εικόνα/επίσημη απάντηση από την yanyu technology
ανεξάρτητα από το αν η τεχνολογία είναι καλή ή κακή, στην ουσία, η εγγραφή με σύνθεση ai μπορεί να γίνει κατανοητή ως ένα είδος deepfake, το οποίο χρησιμοποιεί αλγόριθμους βαθιάς μάθησης για την προσομοίωση και τη σφυρηλάτηση ήχου και βίντεο, δηλαδή μέσω του μοντέλου βαθιάς μάθησης στην τεχνολογία τεχνητής νοημοσύνης , οι φωνές των ανθρώπων, οι εκφράσεις του προσώπου και οι κινήσεις του σώματος συνδυάζονται σε πολύ ρεαλιστικό ψεύτικο περιεχόμενο.
από τεχνική άποψη, είναι ουδέτερη, εκτός από την προσομοίωση φωνής, παρόμοιες μέθοδοι περιλαμβάνουν επίσης την αλλαγή προσώπου, τη σύνθεση προσώπου, τη δημιουργία βίντεο κ.λπ., που συλλογικά αναφέρονται ως βαθιά πλαστογραφία.
ωστόσο, η ουδέτερη τεχνολογία δεν μπορεί να εμποδίσει τους χρήστες να αναζητήσουν κακές προθέσεις.
ο lan mediahui συμβουλεύτηκε τον lin hongxiang, ιδρυτή και διευθύνοντα σύμβουλο της fengping intelligence, μιας κορυφαίας εγχώριας εταιρείας ψηφιακής ανθρώπινης τεχνητής νοημοσύνης. της «εφαρμογής» , εάν πρόκειται να απομονωθούν πλήρως οι παραβιάσεις, ενδέχεται να απαιτηθούν συστηματικοί κανονισμοί και αποτελεσματική εφαρμογή.
σύμφωνα με το τρέχον τεχνικό επίπεδο του κλάδου, οι χρήστες χρειάζεται μόνο να βρουν μερικά λεπτά διάσπαρτου υλικού ως δείγματα εκμάθησης τεχνητής νοημοσύνης για να κλωνοποιήσουν γρήγορα μια πλήρη ανθρώπινη φωνή ai. ορισμένες από τις παύσεις ομιλίας, τα συναισθήματα και τους τονισμούς στην ηχογράφηση μπορούν να προστεθούν, να αφαιρεθούν και να προσαρμοστούν με τεχνικά μέσα.
επιπλέον, όταν πρόκειται για πρακτικές εφαρμογές, το κόστος της αντιγραφής ενός συνόλου ανθρώπινων φωνών τεχνητής νοημοσύνης δεν είναι «τώρα υψηλό». υπηρεσία κλωνοποίησης φωνής, η πιο επαγγελματική έκδοση απαιτεί επιπλέον χρέωση.
ένα τμήμα της ζωντανής μετάδοσης του boss lu που υποκλαπόταν από το διαδίκτυο μετατράπηκε σε ήχο και εισήχθη σε λίγα δευτερόλεπτα, η φωνή του boss lu κλωνοποιήθηκε.
στη συνέχεια, μιμηθήκαμε μια ηχογράφηση στο αρχικό περιστατικό που είχε πολύ εξωφρενικά συναισθήματα και κείμενο, και το χρησιμοποιήσαμε ως μοντέλο εισαγωγής σεναρίου για να δημιουργήσουμε μια ηχογράφηση του lu wenqingrui να σχολιάζει τον musk, και τελειώσαμε.
"ο xiao ma και οι άλλοι έφυγαν, σωστά; σου λέω, όποιος θέλω να γίνει δημοφιλής μπορεί να γίνει δημοφιλής, κατάλαβε. ξέρω πολλούς διευθύνοντες συμβούλους και δεν επαινώ κανέναν που επαινώ. μην το αναφέρω μόσχος , δεν κάνει, ξέρεις, δεν κάνει, ούτε όταν πίνουμε, ποιος είναι χωρίς τρία πρόβατα, το καταλαβαίνεις; ”
ειλικρινά μιλώντας, αν έχετε ακούσει τέτοιου είδους κλήσεις απάτης τεχνητής νοημοσύνης πάρα πολλές φορές ή είστε ευαίσθητοι στις ανθρώπινες φωνές, μπορείτε πραγματικά να πείτε ότι ο ήχος ai έχει μια "αίσθηση μηχανής" - ο τονισμός είναι πολύ σταθερός από την αρχή έως τέλος, και δεν θα ακούγεται ποτέ όταν οι άνθρωποι είναι συναισθηματικά ενθουσιασμένοι θα είναι έτσι. αλλά αυτό είναι μόνο το πιο βασικό μοντέλο κανονικής έκδοσης και η λειτουργία άμεσης κλωνοποίησης. εάν υπάρχει περισσότερο επαρκές σώμα και επιλεγεί η λειτουργία επαγγελματικής κλωνοποίησης, το αποτέλεσμα θα είναι πιο "πραγματικό".
λοιπόν, είναι δυνατόν ο ήχος και το βίντεο που συντίθεται από την τεχνητή νοημοσύνη να είναι τόσο διαισθητικά όσο ένας ανιχνευτής ψεύδους για να διακρίνει την αυθεντικότητα μέσω των δεδομένων;
σε τεχνικό επίπεδο, είναι εφικτό. ο lin hongxiang είπε ότι εκτός από την εξουσιοδότηση του ίδιου του χρήστη, υπάρχουν πράγματι υπό κατασκευή σχετικά πρότυπα στην ψηφιακή ανθρώπινη βιομηχανία ai, τα οποία απαιτούν να προστίθενται όλα τα είδη περιεχομένου που δημιουργείται από ai με ειδικά αναγνωρίσιμα "σημάνσεις χαρακτηριστικών".
αυτή η ετικέτα δεν προσθέτει απλώς ένα υδατογράφημα "generated by xx ai" στη γωνία λαμβάνοντας ως παράδειγμα τον ήχο με σύνθεση ai, θα προσθέσει πρόσθετες ζώνες συχνοτήτων εκτός της ζώνης συχνοτήτων των ανθρώπινων ομιλητών ήχων, ακόμη και εντός του εύρους των ορατών ήχων. προσθέστε ορισμένες χαρακτηριστικές ζώνες συχνοτήτων.
αυτή η χαρακτηριστική συχνότητα μπορεί να αναγνωριστεί από το μηχάνημα εάν απαιτείται αναγνώριση, η συσκευή μπορεί να εξαγάγει αυτές τις ζώνες συχνοτήτων και θεωρητικά μπορεί να προσδιοριστεί η αυθεντικότητα.
προς το παρόν, δεν υπάρχουν πολλές εταιρείες που είναι πρόθυμες να διαδώσουν αυτή τη λειτουργία ο περιοριστικός παράγοντας είναι το κόστος μιας ακόμη διαδικασίας στη φάση της εκπαίδευσης και το κόστος που προέκυψε για την ανάπτυξη του μοντέλου ήχου και εικόνας επόμενης γενιάς μετά από σταδιακή έξοδο εξακολουθούν να ασκούν μεγάλη πίεση στις εταιρείες τεχνητής νοημοσύνης σε αυτό το στάδιο.
προς το παρόν, η βιομηχανία ήχου και βίντεο της τεχνητής νοημοσύνης βρίσκεται ακόμη στα πρώτα της στάδια πώς να αποκτήσετε πελάτες ενώ καλύπτετε το κόστος κατά το στάδιο της προώθησης είναι ένα θέμα που οι επαγγελματίες δεν μπορούν να αποφύγουν.
αλλά αυτά δεν είναι προφανώς πράγματα που θα εξετάσουν οι εγκληματίες με κακές προθέσεις το αν τα πυροτεχνήματα ή οι βόμβες εξαρτάται από το πώς χρησιμοποιείται η πυρίτιδα.
πριν από περισσότερο από μισό χρόνο, η αστυνομία του χονγκ κονγκ αποκάλυψε μια υπόθεση απάτης που αφορούσε συνολικό ποσό 200 εκατομμυρίων δολαρίων hk. στην υπόθεση, οι υπάλληλοι του υποκαταστήματος μιας πολυεθνικής εταιρείας στο χονγκ κονγκ έλαβαν ειδοποίηση από τον οικονομικό διευθυντή της έδρας, λέγοντας ότι η έδρα σχεδίαζε μια "μυστική συναλλαγή" και έπρεπε να μεταφέρει τα κεφάλαια της εταιρείας σε πολλούς τοπικούς λογαριασμούς στο χονγκ κονγκ για αργότερα. χρήση.
στη συνέχεια, οι εργαζόμενοι προσκλήθηκαν να συμμετάσχουν σε μια «τηλεδιάσκεψη πολλών ατόμων» που ξεκίνησε από τα κεντρικά γραφεία και σύμφωνα με τις απαιτήσεις της συνάντησης, 200 εκατομμύρια hk $ μεταφέρθηκαν 15 φορές σε 5 τραπεζικούς λογαριασμούς.
πηγή/ειδήσεις cctv
μάλιστα, σε αυτή τη βιντεοδιάσκεψη πολλών ατόμων, εκτός από τους υπαλλήλους του υποκαταστήματος, τα άλλα «άτομα» ήταν εικόνες τεχνητής νοημοσύνης που συνέθεσαν απατεώνες χρησιμοποιώντας δημόσια αποσπάσματα ήχου και βίντεο και στη συνέχεια χρησιμοποιούσαν την τηλεδιάσκεψη για να αλλάξουν πρόσωπα και φωνές η ομάδα απάτης γίνεται η εκτελεστική ομάδα που καλεί τους πυροβολισμούς.
στην περίπτωση του χονγκ κονγκ, οι εγκληματίες ισοδυναμούν με τη χρήση αλλαγής προσώπου με τεχνητή νοημοσύνη + αλλαγής φωνής ai για να εμφανιστούν στη σκηνή, ωστόσο, η πλαστογραφημένη τεχνητή νοημοσύνη του xiao yang αυτή τη φορά συντέθηκε πλήρως από ένα μεγάλο μοντέλο αφού μάθαινε το σχετικό ηχητικό υλικό του lu. wenqing από την three sheep company, τα συναισθήματα είναι κοντά σε ολόκληρο τον ήχο ενός πραγματικού προσώπου. η διαδικασία είναι τόσο απλή - ο ήχος και το βίντεο που συντίθεται με ai είναι ήδη μια ώριμη τεχνολογία και τα σχετικά προϊόντα έχουν επίσης εξελιχθεί σε μια πλήρη βιομηχανία.
ωστόσο, το κύριο ρεύμα ήχου και βίντεο που συντίθεται με ai δεν είναι σίγουρα ψεύτικο. στην πλοκή του the wandering earth part 2, ο tu hengyu, τον οποίο υποδύεται ο andy lau, ανέστησε τον yaya με τη μορφή μιας ψηφιακής ζωής έξω από την πλοκή, ο αείμνηστος διάσημος αστέρας του κινηματογράφου ng meng-tat εμφανίστηκε επίσης στην οθόνη μέσω ai.
επομένως, εάν υπάρξει άλλο περιστατικό όπως το περιστατικό ηχογράφησης του xiao yang στο μέλλον, προτού συζητήσουμε εάν η τεχνολογία είναι ένοχη ή αθώα, θα πρέπει πρώτα να προσπαθήσουμε να ελέγξουμε τους ανθρώπους.
φροντίστε την ανθρωπότητα και σώστε την τεχνητή νοημοσύνη.