Νέα

Η τεχνητή νοημοσύνη επιτίθεται στη βιομηχανία μεταγλώττισης! 5.000 Αυστραλοί ηθοποιοί φωνής χάνουν τις δουλειές τους καθώς κλώνοι τεχνητής νοημοσύνης αντικαθιστούν πραγματικούς χαρακτήρες

2024-07-17

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


Νέα Έκθεση Σοφίας

Επιμέλεια: Er Qiao Yang

[Εισαγωγή στη Νέα Σοφία] Καθώς το κύμα ανάπτυξης της τεχνητής νοημοσύνης σαρώνει, οι ρόλοι ενός μεγάλου αριθμού μέσων και ραδιοφωνικών σταθμών έχουν αρχίσει να αντικαθίστανται από φτηνούς κλώνους τεχνητής νοημοσύνης. Η Ένωση Αυστραλιανών Φωνητικών Ηθοποιών δήλωσε μάλιστα ότι περίπου 5.000 φωνητές κινδυνεύουν να χάσουν τη δουλειά τους.

Πρόσφατα σε διάφορες πλατφόρμες βίντεο, η τεχνητή νοημοσύνη έχει γίνει ο νέος κωδικός πρόσβασης κυκλοφορίας στο δεύτερο κομμάτι καινοτομίας.


Από τραγουδιστές μέχρι χαρακτήρες παιχνιδιών για κινητά και χαρακτήρες anime, η μεταγλώττιση με τεχνητή νοημοσύνη είναι παντού στο Διαδίκτυο.

Οι τραγουδιστές μπορούν να συνεργαστούν στο χρόνο και στο χώρο και οι αγαπημένοι σας χαρακτήρες anime μπορούν επίσης να σας τραγουδήσουν Οι άνθρωποι στην περιοχή σχολίων είπαν: Δύο σεφ είναι εκστασιασμένοι! Το παλάτι! Η μητέρα της Xiaoba θα σας επαινέσει αυτή τη φορά!


Η ταχεία ανάπτυξη της τεχνολογίας AI είναι προφανής σε όλους και η τεχνολογία της χρήσης AI για την έξυπνη παραγωγή ήχων, εικόνων και βίντεο έχει μια ασταμάτητη τάση.

Η χρήση της μεταγλώττισης τεχνητής νοημοσύνης στον τομέα της παραγωγής βίντεο δεν περιορίζεται στη δευτερεύουσα δημιουργία Με την εμφάνιση ενός μεγάλου αριθμού παραγωγικών προϊόντων τεχνητής νοημοσύνης, η μεταγλώττιση τεχνητής νοημοσύνης μπορεί ήδη να ικανοποιήσει την απλή δημιουργία μέσων.


Στο λογισμικό παραγωγής βίντεο, υπάρχουν έως και 70 ή 80 είδη αντιγραφής και ανάγνωσης ηχητικών εφέ με τεχνητή νοημοσύνη.

Οι εργασίες μεταγλώττισης που απαιτούν χαμηλότερη ποιότητα ήχου και μικρότερο χρόνο αντικαθίστανται σταδιακά από τη μεταγλώττιση με τεχνητή νοημοσύνη.

Τα τελευταία χρόνια, η τεχνητή νοημοσύνη έχει γίνει σχεδόν μια γενική τάση για την ανατροπή των παραδοσιακών βιομηχανιών.

Πολλές εργασίες που βασίζονταν αρχικά στην ανθρώπινη εργασία αντικαθίστανται σταδιακά από την τεχνητή νοημοσύνη και τώρα η βιομηχανία μεταγλώττισης θα ενταχθεί επίσης σε αυτή τη σειρά.

Αντιμετωπίζοντας τη νέα αναταραχή στη βιομηχανία, ο κόσμος δεν μπορεί παρά να ρωτήσει, πού πρέπει να πάνε οι ηθοποιοί της μεταγλώττισης;

Ο ηθοποιός φωνής του «The House That Never Collapses»;

Η ElevenLabs, μια εταιρεία εκκίνησης φωνής, χρησιμοποίησε AI για να μεταγλωττίσει τα κλασικά βίντεο του Sora μετά την κυκλοφορία του Sora τον Φεβρουάριο του τρέχοντος έτους.

Στις 25 Ιουνίου, η ElevenLabs κυκλοφόρησε την εφαρμογή ανάγνωσης AI χωρίς διακοπή.


Παρουσιάζουμε την εφαρμογή ElevenLabs Reader. Ακούστε οποιοδήποτε άρθρο, PDF, ePub ή οποιοδήποτε κείμενο οπουδήποτε, οποτεδήποτε με την υψηλότερη ποιότητα φωνής AI.

Επιπλέον, μετά από αξιολόγηση, αυτή η εφαρμογή έχει λάβει επίσης εξαιρετικά υψηλές αξιολογήσεις από τους χρήστες.


Ακούστε τι είπαν μερικοί από τους δοκιμαστές μας: Συνολικά, είναι τέλειο. Η προφορά, ο τονισμός, η προφορά και η ευχέρεια είναι όλα εξαιρετικά. Είχαμε τη χαρά να χρησιμοποιήσουμε την υπηρεσία ανάγνωσης κινητής τηλεφωνίας σας τις τελευταίες εβδομάδες και ήταν υπέροχο. Είναι εξαιρετικό για την ανασκόπηση εγγράφων και προσχεδίων, την παρακολούθηση της προόδου και οι διαφορετικές φωνές που προστέθηκαν πρόσφατα το έχουν κάνει μια φανταστική εμπειρία. Η δυνατότητα διατήρησης του τόνου και του τόνου σε μεγάλο αριθμό άρθρων αποδεικνύει πόσο ισχυρή είναι αυτή η εφαρμογή και την ξεχωρίζει από παρόμοια προϊόντα στην αγορά.

Και όταν κάποιοι αμφισβήτησαν αν η μεταγλώττιση τεχνητής νοημοσύνης μπορεί πραγματικά να μεταφέρει συναισθήματα, η ενότητα σχολίων ανέφερε επίσης τα προϊόντα Elevenlabs και το GPT-4o.


Νομίζω ότι πάντα θα υπάρχει ανάγκη για ηθοποιούς ανθρώπινης φωνής, ειδικά εκείνους που απαιτούν πραγματικό συναίσθημα και απόχρωση. Τα φωνητικά τεχνητής νοημοσύνης είναι εξαιρετικά για εκφωνητές ή αφήγηση, αλλά δεν νομίζω ότι μπορούν πραγματικά να αιχμαλωτίσουν την ψυχή της ανθρώπινης φωνής.


Έχω ακούσει δείγματα της δουλειάς των Elevenlabs και είναι εξαιρετική, και οι φωνητικές δυνατότητες του επερχόμενου GPT-4o είναι ακόμα καλύτερες.

Η μεταγλώττιση της τεχνητής νοημοσύνης χρησιμοποιεί συχνά μια τεχνολογία που ονομάζεται Deepfake Voice, η οποία μπορεί να αναπαράγει τις ανθρώπινες φωνές με μεγάλη ακρίβεια σε ύψος και ομοιότητα.

Αυτή η τεχνολογία προσφέρει μεγάλη ευκολία στη μεταγλώττιση, αφενός, μειώνει το κόστος και, αφετέρου, όταν οι ηθοποιοί μεταγλώττισης δεν μπορούν να ολοκληρώσουν το έργο, οι προσομοιωμένες φωνές μπορούν να αναλάβουν τη δουλειά.

Με αυτόν τον τρόπο, τα πραγματικά βιογραφικά με υψηλές χρεώσεις εμφάνισης και τον κίνδυνο κατάρρευσης του σπιτιού είναι πράγματι ένα προειδοποιητικό καμπανάκι: η τεχνητή νοημοσύνη είναι φθηνή και υψηλής ποιότητας, τι γίνεται με εμάς;

Η κρίση καριέρας των ηθοποιών φωνής

Οι φωνητές λένε ότι οι δουλειές τους πρόκειται να αντικατασταθούν πλήρως από την τεχνητή νοημοσύνη, με εμπορικούς ρόλους φωνής και ραδιοφώνου να έχουν ήδη αρχίσει να αντικαθίστανται από φτηνούς κλώνους GenAI.

Οι τακτικοί ηθοποιοί που εργάζονται σε διαφημίσεις, ηχητικά βιβλία και βιντεοπαιχνίδια ανησυχούν ότι κινδυνεύουν να κλωνοποιήσουν τη φωνή τους ή να χάσουν τη δουλειά τους εξ ολοκλήρου λόγω της αύξησης της κλωνοποίησης φωνής με τεχνητή νοημοσύνη.

Ο Cooper Mortlock είναι ένας Αυστραλός ηθοποιός φωνής που άρχισε να κάνει φωνητικές εργασίες στην αρχή της πανδημίας Covid-19.


Ο Cooper Mortlock λέει ότι ένα έργο κινουμένων σχεδίων στο οποίο συμμετείχε κλωνοποίησε τη φωνή του και τη χρησιμοποίησε χωρίς συγκατάθεση μετά τη διακοπή της εργασίας.

Είπε ότι αυτό θα υπονόμευε το έργο των νέων φωνητικών ηθοποιών που προσπαθούν να καθιερωθούν στη βιομηχανία μεταγλώττισης.

Ο Cooper Mortlock είπε, «Αυτό όχι μόνο περιορίζει τις ευκαιρίες για τους ίδιους τους καλλιτέχνες, αλλά περιορίζει επίσης το δημιουργικό πεδίο του έργου».

Επειδή η τεχνητή νοημοσύνη που λειτουργεί σύμφωνα με σταθερές διαδικασίες δεν έχει καμία πιθανότητα εκπλήξεων ή εκπλήξεων, η τεχνητή νοημοσύνη χρησιμοποιεί πράγματα που υπάρχουν ήδη και τα επαναχρησιμοποιεί σε αυτή τη βάση, χωρίς τη σπίθα της τυχαίας σύγκρουσης στη διαδικασία μεταγλώττισης.

Με άλλα λόγια, η χρήση ομιλίας AI για τη δημιουργία διαλόγου δεν θα έχει τη δημιουργικότητα που προκύπτει από τη χρήση ανθρώπινων φωνητικών ηθοποιών για σεναριακούς διαλόγους.

Ο Κούπερ Μόρτλοκ χρησιμοποίησε μια ζωντανή μεταφορά για να το περιγράψει, «Είναι τόσο φαρδύ όσο ο ωκεανός αλλά τόσο ρηχό όσο μια λακκούβα».

"Για παράδειγμα, συγκρίνετε μερικά πρόσφατα βιντεοπαιχνίδια που δίνουν μεγάλη έμφαση στην αφήγηση ιστορίας και στον χαρακτήρα, όπως τα "Cyberpunk 2077", "The Witcher 3", "Baldur's Gate 3"... Αυτά τα παιχνίδια είναι όλα τόσο εξαιρετικά κατασκευασμένα. Σκεφτείτε προσεκτικά. "

Μέχρι τώρα, η κλωνοποίηση φωνής με τεχνητή νοημοσύνη συχνά παλεύει με μη αμερικανικές προφορές. Για παράδειγμα, οι αυστραλιανές φωνές τείνουν να έχουν κλίση αμερικανικής προφοράς.

Μια νέα υπηρεσία φωνής προσφέρει τώρα μια ολόκληρη σειρά διαφορετικών προφορών για Αυστραλούς όλων των ηλικιών.

Ο Κούπερ Μόρτλοκ ελπίζει ότι αυτό το «καθυστέρησε αλλά έφτασε» είναι σημάδι ότι οι Αυστραλοί δεν θα εγκαταλείψουν τη φωνή τους.

Η Αυστραλιανή Ένωση Φωνητών (AAVA) είπε σε κοινοβουλευτική επιτροπή που διερευνά την τεχνητή νοημοσύνη ότι εκτιμάται ότι 5.000 τοπικοί φωνητές κινδυνεύουν να χάσουν τη δουλειά τους.

Η ομάδα σημείωσε ότι ένα εθνικό δίκτυο εκπομπής επενδύει ενεργά στην τεχνολογία για να αντικαταστήσει τους ηθοποιούς ανθρώπινης φωνής.

Στην κατάθεσή της, η οργάνωση επέκρινε τις ενέργειες της εταιρείας ως «φλεγόμενες γέφυρες».

«Αυτή είναι μια απογοητευτική κίνηση από έναν παίκτη σε μια βιομηχανία που βασίστηκε σε καλλιτέχνες φωνής τα τελευταία 100 χρόνια για να φέρει ποιότητα, αξιοπιστία και ανθρωπιά στα μέσα ενημέρωσης τους».

Ο Σάιμον Κένεντι, πρόεδρος της ένωσης, είπε στον Guardian Australia ότι η εμφάνιση της τεχνητής νοημοσύνης και ο αντίκτυπός της στη βιομηχανία φωνής ήταν μέρος του καταλύτη για την ίδρυση του οργανισμού.

Αλλά είπε ότι «δεν ήταν κατά της τεχνολογίας και σίγουρα δεν είμαστε κατά της τεχνητής νοημοσύνης». Η ομάδα θέλει απλώς δίκαιους κανόνες σχετικά με τη χρήση της τεχνολογίας και την προστασία της φωνής των ανθρώπων από την κακή χρήση της τεχνητής νοημοσύνης.

Για τους φωνητικούς ηθοποιούς, τα ηχητικά βιβλία θα χρησιμεύσουν πρώτα ως επικίνδυνος προάγγελος της αντικατάστασης της δουλειάς τους.

Ο Simon Kennedy είπε, «Τα ηχητικά βιβλία είναι ένας τομέας αιχμής λόγω του τεράστιου όγκου του υλικού και οι εταιρείες που παράγουν ηχητικά βιβλία πιστεύουν ότι η χρήση της μεταγλώττισης AI μπορεί να εξοικονομήσει κόστος».

Αλλά σκεφτείτε το από μια άλλη οπτική γωνία, εάν η φωνή που διαβάζει το βιβλίο είναι τεχνητή νοημοσύνη, θα επηρεαστεί η έκφραση του περιεχομένου και των συναισθημάτων;

Ο Σάιμον Κένεντι πρόσθεσε: «Αν πρόκειται για φωνή τεχνητής νοημοσύνης, νομίζω ότι οι άνθρωποι θα διαπιστώσουν ότι οι άνθρωποι είναι πολύ τεμπέληδες για να ακούσουν ηχητικά βιβλία».

Οι άνθρωποι θα έλεγαν απλώς, «Δεν έχω την αίσθηση ότι οι μηχανές λένε ιστορίες».

Ο Simon Kennedy είπε ότι για τους οργανισμούς που θέλουν να μειώσουν τη χειρωνακτική μεταγλώττιση, η χρήση της μεταγλώττισης AI σε εταιρικές εργασίες και εκπαιδευτικό υλικό είναι μόνο ένας κλάδος του μεγάλου δέντρου, αλλά ευρύτεροι τομείς όπως η διαφήμιση μεταγλώττισης τεχνητής νοημοσύνης είναι ακόμα δύσκολο να αντικατασταθούν.

«Αυτό που χρειάζονται οι μεγάλοι διαφημιστές είναι η υψηλή ποιότητα και η μεταγλώττιση της τεχνητής νοημοσύνης δεν θα λαμβάνεται υπόψη από τους διαφημιστές για αρκετό καιρό».

Πέρυσι, η Guardian Australia ανέφερε ότι η Αυστραλιανή εταιρεία ανάπτυξης λογισμικού Replica Studios αδειοδοτούσε 120 φωνές από ηθοποιούς για την ανάπτυξη βιντεοπαιχνιδιών και θα πλήρωνε τους ηθοποιούς όταν οι κλωνοποιημένες φωνές τους χρησιμοποιούνταν σε βιντεοπαιχνίδια.

Τον Ιανουάριο, η εταιρεία υπέγραψε συμφωνία με το Screen Actors Guild λέγοντας ότι ήταν μια ηθική χρήση της φωνής AI και ότι όλο το περιεχόμενο είχε άδεια χρήσης.

Σχετικά με τους φωνητικούς ηθοποιούς που πωλούν τις άδειες φωνής τους, ο Σάιμον Κένεντι είπε ότι οι ηθοποιοί φωνής που πωλούν τις άδειες φωνής τους δεν εξετάζουν τα μακροπρόθεσμα σχέδιά τους.

«Δεν νομίζω ότι σκέφτηκαν πραγματικά τις συνέπειες, ότι η φωνή υπάρχει τώρα στην αγορά ως ψηφιακός κλώνος του εαυτού σου, αφαιρώντας βασικά δουλειές που θα μπορούσες να έχεις αποκτήσει μόνος σου».

Προστασία των Δικαιωμάτων και των Συμφερόντων των Φωνών

Στη συνέχεια, η αντικατάσταση επιστρέφει στην αντικατάσταση, και το αν αυτή η αντικατάσταση είναι εντός του νομικού εύρους είναι επίσης ένα θέμα που αξίζει προσοχής.

Στις 16 Μαΐου, ο Αμερικανός φωνητικός ηθοποιός Paul Lehrman και ένας άλλος ηθοποιός φωνής Linnea Sage κατέθεσαν μήνυση κατά της startup τεχνητής νοημοσύνης Lovo στο ομοσπονδιακό δικαστήριο της Νέας Υόρκης, κατηγορώντας την εταιρεία ότι χρησιμοποιεί AI για παράνομη αντιγραφή και χρήση της φωνής τους.


κατηγορητήριο υπόθεσης

Το 2020, ο Lehrman δέχτηκε μια θέση εργασίας παρέχοντας ένα σύνολο μεμονωμένων δειγμάτων ομιλίας.

Λίγα χρόνια αργότερα, ακούστηκε να αφηγείται τη δική του φωνή σε βίντεο και podcast του YouTube, αν και ποτέ δεν δάνεισε τη φωνή του σε αυτά τα βίντεο.

Ισχυρίζονται ότι ο Lovo πούλησε εκδόσεις τεχνητής νοημοσύνης των φωνών τους χωρίς άδεια, αφού τους ξεγέλασε να δώσουν δείγματα φωνής. Οι δύο ηθοποιοί προσπαθούν επίσης να ενώσουν άλλα άτομα των οποίων οι φωνές έχουν κλαπεί για να ξεκινήσουν περαιτέρω μια ομαδική αγωγή.

Με άλλα λόγια, η εξουσιοδότηση ηχογραφήσεων δεν σημαίνει εξουσιοδότηση ήχων με δυνατότητα AI Η μη εξουσιοδοτημένη χρήση ή η άδεια χρήσης ήχων σε ηχογραφήσεις χωρίς την άδεια του κατόχου των δικαιωμάτων μπορεί επίσης να συνιστά παραβίαση.

Την Πρωτομαγιά, ο διάσημος φωνητικός ηθοποιός Xia Lei έκανε αναδημοσίευση στο Weibo, ζητώντας τη χρήση της τεχνολογίας "υδατογραφήματος ήχου" για την προστασία των νόμιμων δικαιωμάτων και συμφερόντων των φωνητικών ηθοποιών.


Ο Xia Lei, διάσημος ηθοποιός φωνής, στα αντιπροσωπευτικά του έργα είναι ο Μάο Μάο στο "Legend of Sword and Fairy 3", ο Yu Wenzhou στο "The Master" και ο Xu Mo στο "Love and Producer"

Όχι μόνο στην Κίνα, η AAVA που αναφέρθηκε παραπάνω ζητά επίσης νόμους για τη συναίνεση για το πώς χρησιμοποιούνται οι φωνές AI, διασφαλίζοντας ότι οι καλλιτέχνες αμείβονται δίκαια και ρυθμίζοντας τον τρόπο χρήσης της φωνής τους (εάν έχει άδεια).

Οι ηθοποιοί φωνής είναι ουσιαστικά οι «ψυχές» των χαρακτήρων σε ταινίες, παιχνίδια, κινούμενα σχέδια και άλλα έργα Ερμηνεύουν και εκφράζουν την αυτοσυνειδησία τους με την ενσυναίσθηση της μοίρας των χαρακτήρων, και οι καρποί της δουλειάς τους πρέπει επίσης να γίνονται σεβαστοί.

Ταυτόχρονα, οι ηθοποιοί μεταγλωττίζουν τα ανθρώπινα συναισθήματα για να συντονίσουν τους χαρακτήρες και να επικοινωνήσουν με το κοινό μέσω της φωνής τους.

Βιβλιογραφικές αναφορές:

https://www.theguardian.com/technology/article/2024/jun/30/ai-clones-voice-acting-industry-impact-australia