μπορεί να κατασκευαστεί το εγγραφικό ai από το three sheeps του mr. lu; η απάντησή μου είναι: φυσικά
2024-09-27
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
τις πρώτες πρωινές ώρες σήμερα, ν αριθμός ατόμων μου έστειλε μια φωτογραφία, λέγοντας ότι την είχε ειδοποιήσει η αστυνομία και με ρωτούσαν πώς να καταλάβω αν η ηχογράφηση του three sheep ήταν ai.κάποιοι φίλοι μου είπαν ότι υπάρχει ένα άτομο που ισχυρίζεται ότι είναι το νούμερο ένα άτομο τεχνητής νοημοσύνης στην κίνα. λοιπόν, θα μπορούσε να υπάρχει κάποια θεωρία συνωμοσίας πίσω από αυτήν την αναφορά;σχεδόν ψιθύρισα ποιος είναι ο πρώτος τεχνητής νοημοσύνης στην κίνα; η πρώτη μου αντίδραση ήταν ότι και οι ακαδημαϊκοί σταμάτησαν να συμμετέχουν σε τέτοια βαρετά πράγματα;μετά το έψαξα...α...ξέχασέ το.νομίζω ότι είναι απαραίτητο να εκλαϊκεύσω κάποια επιστήμη, δηλαδή, μπορεί η τεχνητή νοημοσύνη να πετύχει το επίπεδο εγγραφής του sanyanglu;μπορώ να σας δώσω μια ξεκάθαρη απάντηση: ναι.αρχικά, ας μιλήσουμε εν συντομία για το παρασκήνιο.τα τρία πρόβατα και ο σίμπα είχαν μια ακατάστατη σχέση. απλώς τσακώνονταν μεταξύ τους, πηγαινοέρχονταν, και ήταν τόσο ζωηρό.στη συνέχεια, όταν η αναταραχή ήταν στο αποκορύφωμά της, μια εκρηκτική ηχογράφηση του lu wenqing, του προέδρου των three sheep, έγινε viral στο διαδίκτυο.
αυτό είναι, έκανα μερικές περικοπές, και επίσης σίμωσα μερικά από τα απρεπή μέρη.
το περιεχόμενο είναι εκρηκτικό και συγκλονιστικό, με μεγάλη αξιοπιστία και συγκλονιστικό περιεχόμενο. περιλαμβάνει αγώνες εξουσίας, εξαπάτηση κ.λπ. συνοψίζοντας, ο κ. lu αποκάλυψε ότι είχε ακατάλληλες σχέσεις με όλες τις γυναίκες άγκυρες του three sheep. ονόμασε επίσης τον zhang yiming και τον κοίταξε από ψηλά. . .αυτό μάλλον συνέβη και στη συνέχεια το ανέφεραν οι three sheep, λέγοντας ότι η ηχογράφηση συντέθηκε από ai.
υπάρχει πολλή διαμάχη στο διαδίκτυο η μεγαλύτερη κατανόηση των περισσότερων ανθρώπων είναι ότι η τεχνητή νοημοσύνη δεν μπορεί να παράγει αυτό το επίπεδο εγγραφής. γιατί το είπε ο «πρώτος άνθρωπος στην εγχώρια τεχνητή νοημοσύνη».αυτή η ηχογράφηση ακούγεται πολύ αληθινή, σωστά. υπάρχουν συναισθήματα, διάλεκτοι και θόρυβοι, οπότε υπάρχουν δύο ερωτήσεις. και, μπορεί η τεχνητή νοημοσύνη να επιτύχει αυτό το επίπεδο εγγραφής;η πρώτη ερώτηση έχει απαντηθεί σήμερα. πιστεύω επίσης ότι οι αναφορές που εκδίδουν είναι γεγονότα. έτσι, η απάντηση στην πρώτη ερώτηση είναι αρκετά σαφής, αυτό κάνει το ai.έτσι, το δεύτερο ερώτημα, το πιο κρίσιμο, είναι εάν η τεχνητή νοημοσύνη μπορεί να επιτύχει αυτό το επίπεδο εγγραφής.η απάντησή μου είναι φυσικά.πρώτα απ 'όλα, πρέπει να εκλαϊκεύσω κάποια επιστήμη εδώ η τεχνητή νοημοσύνη είναι μια ευρεία κατηγορία και υπάρχουν πολλά κομμάτια στις υποδιαιρέσεις της.υπάρχουν μεγάλα μοντέλα γλώσσας (gpt, claude, doubao, κ.λπ.), σχέδιο ai (mj, sd, flux, κ.λπ.), ήχος ai (11labs, svc, gpt-sovtis, suno, κ.λπ.), βίντεο ai (runway , keling, doubao, pixverse κ.λπ.), και ai 3d (tripoai, meshy, κ.λπ.).
στον ήχο ai, χωρίζεται σε μουσική που δημιουργείται από ai, ηχητικά εφέ που δημιουργούνται από ai και κλωνοποίηση ήχου.αυτή η ηχογράφηση ανήκει στο κομμάτι της κλωνοποίησης ήχου.επομένως, μην πείτε ότι αν το ai μπορεί να το κάνει αυτό, είναι πιο ισχυρό από το openai ή το chatgpt, οπότε δεν υπάρχει σύγκριση, όπως είπατε, αυτό το πλυντήριο είναι πραγματικά καλό ρούχα, ακόμα καλύτερα από αυτό το ψυγείο. . .η κλωνοποίηση φωνής χωρίζεται σε δύο τύπους: tts (text to speech) και svc (ai voice changing).το tts είναι να δώσει στη φωνή ενός ατόμου λίγα δευτερόλεπτα και δεκάδες δευτερόλεπτα υλικού για να εκπαιδεύσει ένα μοντέλο τεχνητής νοημοσύνης και στη συνέχεια να χρησιμοποιήσει απευθείας κείμενο για να δημιουργήσει σύνθεση ομιλίας του ήχου φωνής ενός συγκεκριμένου ατόμου το καλύτερο έργο ανοιχτού κώδικα τώρα θα πρέπει να είναι το gpt -sovits。το svc μπορεί να γίνει κατανοητό ως αλλαγή φωνής ai, η οποία είναι η αλλαγή φωνής στην εποχή του ai. επί του παρόντος, υπάρχουν τρία κορυφαία υποέργα στον τομέα της αλλαγής φωνής ai: so-vits-svc, rvc και ddsp.εντάξει, τώρα είναι σαφές ότι στον τομέα της κλωνοποίησης φωνής με τεχνητή νοημοσύνη, υπάρχουν δύο μέθοδοι για την επίτευξη πλαστογραφίας φωνής.το πλεονέκτημα του έργου tts είναι ότι οι απαιτήσεις δεδομένων είναι σύντομες, αρκούν μόνο 5 δευτερόλεπτα ηχητικού υλικού και η φωνή σας μπορεί να κλωνοποιηθεί. στη συνέχεια, χρειάζεται μόνο να παρέχετε κείμενο για να δημιουργήσετε ήχο είναι πολύ γρήγορο. αλλά το μειονέκτημα είναι ότι τα ανώτερα όρια συναισθημάτων, παύσεων και ρεαλισμού είναι πολύ χαμηλά μετά από δεκάδες δευτερόλεπτα ακρόασης, μπορείτε εύκολα να καταλάβετε ότι πρόκειται για γεύση τεχνητής νοημοσύνης.
πριν, όλοι πίστευαν ότι η τεχνητή νοημοσύνη δεν μπορούσε να κάνει την ηχητική πλαστογραφία του κ. lu.
για να είμαι πολύ ειλικρινής, είναι πράγματι λίγο δύσκολο για το tts να παράγει ήχο του επιπέδου του κ. lu, με βάση τα προϊόντα που είναι διαθέσιμα στο κοινό στην αγορά που γνωρίζω (εξαιρουμένων των έργων σε εσωτερικά εργαστήρια μεγάλων εταιρειών).ωστόσο, αν το καλοσκεφτείτε, το tts δεν μπορεί να το κάνει αυτό, αλλά τι γίνεται με το svc;το μειονέκτημα του svc είναι το υψηλό του κόστος. απαιτεί ένα σύνολο δεδομένων ήχου διάρκειας 30 λεπτών και στη συνέχεια αρκετές ώρες εκπαίδευσης στην αλχημεία για να εκπαιδεύσετε το φωνητικό μοντέλο του ατόμου για να αλλάξετε τη φωνή ο ήχος αντικαθίσταται.το πλεονέκτημα είναι πολύ απλό αυτό το πράγμα μπορεί να διατηρήσει όλα τα συναισθήματα, τις παύσεις, τον τόνο, τη διάλεκτο, κ.λπ., και το ανώτερο όριο ποιότητας είναι περίπου άπειρο, εφόσον το μοντέλο είναι καλό ai ή όχι.
ακόμη και η φωνή του τραγουδιού μπορεί να αλλάξει απρόσκοπτα η αλλαγή της φωνής σας είναι απλώς μια μικρή περίπτωση.η stefanie sun, το ai που έγινε δημοφιλές πέρυσι, κατασκευάστηκε από svc.έχω γράψει επίσης πολλά σεμινάρια για το svc.επιτρέψτε μου επίσης να σας ακούσω αφού χρησιμοποίησα το svc για να αλλάξω τη φωνή μου, το αντικατέστησα με τη δική μου φωνή.λι ρονγκάοη επίδραση του μοντέλου.αυτό είναι απευθείας ai, πρόσθεσα μόνο μουσική υπόκρουση.έτσι, χρησιμοποιώντας το svc για να κάνετε την παραχάραξη ήχου του κ. lu's ai, τα βήματα είναι πολύ απλά.1. συλλέξτε περίπου 30 λεπτά από τα δεδομένα ομιλίας του κ. lu από το διαδίκτυο.2. χρησιμοποιήστε svc ή rvc για να καθαρίσετε τη φωνή του κυρίου lu και να την εκπαιδεύσετε σε ένα μοντέλο ai.3. ο κ. lu είναι από το anqing, και υπάρχουν πολλοί anqing στο hefei.βρείτε κάποιον με παρόμοια προφορά με αυτόν και διαβάστε πρώτα τον ήχο που θα συνθέσετε μόνοι σας.
4. τέλος, χρησιμοποιήστε το μοντέλο ai του svc για να αντικαταστήσετε τον τελικό ήχο με τη φωνή του.το ίδιο ισχύει και για τις γυναικείες φωνές.εάν εξακολουθείτε να θέλετε να το ακούσετε πιο ρεαλιστικά, απλώς χρησιμοποιήστε το clipping ή κάτι για να προσθέσετε κάποιο θόρυβο του ανέμου χρησιμοποιήστε το επίσης με ήχο περιβάλλοντος το σύνολο δεδομένων πηγαίνει για εκπαίδευση, αν και δεν το συνιστώ. . .ειδικά η μέθοδος του αυθεντικού βίντεο είναι να στείλεις την εγγραφή στο κινητό, μετά να την παίξεις στο κινητό και να χρησιμοποιήσεις άλλο κινητό για να την εγγράψεις το γέλιο των φίλων μου, που είναι χάλια. όλα αυτά είναι παράγοντες εκτός γηπέδου. . .λοιπόν, πίσω στη δεύτερη ερώτηση, μπορεί η τεχνητή νοημοσύνη να κάνει πλαστές ηχογραφήσεις όπως του κ. lu; φυσικά και μπορείς.μην θεωρείτε την τεχνητή νοημοσύνη ως πολύ μυθική και μην τη θεωρείτε πολύ σκουπίδια.η τεχνητή νοημοσύνη είναι συχνά τεχνητή νοημοσύνη + νοημοσύνη.
το τρέχον tts δεν μπορεί να λύσει συναισθηματικά προβλήματα, οπότε γιατί η τεχνητή νοημοσύνη πρέπει να αντιμετωπίσει τα συναισθήματα;δεν μπορείτε απλώς να αλλάξετε την ηχογράφηση αφού ολοκληρώσετε την απαγγελία του χειροκίνητα; αυτό είναι τεχνητή νοημοσύνη + νοημοσύνη.ανοίξτε το μυαλό σας και μην είστε πολύ περιορισμένοι.η τεχνητή νοημοσύνη είναι ο βοηθός σας, ένα βοηθητικό εργαλείο, που μπορείτε να χρησιμοποιήσετε, όχι για να αφήσετε τα πάντα σε αυτήν ως καταστηματάρχης.τέλος, θέλω να κάνω μια δήλωση.
γράφω αυτό το άρθρο για να μην μάθουν όλοι για αυτήν την τεχνολογία και μετά να παραβιάσω το νόμο, να κάνω κάποια εξωνόμιμα πράγματα και να γίνω ένας εξωνόμιμος γκάνγκστερ.αντίθετα, ελπίζω να κάνω λίγη δημοφιλή επιστήμη σχετικά με τον ήχο της τεχνητής νοημοσύνης, να εξομαλύνω το κενό πληροφοριών και να γνωρίζουν όλοι ότι υπάρχει μια τέτοια τεχνολογία και το ανώτατο όριο είναι εδώ . αλλά πρέπει να ξέρουμε πού και σε ποιο επίπεδο μπορεί να φτάσει η τρέχουσα τεχνητή νοημοσύνη.
τι μπορεί να γίνει με την υποστήριξη τεχνητής νοημοσύνης + νοημοσύνης.η πρόοδος της επιστήμης και της τεχνολογίας είναι μη αναστρέψιμη.
μαθαίνουμε πολλά πράγματα και μαθαίνουμε ai, συχνά για να προστατευτούμε.
επίσης, προστατέψτε τις οικογένειές μας.τώρα που το είδατε, αν πιστεύετε ότι είναι καλό, μην διστάσετε να κάνετε ένα like, να το παρακολουθήσετε και να το κάνετε retweet τρεις φορές, αν θέλετε να λαμβάνετε ειδοποιήσεις το συντομότερο δυνατό, μπορείτε επίσης να μου δώσετε ένα αστέρι⭐ ~σας ευχαριστώ που διαβάσατε το άρθρο μου, τα λέμε την επόμενη φορά.
>/ συγγραφέας: kazik