समाचारं

ChatGPT उन्नत स्वरविधिः अन्ततः ऑनलाइन अस्ति: भवन्तः चीनीभाषां वदन्ति एव, "Wai Guoren" इति भवतः परिचयः उजागरः भवति

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

मशीन हृदय रिपोर्ट

सम्पादकः अण्डस्य चटनी, Xiaozhou

OpenAI इत्यस्य “Her” अन्ततः केषाञ्चन जनानां कृते उद्घाटितम् अस्ति ।

अस्मिन् वर्षे मेमासे OpenAI इत्यनेन "Spring New Product Launch" इत्यत्र स्वस्य नूतनपीढीयाः प्रमुखपीढीयाः मॉडल् GPT-4o तथा डेस्कटॉप् App इत्यस्य प्रारम्भः कृतः तथा च नूतनानां क्षमतानां श्रृङ्खला प्रदर्शिता

अधुना OpenAI इत्यनेन घोषितं यत् सः ChatGPT Plus इत्यस्य उपयोक्तृणां लघुसमूहस्य कृते ChatGPT इत्यस्य उन्नत-स्वर-विधिं उद्घाटयिष्यति, येन उपयोक्तारः प्रथमवारं GPT-4o इत्यस्य अति-वास्तविक-श्रव्य-प्रतिसादं प्राप्तुं शक्नुवन्ति एते उपयोक्तारः ChatGPT एप् मध्ये अलर्ट् प्राप्नुयुः तथा च एप् इत्यस्य उपयोगः कथं करणीयः इति निर्देशैः सह ईमेल प्राप्स्यति।

"अस्माकं प्रथमं उन्नतभाषणविधानस्य प्रदर्शनात् आरभ्य वयं स्वरवार्तालापस्य सुरक्षां गुणवत्तां च वर्धयितुं परिश्रमं कुर्मः तथा च एतत् अत्याधुनिकं प्रौद्योगिकीम् कोटिकोटिजनानाम् कृते आनेतुं सज्जाः स्मः OpenAI इत्यनेन उक्तं यत् एतत् विशेषता क्रमेण 1990 तमे वर्षे उपलब्धं भविष्यति fall of 2024. सर्वेषां प्लस् उपयोक्तृणां परिचयः।

केचन उपयोक्तारः पूर्वमेव उन्नतस्वरविधानस्य उपयोगस्य प्रभावं स्थापितवन्तः:

स्रोतः https://x.com/tsarnick/status/1818402307115241608

यदा भवान् ChatGPT इत्यनेन सह हास्यं वदति तदा ChatGPT भवन्तं किञ्चित् हास्यं प्रदातुं शक्नोति:

स्रोतः https://x.com/yoimnotkesku/status/1818406786077970663

ChatGPT इत्यस्य उन्नतस्वरविधानस्य उपयोगेन "Her" कथां कथयन् पृष्ठभूमिसङ्गीतं निर्मातुम् अर्हति, बहुभाषासु च उपलभ्यते ।

स्रोतः https://x.com/yoimnotkesku/status/1818415019349901354

फ्रेंचभाषा, स्पेन्भाषा, उर्दूभाषा च उपलभ्यन्ते : १.

स्रोतः https://x.com/yoimnotkesku/status/1818424494106853438

परन्तु चीनीभाषायाः अभिव्यक्तिः अतीव प्रामाणिकः नास्ति, यथा "कुटिलः अखरोटः" यः चीनीभाषां शिक्षते:

स्रोतः https://x.com/yoimnotkesku/status/1818446895083139170

ये शृण्वन्ति स्म ते सर्वे स्तब्धाः अभवन् :

उच्चारणसमस्या न केवलं चीनीभाषायां भवति, अपितु जर्मनभाषायां अपि भवति :

स्रोतः https://x.com/yoimnotkesku/status/1818445235606671670

अन्ते जिह्वाविवर्तकस्य विषये वदामः :

स्रोतः https://x.com/yoimnotkesku/status/1818427991514337695

OpenAI कथयति यत् उन्नतः स्वरविधिः वर्तमानकाले ChatGPT यत् प्रदाति तस्मात् भिन्नः अस्ति।

ChatGPT इत्यस्य पुरातनस्य स्पीच् मोड् समाधानस्य त्रयः पृथक् पृथक् मॉडल् उपयुज्यन्ते स्म: एकः मॉडल् भाषणं पाठरूपेण परिवर्तयति स्म, GPT-4 इत्यस्य उत्तरदायी आसीत् प्रॉम्प्ट्स् (प्रोम्प्ट्स्) नियन्त्रयितुं, तृतीयः मॉडल् च ChatGPT इत्यस्य पाठं भाषणे परिवर्तयितुं उत्तरदायी आसीत् GPT-4o बहुविधा अस्ति तथा च सहायकप्रतिमानानाम् सहायतां विना एतानि कार्याणि सम्भालितुं शक्नोति, तस्मात् संवादविलम्बतां महत्त्वपूर्णतया न्यूनीकरोति । OpenAI इत्यनेन अपि उक्तं यत् GPT-4o उपयोक्तुः स्वरस्य भावनात्मकं स्वरं ज्ञातुं शक्नोति, यत्र दुःखं, उत्साहः इत्यादयः सन्ति ।

अस्मिन् वर्षे मेमासे OpenAI इत्यनेन प्रथमवारं GPT-4o इत्यस्य स्वरकार्यं प्रदर्शितं तथा च वास्तविकस्य व्यक्तिस्य स्वरस्य आश्चर्यजनकं सादृश्यं प्रेक्षकान् आश्चर्यचकितं कृतवान्--अत्र च समस्या अस्ति।

"स्काई" इति नामकः स्वरः स्कारलेट् जोहानसन इत्यस्य सदृशः अस्ति, यः "हेर्" इति चलच्चित्रे कृत्रिमसहायकस्य भूमिकां निर्वहति ।

ओपनएआइ-प्रदर्शनस्य किञ्चित्कालानन्तरं जॉन्सन् इत्यनेन उक्तं यत् सा ओपनएआइ-सीईओ सैम आल्टमैन् इत्यस्य स्वरस्य उपयोगाय बहुविध-अनुरोधानाम् प्रतिरोधं कृतवती अस्ति तथा च जीपीटी-४ओ-प्रदर्शनं दृष्ट्वा स्वस्वरस्य रक्षणार्थं कानूनी-वकीलं नियुक्तवती इति OpenAI इत्यनेन Scarlett Johansson इत्यस्य स्वरस्य उपयोगः अङ्गीकृतः परन्तु डेमो इत्यस्मात् स्वरः अपि निष्कासितः ।

जूनमासे ओपनएआइ इत्यनेन उक्तं यत् सः स्वस्य सुरक्षापरिपाटानां उन्नयनार्थं उन्नतभाषणविधानस्य विमोचनं विलम्बयिष्यति इति ।

दीर्घकालं प्रतीक्ष्य अन्ततः "तस्याः" सर्वेषां साक्षात्कारः अभवत् । OpenAI इत्यनेन उक्तं यत् अस्मिन् समये प्रारब्धः उन्नतः स्वरविधिः ChatGPT इत्यत्र एव सीमितः भविष्यति, यत् सशुल्कस्वर-अभिनेतृभिः सह सहकार्यं कृत्वा चतुर्णां पूर्वनिर्धारित-स्वरानाम् निर्माणं कृतवान् : Juniper, Breeze, Cove, Ember च

ज्ञातव्यं यत् केवलं एते चत्वारः प्रकाराः निर्गमध्वनयः सन्ति - मेमासे OpenAI इत्यस्य प्रदर्शने दर्शितः Sky स्वरः ChatGPT कृते अधुना उपलब्धः नास्ति "ChatGPT व्यक्तिनां सार्वजनिकव्यक्तिनां च सहितस्य अन्येषां स्वरस्य अनुकरणं कर्तुं न शक्नोति, तथा च एतेषु पूर्वनिर्धारितस्वरेषु एकस्मात् भिन्नं उत्पादनं अवरुद्धं करिष्यति" इति OpenAI प्रवक्ता लिण्ड्से मेकैलम् अवदत्

अस्य सेटअपस्य मूल अभिप्रायः Deepfake विवादं परिहरितुं अस्ति । अस्मिन् वर्षे जनवरीमासे आर्टिफिशियल इन्टेलिजेन्स स्टार्टअप इलेवेन्लैब्स् इत्यस्य ध्वनिक्लोनिङ्ग् प्रौद्योगिक्याः उपयोगः अमेरिकीराष्ट्रपतिः बाइडेन् इत्यस्य अनुकरणं कृत्वा न्यू हैम्पशायर-नगरे प्राथमिकमतदातृणां वञ्चनाय कृतः, येन पर्याप्तः विवादः उत्पन्नः

OpenAI इत्यनेन अपि उक्तं यत् सङ्गीतं वा अन्यं प्रतिलिपिधर्म-संरक्षितं श्रव्यं जनयितुं कतिपयान् अनुरोधानपि अवरुद्ध्य नूतनानि फ़िल्टर्-प्रवर्तनं कृतम् अस्ति ।

गतवर्षे प्रतिलिपिधर्मस्य उल्लङ्घनस्य कारणेन बहवः इमेजजनरेशन-म्यूजिक-जनरेशन-ए.आइ. तथा च GPT-4o इत्यादीनि श्रव्यमाडलाः शिकायतां दातुं शक्नुवन्ति इति कम्पनीनां सम्पूर्णतया नूतनं वर्गं योजयन्ति।

OpenAI इत्यनेन ४५ भाषासु १०० तः अधिकैः बाह्य "लालदल" सदस्यैः सह GPT-4o इत्यस्य स्वरक्षमतायाः परीक्षणं कृतम् इति कथ्यते । अगस्तमासे GPT-4o इत्यस्य कार्याणि, सीमाः, सुरक्षामूल्यांकनं च इति विषये प्रतिवेदने एषा मुख्यसूचना अधिकविस्तारेण घोषिता भविष्यति।

सन्दर्भलिङ्कानि : १.

https://twitter.com/OpenAI/status/1818353580279316863

https://www.theverge.com/2024/7/30/24209650/openai-chatgpt-उन्नत-स्वर-मोड

https://www.reuters.com/technology/openai-शुरुआत-रोल-आउट-उन्नत-आवाज-मोड-कुछ-चैटजीप्ट-प्लस-उपयोक्ता-2024-07-30/

https://www.bloomberg.com/news/articles/2024-07-30/openai-begins-rolling-out-voice-assistant-after-safety-related-delay?srnd=phx-technology

https://techcrunch.com/2024/07/30/openai-releases-chatgpts-सुपर-यथार्थवादी-आवाज-विशेषता/

https://www.theinformation.com/briefings/विलम्ब-उद्घाटन-पश्चात्-विमोचन-ऐ-आवाज-सहायक