समाचारं

"अत्याचारी" CNKI द्वारा प्रतिलिपिधर्मस्य उल्लङ्घनस्य आरोपितः, Secret Tower AI अपि कतिपयानि अधिकानि शब्दानि वक्तुं शक्नोति

2024-08-19

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina


लेखक |.झोउ Xiaoxiao
ईमेल@[email protected]
सम्पादक|वांग झाओयांग
ईमेल@[email protected]

1

लिङ्कं भङ्गयतु

अधुना एव Secret Tower AI अन्वेषणस्य उपयोक्तारः यदा वेबसाइट् उद्घाटयन्ति तदा उपरि दृष्टिगोचरपाठस्य रेखां प्राप्नुयुः यत् "इदं समाप्तम्! अस्माकं कृते CNKI इत्यस्मात् २८ पृष्ठीयं उल्लङ्घनसूचनापत्रं प्राप्तम्।

सीक्रेट् टॉवरतः एकं वक्तव्यं उद्घाटयितुं क्लिक् कुर्वन्तु, यस्मिन् उक्तं यत् "चीनीज अकादमिक जर्नल् (सीडी एडिशन)" इलेक्ट्रॉनिकपत्रिका कम्पनी लिमिटेड् इत्यस्मात् उल्लङ्घनसूचनापत्रं प्राप्तम् - अर्थात् एकाधिकारव्यवहारस्य शङ्कायाः ​​कारणात् ८,७६० दण्डः कृतः अस्ति तथा च... व्यक्तिगतसूचनासुरक्षाविषयेषु १०,००० युआन् ५ कोटि युआन् च विवादास्पदं CNKI इत्यनेन तस्य विरुद्धं उल्लङ्घनस्य आरोपः जारीकृतः ।


संक्षेपेण सारांशतः, MiTa AI अन्वेषणं CNKI सामग्रीं अन्वेष्टुं शक्नोति CNKI एतत् उल्लङ्घनम् इति मन्यते तथा च अन्वेषणसेवासु CNKI आँकडानां प्रदानं तत्क्षणमेव स्थगयितुं आवश्यकम्।

"अस्माकं कम्पनी न इच्छति यत् अस्माकं वेबसाइट् China National Knowledge Infrastructure इत्यस्य अन्वेषणं MiTa Technology इत्यनेन करणीयम्। कृपया अस्माकं वेबसाइटतः अन्वेषणपरिणामान् तत्क्षणमेव विच्छिन्नातु। यदि भवन्तः व्यावसायिकसहकार्यस्य आवश्यकतां अनुभवन्ति तर्हि कृपया अस्माकं कम्पनीं सम्पर्कयन्तु।

MiTa Technology इत्यनेन अस्मिन् वक्तव्ये प्रतिक्रिया दत्ता यत् MiTa AI अन्वेषणस्य "शैक्षणिक" विभागे केवलं पत्रस्य साहित्यसारं ग्रन्थसूची च समाविष्टा अस्ति, तथा च लेखस्य सामग्रीः एव न समाविष्टा भवति, पाठं पठितुं भवद्भिः वेबसाइट् प्रति कूर्दितव्यम् तत् प्राप्तुं स्रोतलिङ्कद्वारा। शैक्षणिकमानकानुसारं दस्तावेजस्य सारः ग्रन्थसूची च स्वतन्त्रा स्वयमेव व्याख्याता च भवितुमर्हति, येन पाठकाः पूर्णपाठं न पठित्वा आवश्यकसूचनाः प्राप्तुं शक्नुवन्ति


सम्प्रति Secret Tower Academic Search इत्यस्मिन् केचन लिङ्काः Wanfang Data इत्यत्र कूर्दन्ति।

गुप्तगोपुर एआइ इत्ययं ज्ञानस्य मूल्यं तस्य प्रवाहे एव निहितं भवति इति अपि बोधयति शैक्षणिकदस्तावेजाः मानवीयबौद्धिकसाधनानां महत्त्वपूर्णवाहकाः सन्ति, अत्यन्तं अपूरणीयाः च सन्ति। यदि वैज्ञानिकदस्तावेजाः विलासपूर्णं उत्पादं भवन्ति तर्हि ज्ञानस्य न्यायपूर्णप्राप्त्यर्थं वैज्ञानिकसंशोधनस्य विकासाय वा अनुकूलं न भविष्यति।

परन्तु मानवीयबुद्ध्याः शैक्षणिककार्यं प्रति संक्रमणस्य विषये चर्चां कृत्वा सीक्रेट् टॉवर्स इत्यनेन दत्ता कार्यवाही "लिङ्कं भङ्गयितुं" आसीत् : "यदि वयं न अवगच्छामः तथापि वयं सीएनकेआई इत्यस्य चयनस्य सम्मानं कुर्मः" इति search will no longer include CNKI दस्तावेजानां ग्रन्थसूची-अमूर्त-आँकडानां अन्येषां प्रामाणिक-चीनी-आङ्ग्ल-ज्ञान-आधाराणां ग्रन्थसूची-अमूर्त-आँकडानां समावेशः भविष्यति अन्येषां आँकडाधारानाम् अपि सहकार्यं कर्तुं चर्चां च कर्तुं स्वागतम् अस्ति।

अर्थात् सीक्रेट् टॉवर इत्यनेन अन्ततः सीएनकेआई इत्यस्य अपीलस्य आवश्यकतानुसारं शिकायतां सम्पादितवती ।

1

महत्त्वपूर्णाः विषयाः ये स्पष्टतया न व्याख्याताः

Secret Tower AI Search इति एआइ-उत्साहस्य अस्मिन् दौरस्य तारा-उत्पादः अस्ति तथा च प्रायः चीनस्य Perplexity इत्यनेन सह तुलना क्रियते । सीक्रेट् टॉवर अपि बृहत् मॉडल स्टार्टअप्स इत्यस्य अस्मिन् दौरस्य एकः स्टार कम्पनी अस्ति नवीनतमवार्ता दर्शयति यत् तया 100 मिलियन युआन् इत्यस्य नवीनतमं वित्तपोषणं सम्पन्नम् अस्ति, यस्य निवेशोत्तरं मूल्याङ्कनं 150 मिलियन अमेरिकी डॉलर अस्ति। MiTa इत्यस्य स्थापना बृहत् मॉडल्-उत्साहात् पूर्वं कृता आसीत्, परन्तु तस्य मूल-उत्पादः MiTa AI अन्वेषणम् अस्मिन् वर्षे मार्च-मासे आधिकारिकतया प्रारब्धम् ।


हुनान उपग्रहटीवी इत्यत्र गुप्तगोपुरस्य विज्ञापनम्

सीएनकेआई इत्यस्य उल्लङ्घनसूचने उक्तं यत् मिता उपयोक्तृभ्यः सीएनकेआई इत्यस्य शैक्षणिकसाहित्यग्रन्थसूचीं सारांशदत्तांशं च प्रदत्तवती, उल्लङ्घनस्य शङ्का च अस्ति अस्मिन् विषये शङ्घाई दबङ्ग लॉ फर्मस्य वरिष्ठः भागीदारः वकीलः च यू युन्टिङ्ग् इत्यनेन उक्तं यत् सीएनकेआई इत्यस्य शैक्षणिकसाहित्यग्रन्थसूची अमूर्तजालपृष्ठानि च घरेलुप्रयोक्तृभ्यः सार्वजनिकरूपेण सुलभानि सन्ति चीनजालदत्तांशकोशसेवाबाजारे प्रबलस्थानं येषां संचालकानाम् अस्ति तेषां कृते गुप्तगोपुरसर्चं सार्वजनिकसूचनायाः एतयोः भागयोः ग्रहणं न कर्तुं उचितकारणानि भवितुमर्हन्ति।

मूलतः सीएनकेआई सीक्रेट् टॉवर इत्यस्मै स्वस्य जालपुटं न क्रॉलं कर्तुं वदति। पारम्परिकसर्चइञ्जिनस्य पारिस्थितिकीतन्त्रे एतादृशसूचनाग्राहकक्रॉलरव्यवहारस्य मूलभूतनियमा: सन्ति - प्रत्येकं जालपुटं विविधसूचनाप्रदाताश्च अन्वेषणयन्त्रं ज्ञापयितुं Robots.txt सञ्चिकां उपयुञ्जते यत् का सामग्री क्रॉल कर्तुं शक्यते, का न शक्नोति इति।

बैडु, गूगल इत्यादीनि अन्वेषणयन्त्राणि अस्मिन् क्रमे स्वस्य क्रॉलर्-इत्यस्य नामकरणं करिष्यन्ति येन परपक्षः ज्ञास्यति यत् ते तत्र गतवन्तः किं च हृतवन्तः इति। परन्तु CNKI इत्यस्य Robots.txt सञ्चिकातः न्याय्यं चेत्, एतत् कस्यापि क्रॉलर् इत्यस्य अवरोधं न करोति ।

“किं रोचकं तत् अस्ति यत् यद्यपि CNKI इत्यनेन मिता इत्यस्मै पत्रं प्रेषितं यत् लिङ्कं विच्छेदं कर्तुं याच्यते, यस्य अर्थः अस्ति यत् तस्य जालसामग्री क्रॉल कर्तुं अनुमतिः नास्ति तथापि तस्य robots सञ्चिका (https://www.cnki.cn/robots.txt) Any search engine crawlers निषिद्धाः सन्ति CNKI इत्यस्य robots सञ्चिकायाः ​​सामग्रीनुसारं कस्यचित् स्वस्य जालपुटस्य क्रॉलं कर्तुं निषिद्धं नास्ति, केवलं cms, query.html?*, report, paper, qrcode, js, cs, येषु पृष्ठभूमिप्रबन्धन-अन्तरफलकं सम्मिलितं भवति तथा स्थिरसंसाधननिर्देशिका तथा विशिष्टसामग्रीनिर्देशिकाजालपृष्ठानि क्रॉल कर्तुं न शक्यन्ते।”

यदि उद्योगनियमानुसारं परपक्षस्य क्रौञ्चं कर्तुं निषिद्धं नास्ति तर्हि अद्यापि अस्माभिः किमर्थं सूचनापत्रं प्रेषयितुं आवश्यकम्?

"बहवः कृत्रिमबुद्धि-सन्धान-इञ्जिन-क्रॉलर्-इत्येतत् इदानीं युद्धनीतिं न अनुसरन्ति। ते पारम्परिक-बैडु, गूगल, सोगौ, बिङ्ग-इत्यादीनां स्वस्य क्रॉलर्-इत्यस्य नाम न ददति, अपितु मौनेन अनामरूपेण च क्रॉलं कुर्वन्ति। वस्तुतः एते अनामिकाः क्रॉलर् एतेषां एआइ अन्वेषणकम्पनीनां नामधेयेन न क्रियन्ते इति अनिवार्यम् । विपण्यां बहवः तृतीयपक्षीयक्रॉलरसेवाः सन्ति ये क्रॉलिंग् कृते एतान् मूलभूतमार्गदर्शिकान् बाईपासं कर्तुं विविधपद्धतीनां उपयोगं कुर्वन्ति । एताः सेवाः प्रयुक्ताः वा इति गुप्तगोपुरस्य उत्तरे न उक्तम् ।

पेरोप्लेक्सिटी इत्यस्य विषये पूर्वं अपि एतादृशाः विवादाः अभवन् ।

तस्मिन् समये Wired पत्रिका विकासकः Robb Knight च अन्वेषणं कृत्वा Perplexity robots.txt मानकस्य अनुपालनं न करोति इति ज्ञातवान् । संस्थापकः अरविन्दश्रीनिवासः एकस्मिन् साक्षात्कारे प्रतिक्रियाम् अददात् यत् Perplexity इत्यनेन Robot Exclusions Protocol इत्यस्य अवहेलना न कृता... प्रश्ने यः web crawler अस्ति सः तृतीयपक्षस्य विक्रेतुः इति ज्ञातम्।

परन्तु यदा पृष्टः यत् सः तृतीयपक्षस्य क्रॉलर्-इत्यस्य उपयोगं त्यक्ष्यति वा इति तदा सः केवलं "इदं जटिलं" इति अवदत् । तदतिरिक्तं तत्कालीन अन्वेषणेन ज्ञातं यत् केषुचित् सन्दर्भेषु Perplexity इत्यनेन वास्तविकलेखानां सारांशः न कृतः स्यात्, अपितु तस्य स्थाने अन्वेषणयन्त्रेषु अवशिष्टानां URL-लेशानां आधारेण सामग्रीं पुनर्निर्माणं कृतम्, यथा अंशाः, मेटाडाटा च देजा वु ।

मिटा इत्यनेन प्रकाशितस्य लेखस्य अनुसारं सीएनकेआई इत्यनेन मिटा इत्यस्मै प्रेषिता उल्लङ्घनसूचना २८ पृष्ठानि आसीत् । गुप्तगोपुरः केवलं अधिसूचनापत्रं अवरुद्ध्य प्रकाशितवान्, शेषसामग्रीषु मुख्यतया उल्लङ्घनस्य प्रमाणानि सूचीबद्धानि सन्ति।


पूर्वं बहवः उपयोक्तारः यत् साझां कृतवन्तः तदनुसारं गुप्तगोपुरं असार्वजनिकपत्राणि प्राप्तुं शक्नोति, तथा च गुप्तगोपुरस्य जालपुटे प्रत्यक्षतया पठितुं शक्यते यद्यपि एते PDF दस्तावेजाः बाह्यपुस्तकालयजालस्थलैः सह सम्बद्धाः सन्ति तथापि ते वास्तवतः गुप्तगोपुरे संगृहीताः भवितुम् अर्हन्ति गोपुर सर्वर। You Yunting इत्यस्य मतं यत् यदि Secret Tower CNKI कागदानां पूर्णपाठं युक्तं अनुक्रमणिकादत्तांशकोशं निर्माति तर्हि तत् उल्लङ्घनं भवितुम् अर्हति ।

"MiTa इत्यस्य AI अन्वेषणस्य podcast तथा ​​library विभागे अनुक्रमणिकादत्तांशकोशः अस्ति। अहं यत् अनुक्रमणिकापुस्तकालयं अवगच्छामि तत् एतत् भवितुम् अर्हति यत् MiTa इत्यनेन प्रत्यक्षतया बैचरूपेण संगृहीतसाहित्यस्य कृते आन्तरिकरूपेण अनुक्रमणिकादत्तांशकोशः निर्मितः। यदा उपयोक्ता अन्वेषणं करोति तदा MiTa संजालस्य अन्वेषणं करिष्यति। तदनुरूपम् वास्तविकसमयसामग्री, ततः वास्तविकसमयसन्धानपरिणामानां एकीकरणाय कृत्रिमबुद्धेः उपयोगं कुर्वन्तु तथा च उत्तराणि प्रदातुं पुस्तकालयसामग्रीसूचकाङ्कं कुर्वन्ति" इति यू युन्टिङ्ग् अवदत् । अर्थात् यद्यपि मूलप्रदर्शनपरिणामपृष्ठं सूचकाङ्कं टिप्पणीकृतस्रोतरूपेण प्रस्तुतं करोति तथापि "मूलपाठः" अपि स्वसेवायाम् उपरि स्थानान्तरितः भवति

"सूचकाङ्कदत्तांशकोशः सम्भवतः वास्तविकः अस्ति। वस्तुतः एतत् तान्त्रिकदृष्ट्या सिद्धयितुं कठिनं नास्ति। वयं यदा मुकदमायाः प्रतिनिधित्वं कुर्वन्तः आसन् तदा एतां समस्यां सम्मुखीकृतवन्तः। वयं प्रायः दस्तावेजस्य वास्तविकं IP-सङ्केतं प्रदर्शयितुं packet capture software इत्यस्य उपयोगं कुर्मः। यदि IP-सङ्केतः गुप्तगोपुरस्य सर्वरे स्थितम् अस्ति , गुप्तगोपुरेण प्रदत्तम् इति अर्थः।”

तदतिरिक्तं पूर्वप्रशिक्षितप्रतिमानानाम् आधारेण AI अन्वेषणयन्त्रत्वेन प्रशिक्षणदत्तांशयोः एतेषां बौद्धिकसम्पत्त्याः आँकडानां उपयोगः भवति वा इति अधिकः महत्त्वपूर्णः विषयः अस्ति

यदा प्रशिक्षणे कागददत्तांशः मूलपाठेन सह अत्यन्तं सङ्गतः भवति यदा उपयोक्त्रे अन्तिमनिर्गमसामग्री मूलपाठेन सह अत्यन्तं सङ्गता भवति यतोहि सामान्यतया आदर्शस्य "अति-फिटिंग्" समस्या भवति, तदा एतत् इत्यस्य श्रेणीं प्रविष्टम् अस्ति उचितप्रयोगात् "कागजसफाई" इत्यस्य सदृशं प्रतिलिपिधर्मस्य उल्लङ्घनम् ।

परन्तु एतादृशेषु परिस्थितिषु व्यक्तिगतशोधकैः लिखितानां एतेषां पत्राणां “रक्षणस्य” अधिकारः सीएनकेआई-संस्थायाः अस्ति वा?

"HowNet इत्यस्य Secret Tower Training इत्यस्य प्रतिलिपिधर्मस्य उल्लङ्घनस्य दावान् कर्तुं कोऽपि अधिकारः नास्ति।"

सः अवदत् यत् यद्यपि सीएनकेआई-जालस्थले अधिकांशपत्राणि समाविष्टानि सन्ति तथापि पत्रिकायाः ​​लेखकेन वा अधिकृते जालपुटे सूचनाप्रसारणस्य अधिकारः सीएनकेआई-संस्थायाः अस्ति यदि पत्रस्य उपयोगः प्रशिक्षणार्थं भवति तर्हि प्रशिक्षणे सम्बद्धः प्रतिलिपिधर्मः एव अधिकारः अस्ति प्रतिलिपिधर्मकानूने निर्धारितस्य प्रजननस्य प्रजननस्य च प्रतिलिपिधर्मस्य अन्ये च अधिकाराः CNKI इत्यस्य सूचनाजालप्रसारणाधिकारस्य उल्लङ्घनं न कुर्वन्ति। अवश्यं, यदि पत्रिकायाः ​​अधिकारसंरक्षणगुप्तगोपुरप्रशिक्षणं उल्लङ्घयति तर्हि गुप्तगोपुरस्य समक्षं न्यूयॉर्कटाइम्स्-पत्रिकायाः ​​OpenAI-इत्यस्य विरुद्धं मुकदमाः कृता इति समस्या एव भविष्यति ।


1

अधिकगम्भीरविमर्शानां समयः अस्ति

अतः गुप्तगोपुराः यस्य लक्ष्यस्य "प्रतिक्रिया" दातुम् इच्छन्ति तत् केवलं सीएनकेआई न, यस्य विषये नेटिजनैः "दुष्टम्" इति टिप्पणी कृता अस्ति ।

CNKI प्रति प्रतिक्रियायाः अतिरिक्तं - एताः प्रतिक्रियाः सर्वदा सहानुभूतिम् उत्तेजयन्ति, लेखस्य प्रतिक्रियायाः टिप्पणीविभागात् न्याय्यं चेत्, जनानां अद्यापि CNKI इत्यस्य मनोवृत्तिः दीर्घकालं यावत् वर्तते, गुप्तगोपुरं च "स्थगयति" - गुप्तगोपुराणि भवितुम् अर्हन्ति able to प्रशिक्षणदत्तांशस्य पृष्ठतः व्यक्तिगतलेखकाः दत्तांशस्य उपयोगः कथं भवति इति व्याख्यायते।

विवादास्पदं "शैक्षणिकं" अन्वेषणकार्यं महत्त्वपूर्णं डिजाइनं यत् अन्येभ्यः Perplexities इत्यस्मात् Secret Tower इत्यस्य भेदं करोति एतत् कार्यं बहुभिः उपयोक्तृभ्यः अपि प्रशंसाम् अवाप्तवान् । एते उपयोक्तारः प्रायः ते एव भवन्ति येषां वर्गनिर्देशः, लेखानाम् गौणनिर्माणम्, पत्रलेखनम् अपि इत्यादीनां कार्याणां कृते बहूनां साहित्यसन्धानं कर्तव्यम् अस्ति

पत्रस्य वास्तविकलेखकानां कृते एतेषां दत्तांशस्य उपयोगेन अन्याः समस्याः उत्पद्यन्ते ।

अद्यतनेन नेचर-लेखेन दर्शितं यत् अनेके शैक्षणिकप्रकाशकाः एआइ-माडल-प्रशिक्षणार्थं स्वकीय-पत्राणि प्राप्तुं प्रौद्योगिकी-कम्पनीभ्यः अधिकृतवन्तः । यथा, अमेरिकनप्रकाशकः वाइली इत्यनेन कम्पनीं स्वस्य सामग्रीप्रशिक्षणप्रतिरूपस्य उपयोगं कर्तुं अनुमतिं दत्त्वा प्रत्यक्षतया २३ मिलियन अमेरिकीडॉलर्-रूप्यकाणां राजस्वं प्राप्तम् । एतेषां च आयानाम् पत्रलेखकैः सह किमपि सम्बन्धः नास्ति।

अस्याः वास्तविक-आय-वितरण-समस्यायाः अतिरिक्तं यत् अन्ततः असमाधानीयं भवितुम् अर्हति, एतेषां शोधकर्तृणां कृते शैक्षणिकजगति केचन अत्यन्तं महत्त्वपूर्णाः मूल्याङ्कन-प्रणाल्याः अपि अस्य "ए.आइ.-शैक्षणिक-अन्वेषणस्य" जनन-प्रक्रियायां बाधिताः अभवन् यथा, शैक्षणिकक्षेत्रे अतीव महत्त्वपूर्णः सूचकः उद्धरणं एतेषु एआइ शैक्षणिकसन्धानपरिदृश्येषु अधुना नास्ति इति दृश्यते । बृहत् प्रतिरूपस्य एव यादृच्छिकता अव्याख्यातता च, तथैव दत्तांशस्य अपूर्णता च, तया उत्पन्नं शैक्षणिकं अन्वेषणपरिणामं शैक्षणिकसमुदायस्य एव निर्णयमानकात् भिन्नं करोति

एकः विद्वान् सिलिकॉन् स्टार इत्यस्मै अवदत् यत् यदा एते एआइ अन्वेषणाः स्वयमेव उत्तराणि जनयन्ति तदा कस्य कस्य च कस्य च चयनस्य के मापदण्डाः सन्ति? ये शिक्षाविदः उद्धरणसङ्ख्यां सुवर्णसामग्रीणां प्रत्यक्षतमं मानदण्डं मन्यन्ते, तेषां कृते यदि एते एआइ-परिणामाः अधिकाधिकं भवन्ति, ततः अनेकेषां शोधकर्तृभिः स्वपत्रेषु उपयुज्यन्ते, तर्हि किं एतत् अपि एआइ-एसईओ-प्रदूषणस्य अन्यत् रूपम्?



गुप्तगोपुरकानूने प्रश्नान् पृच्छनस्य परिणामाः

विवादस्य विषये एव यदा सीक्रेट् टॉवरः सूचकाङ्कदत्तांशकोशात् सीएनकेआई-पत्राणि स्वच्छं कृत्वा उपयोक्तृभ्यः सीएनकेआई-पत्राणां ऑनलाइन-पठनकार्यं न प्रदत्तवान् तदा बौद्धिकसम्पत्त्याः उल्लङ्घनस्य विवादः न्यूनतमः आसीत्, यू युन्टिङ्ग् इत्यनेन च उक्तं यत् "एण्टी- एकाधिकार-कानूनस्य विपरीत-अन्तर्जाल-सन्धान-इञ्जिन-सेवानां आत्म-अनुशासन-सन्धिः च, CNKI-इत्यस्य कृते गुप्त-गोपुर-अन्वेषणस्य सार्वजनिकसूचनायाः एतौ भागौ गृहीतुं न अनुमन्यते इति युक्तं नास्ति

परन्तु यदि ए.आइ , तथा च समुचितरीत्या तस्य विषये मुक्ततया चर्चां कृत्वा, तदा एव ते अद्यतनस्य सूचनाप्रवेशक्षेत्रस्य वास्तविकं मूलं प्राप्तुं यथार्थतया आशां कर्तुं शक्नुवन्ति यत् ते आव्हानं कर्तुं आशां कुर्वन्ति।