CNKI «обвиняет» MITA в нарушении поиска AI: немедленно отключите наш сайт link

CNKI «обвинила» MITA в нарушении прав на поиск с использованием ИИ: немедленно отключите ссылку на наш сайт

2024-08-16

(Источник изображения: unsplash)

Новости приложения Titanium Media за 16 августаОтечественный стартап в области искусственного интеллекта «Shanghai MiTa Network Technology Co., Ltd.» (именуемый «MiTa Technology») опубликовал заявление, в котором говорится, что CNKI недавно выпустила письмо с предупреждением стартапа по поиску искусственного интеллекта MiTa Technology за представление научной информации в результатах поиска искусственного интеллекта. без разрешения. Название, содержание и аннотация документа представляют собой серьезное нарушение, а объем письма-уведомления о нарушении составляет 28 страниц.

Secret Tower Technology подчеркивает:Даже если компания не понимает такого поведения, она уважает выбор CNKI. Отныне Secret Tower AI Search больше не будет включать библиографические и абстрактные данные документов CNKI, но вместо этого будет включать библиографические и реферативные данные из других авторитетных баз знаний на китайском и английском языках. Другие базы данных также могут сотрудничать и обсуждать.

Сообщается, что MiTa Technology была основана в 2018 году. Генеральный директор компании Мин Керуи ранее был главным научным сотрудником Cheetah Mobile, а в настоящее время является главным научным сотрудником Лаборатории юридического искусственного интеллекта Пекинского университета.

В 2018 году MiTa последовательно запустила продукт для юридического перевода с использованием искусственного интеллекта «MiTa Translation» и продукт для исправления ошибок и корректуры «MiTa Write Cat», в 2022 году она запустила продукт для создания статей «Quantum Sketch», число ежедневных пользователей которого превысило 10 000 в течение недели; выхода в Интернет.

С марта этого года «Mita AI Search», созданный Mita Technology, внезапно стал популярным и привлек внимание рынка. За месяц веб-сайт посетили более 7 миллионов раз. По данным платформы мониторинга данных доступа к веб-сайтам Like Web, по количеству посещений MiTa Search в марте занял третье место среди группы продуктов искусственного интеллекта в Китае, уступив только Baidu Wenxin Yiyanhe.темная сторона луныКими;Темпы роста за месяц достигли 550%.

В августе этого года MiTa Technology объявила о завершении финансирования серии А на сумму более 100 миллионов юаней под руководством Ant Group с оценкой после получения инвестиций в 150 миллионов долларов США (приблизительно 1,077 миллиарда юаней). Предыдущими старыми акционерами Secret Tower были Mingshi Capital, Cheetah Mobile и Fengyuan Capital.

С точки зрения продукта, по сравнению с традиционными поисковыми системами, поиск с помощью ИИ напрямую дает пользователям ответы на вопросы и прикрепляет ссылки на источники. Официальный веб-сайт поиска MiTa AI предоставляет три режима ответа: «краткий», «углубленный» и «исследование», а область поиска может быть установлена на «вся сеть», «библиотека», «академический», «подкаст» и «подкаст». другие источники.

Что касается последующих действий в связи с письмом-уведомлением, по данным Southern Metropolis Daily, Ван Ивэй, главный операционный директор Mita Technology, заявил, что CNKI конкретно не указала в письме-уведомлении, какие права и интересы были нарушены. Поиск MiTa AI в «академическом» разделе CNKI также может принести трафик в CNKI. Некоторые пользователи активируют свои учетные записи CNKI через поиск MiTA AI и платят за CNKI, что само по себе является преимуществом для CNKI. Учитывая требование CNKI об отключении, «мы не будем форсировать какой-либо перекресток».

По словам Ван Ивэя, предыдущие результаты поиска ИИ не только были связаны с CNKI, но и другие авторитетные китайские и английские базы данных еще не просили отключиться.Однако отключение канала CNKI не повлияет на работу продуктов MiTa.

Приложение Titanium Media узнало, чтоTongfang CNKI (Beijing) Technology Co., Ltd., материнская компания CNKI, недавно работала с Huawei над созданием модели под названием «Большая модель китайских знаний» (Большая модель Хуачжи), которая может поддерживать информационные услуги, научные исследования, исследовательское обучение, производство и эксплуатация, вспомогательная диагностика и лечение, Сценарии в таких областях, как умное правосудие.

Чжан Хунвэй, генеральный менеджер Tongfang CNKI, в июле этого года сообщил, что CNKI является ведущей в отрасли компанией по предоставлению цифровых публикаций и информационных услуг с пользователями в более чем 90 странах мира, включая образование, научные исследования, аналитические центры, правительства и предприятия. и научно-исследовательские учреждения, использующие CNKI, особенно отечественные образовательные и исследовательские учреждения, имеют практически 100% долю рынка. В настоящее время Tongfang CNKI является филиалом Китайской национальной ядерной корпорации и является государственным предприятием. Организация установила отношения сотрудничества с более чем 20 000 издательскими организациями в более чем 70 странах мира. Первоначально она создала мировые знания о больших данных. система и управляет крупнейшей в мире библиотекой китайских знаний.

Чжан Хунвэй отметил, что на основе крупной модели Huazhi компания провела глубокую трансформацию всей линейки продуктов CNKI, от обработки и аннотирования до добавления этого инструмента в сервисную платформу для различных отраслей. С тех пор, как он был официально открыт для публики в середине мая этого года, число пользователей Huazhi быстро росло, и в настоящее время число индивидуальных пользователей превысило 10 миллионов.

Однако CNKI неоднократно подвергалась штрафам, и у отрасли есть некоторые сомнения в ее модели развития. 26 декабря 2022 года Государственная администрация по регулированию рынка приняла решение об административном наказании в соответствии с законом, обязав CNKI прекратить незаконную деятельность, и наложила штраф в размере 5% от ее внутренних продаж в Китае в размере 1,752 миллиарда юаней в 2021 году. на общую сумму 87,6 млн юаней, в сентябре 2023 года Управление киберпространства Китая приняло решение об административных штрафах, связанных с проверкой сетевой безопасности CNKI в соответствии с законом, обязало его прекратить незаконную обработку личной информации и наложило штраф в размере 50 юаней; миллионов, ссылаясь на мобильную CNKI и операции CNKI, которыми она управляет. Все 14 приложений были обвинены в наличии связанных проблем, включая сбор личной информации в нарушение принципа необходимости, сбор личной информации без согласия, нераскрытие или явное указание правил сбора и использования. , отсутствие функции удаления учетной записи и несвоевременное удаление личной информации пользователя после того, как пользователь удалил информацию об учетной записи и т. д.

Лю Вэньцзе, профессор Института сравнительного правоведения Китайского университета политических наук и права, считает, что реферат — это концентрированное изложение содержания статьи, особенно мыслей и идей, если пользователям Интернета предоставляются услуги поиска. и сканирование общедоступных данных в Интернете для предоставления рефератов статей, это следует считать добросовестным использованием в соответствии с законом об авторском праве, как правило, не является нарушением авторских прав.

Недавно Элизабет Гибни, редактор всемирно известного журнала Nature, опубликовала статью, в которой говорится, что все больше и больше академических издателей лицензируют исследовательские работы технологическим компаниям для обучения моделей искусственного интеллекта. Один академический издатель заработал на этом 23 миллиона долларов, а автор — ноль. Эти транзакции, во многих случаях без консультации с авторами, вызвали сильное недовольство среди некоторых исследователей.

«Если ваша статья не использовалась в качестве данных для обучения ИИ, она, скорее всего, вскоре станет частью обучения». Элизабет Джипни отметила в статье, что в настоящее время у авторов научных работ почти нет выбора, когда они сталкиваются с издателями, продающими их работы, защищенные авторским правом. вмешательство. Для публично опубликованных статей не существует механизма подтверждения того, используется ли их содержимое в качестве данных для обучения ИИ. При использовании больших языковых моделей вопрос о том, как создать более справедливый механизм защиты прав и интересов авторов, заслуживает широкого обсуждения в академических и авторских кругах.

Большая языковая модель (Магистр права) обычно полагаются на большие объемы данных, полученных из Интернета, для обучения. Эти данные включают в себя миллиарды фрагментов лингвистической информации (называемых «токенами»), и анализируя закономерности между этими токенами, модель способна генерировать беглый текст. Из-за богатого содержания и высокой плотности информации академические статьи более ценны, чем большие объемы обычных данных, и являются важным источником данных для обучения ИИ. Аналитик данных Mozilla Foundation Стефан Баак проанализировал, что научные статьи очень полезны для обучения большим языковым моделям, особенно с точки зрения способности рассуждать по научным темам. Именно из-за высокой ценности данных крупные технологические компании тратят огромные суммы денег на приобретение наборов данных.

Ю Юньтин, старший партнер и юрист юридической фирмы Shanghai Dabang, сказал, что самая большая проблема с «академическим» разделом поиска MiTa AI заключается в том, что он может полностью отображать содержание статьи. результаты исследования. Хотя его нельзя скачать, пользователь может найти его на странице результатов. Полный текст этой статьи можно просмотреть, нажав на ссылку PDF, что нарушает право статьи на распространение информации в Интернете. «Но если ИИ впитывает суть статьи и передает ее пользователю по-своему, согласно Закону об авторском праве он предусматривает, что разумное цитирование части произведения с целью разъяснения определенного вопроса считается добросовестным использованием.

Что касается использования бумажных данных для обучения крупных моделей, Ю Юньтин сказал, что такое поведение не нарушает национальную инфраструктуру знаний Китая. Согласно Закону об авторском праве, процесс обучения — это копирование и обучение. Копирование — это копирование статей из Интернета на сервер для обучения. В настоящее время не существует четкого юридического решения, позволяющего определить, является ли обучение нарушением авторских прав. Однако, будь то право на воспроизведение, изучение или другие права, связанные с авторским правом, CNKI не является правообладателем статьи.

Чжан Хунвэй откровенно сказал, что в эпоху крупных моделей искусственного интеллекта CNKI необходимо создать экосистему и сотрудничество.

«Если не будет ни апстрима, ни издательской индустрии, ни непрерывного снабжения высококачественными данными из индустрии данных, нашей индустрии искусственного интеллекта на самом деле будет трудно поддерживать высококачественное развитие. Чтобы решить такую проблему, мы на самом деле нужна вся наша отрасль, чтобы проверить мудрость. Нам нужно работать вместе, чтобы построить.АИГКХорошая экология времени будет совместно способствовать качественному развитию этой отрасли. Мы, CNKI, готовы сотрудничать со всеми в этом аспекте, чтобы способствовать устойчивому и качественному развитию отрасли. «Сказал Чжан Хунвэй.

новости

CNKI «обвинила» MITA в нарушении прав на поиск с использованием ИИ: немедленно отключите ссылку на наш сайт

Введение

Моя контактная информация