Nachricht

CNKI „beschuldigt“ MITA Verstöße gegen die KI-Suche: Trennen Sie sofort den Link zu unserer Website

2024-08-16

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

(Bildquelle: unsplash)

Neuigkeiten zur Titanium Media App am 16. AugustDas inländische KI-Startup „Shanghai MiTa Network Technology Co., Ltd.“ (bezeichnet als „MiTa Technology“) gab eine Erklärung heraus, in der es hieß, dass CNKI kürzlich einen Brief herausgegeben habe, in dem das KI-Such-Startup MiTa Technology wegen der Darstellung akademischer Informationen in KI-Suchergebnissen gewarnt wurde ohne Genehmigung. Der Titel, das Inhaltsverzeichnis und die Zusammenfassung des Dokuments stellen einen schwerwiegenden Verstoß dar und das Benachrichtigungsschreiben über den Verstoß ist 28 Seiten lang.

Secret Tower Technology betont,Auch wenn das Unternehmen dieses Verhalten nicht versteht, respektiert es die Entscheidung von CNKI. Von nun an wird Secret Tower AI Search keine bibliografischen und abstrakten Daten von CNKI-Dokumenten mehr umfassen, sondern stattdessen bibliografische und abstrakte Daten anderer maßgeblicher chinesischer und englischer Wissensdatenbanken. Auch andere Datenbanken sind zur Zusammenarbeit und Diskussion willkommen.

Berichten zufolge wurde MiTa Technology im Jahr 2018 gegründet. Der CEO des Unternehmens, Min Kerui, war zuvor leitender Wissenschaftler von Cheetah Mobile und ist derzeit leitender intelligenter Wissenschaftler des Legal Artificial Intelligence Laboratory der Universität Peking.

Im Jahr 2018 brachte MiTa nacheinander das juristische KI-Übersetzungsprodukt „MiTa Translation“ und das Fehlerkorrektur- und Korrekturleseprodukt „MiTa Writing Cat“ auf den Markt. Im Jahr 2022 brachte es das Produkt zur Artikelerstellung „Quantum Sketch“ auf den Markt, wobei die täglichen Benutzer innerhalb einer Woche 10.000 überstiegen online zu gehen.

Seit März dieses Jahres wurde die von Mita Technology entwickelte „Mita AI Search“ plötzlich populär und erregte die Aufmerksamkeit des Marktes. Die Website wurde in diesem Monat mehr als 7 Millionen Mal besucht. Laut Similar Web, einer Plattform zur Überwachung von Website-Zugriffsdaten, lag die Zahl der Besuche bei MiTa Search im März an dritter Stelle unter einer Gruppe von KI-Produkten in China, nur an zweiter Stelle nach Baidu Wenxin Yiyanhe.dunkle Seite des MondesKimi;Die Wachstumsrate des Monats erreichte 550 %.

Im August dieses Jahres gab MiTa Technology den Abschluss einer Serie-A-Finanzierung über über 100 Millionen RMB unter der Leitung der Ant Group mit einer Post-Money-Bewertung von 150 Millionen US-Dollar (ca. 1,077 Milliarden RMB) bekannt. Zu den bisherigen Altaktionären von Secret Tower gehören Mingshi Capital, Cheetah Mobile und Fengyuan Capital.

Aus Produktsicht gibt die KI-Suche den Benutzern im Vergleich zu herkömmlichen Suchmaschinen direkt Antworten auf Fragen und fügt Quelllinks hinzu. Die offizielle Website der MiTa AI-Suche bietet drei Antwortmodi: „prägnant“, „eingehend“ und „Recherche“. Der Suchbereich kann auf „gesamtes Netzwerk“, „Bibliothek“, „akademisch“, „Podcast“ usw. eingestellt werden andere Quellen.

Bezüglich der Folgemaßnahmen zum Benachrichtigungsschreiben erklärte Wang Yiwei, Chief Operating Officer von Mita Technology, laut Southern Metropolis Daily, dass CNKI im Benachrichtigungsschreiben nicht ausdrücklich angegeben habe, welche Rechte und Interessen verletzt wurden. Die MiTa-KI-Suche für den „akademischen“ Bereich von CNKI kann auch Traffic zu CNKI bringen. Einige Benutzer aktivieren ihre CNKI-Konten über die MiTA-KI-Suche und bezahlen für CNKI, was an sich schon ein Vorteil für CNKI ist. Angesichts der Forderung von CNKI, die Verbindung zu trennen, „werden wir keine Kreuzung erzwingen.“

Laut Wang Yiwei waren frühere KI-Suchergebnisse nicht nur mit CNKI verlinkt, sondern auch andere maßgebliche chinesische und englische Datenbanken haben noch nicht darum gebeten, die Verbindung zu trennen.Das Trennen der CNKI-Verbindung hat jedoch keinen Einfluss auf das Erlebnis der MiTa-Produkte.

Titanium Media App hat herausgefunden, dassTongfang CNKI (Beijing) Technology Co., Ltd., die Muttergesellschaft von CNKI, hat kürzlich mit Huawei zusammengearbeitet, um ein Modell namens „Chinese Knowledge Big Model“ (Huazhi Big Model) zu entwickeln, das Wissensdienste, wissenschaftliche Forschung und forschendes Lernen unterstützen kann. Produktion und Betrieb, Hilfsdiagnose und -behandlung, Szenarien in Bereichen wie Smart Justice.

Zhang Hongwei, General Manager von Tongfang CNKI, gab im Juli dieses Jahres bekannt, dass CNKI ein branchenführendes Unternehmen für digitale Veröffentlichungen und Wissensdienste mit Nutzern in mehr als 90 Ländern auf der ganzen Welt ist, darunter Bildung, wissenschaftliche Forschung, Denkfabriken, Regierungen und Unternehmen und CNKI-Nutzer, insbesondere inländische Bildungs- und Forschungseinrichtungen, haben grundsätzlich einen Marktanteil von 100 %. Derzeit ist Tongfang CNKI der China National Nuclear Corporation angeschlossen und ein staatliches Unternehmen. Die Organisation hat Kooperationsbeziehungen mit mehr als 20.000 Verlagsorganisationen in mehr als 70 Ländern auf der ganzen Welt aufgebaut System und betreibt die weltweit größte chinesische Wissensressourcenbibliothek.

Zhang Hongwei wies darauf hin, dass das Unternehmen auf der Grundlage des Huazhi-Großmodells eine tiefgreifende Transformation der gesamten CNKI-Produktlinie durchgeführt hat, von der Verarbeitung und Annotation bis hin zur Hinzufügung dieses Tools zur Serviceplattform für verschiedene Branchen. Seit der offiziellen Öffnung für die Öffentlichkeit Mitte Mai dieses Jahres ist die Zahl der Huazhi-Nutzer rasant gestiegen, und die aktuelle Zahl der Einzelnutzer liegt bei über 10 Millionen.

Allerdings wurde CNKI mehrfach mit Geldstrafen belegt, und die Branche hegt gewisse Zweifel an ihrem Entwicklungsmodell. Am 26. Dezember 2022 erließ die staatliche Verwaltung für Marktregulierung eine gesetzeskonforme Verwaltungsstrafe, in der sie CNKI anwies, illegale Aktivitäten einzustellen, und eine Geldstrafe in Höhe von 5 % seines Inlandsumsatzes in China in Höhe von 1,752 Milliarden Yuan im Jahr 2021 verhängte. in Höhe von insgesamt 87,6 Millionen Yuan; im September 2023 entschied die Cyberspace Administration of China in Übereinstimmung mit dem Gesetz über Verwaltungsstrafen im Zusammenhang mit der Netzwerksicherheitsüberprüfung von CNKI, ordnete an, die illegale Verarbeitung personenbezogener Daten zu stoppen, und verhängte eine Geldstrafe von 50 RMB Millionen, unter Berufung auf die von ihr betriebenen mobilen CNKI- und CNKI-Betriebe. Allen 14 Apps wurden damit verbundene Probleme vorgeworfen, darunter das Sammeln personenbezogener Daten unter Verstoß gegen den Grundsatz der Notwendigkeit, das Sammeln personenbezogener Daten ohne Zustimmung und die Nichtoffenlegung oder ausdrückliche Angabe der Erhebungs- und Nutzungsregeln , keine Funktion zur Kontoauflösung bereitstellen und die persönlichen Daten des Benutzers nicht rechtzeitig löschen, nachdem der Benutzer die Kontoinformationen usw. gelöscht hat.

Liu Wenjie, Professor am Institut für Rechtsvergleichung der China University of Political Science and Law, glaubt, dass eine Zusammenfassung eine konzentrierte Zusammenfassung des Inhalts einer Arbeit ist, insbesondere der Gedanken und Ideen, wenn Suchdienste für Internetnutzer bereitgestellt werden und das Crawlen öffentlicher Daten im Internet, um Zusammenfassungen von Aufsätzen bereitzustellen, sollte im Sinne des Urheberrechts als faire Nutzung angesehen werden und stellt im Allgemeinen keine Urheberrechtsverletzung dar.

Kürzlich veröffentlichte Elizabeth Gibney, Herausgeberin der international renommierten Zeitschrift Nature, einen Artikel, in dem es heißt, dass immer mehr akademische Verlage Forschungsarbeiten für das Training von KI-Modellen lizenzieren. Ein akademischer Verlag verdiente damit 23 Millionen Dollar, während der Autor null verdiente. Diese Transaktionen, in vielen Fällen ohne Rücksprache mit den Autoren, haben bei einigen Forschern große Unzufriedenheit hervorgerufen.

„Wenn Ihre Arbeit nicht als KI-Trainingsdaten verwendet wurde, wird sie wahrscheinlich bald Teil des Trainings werden.“ Elizabeth Jipney wies in dem Artikel darauf hin, dass Autoren wissenschaftlicher Arbeiten derzeit fast keine Wahl haben, wenn Verlage ihre urheberrechtlich geschützten Werke verkaufen. Interferenz. Für öffentlich veröffentlichte Artikel gibt es keinen Mechanismus zur Bestätigung, ob diese Inhalte als KI-Trainingsdaten verwendet werden. Wie bei der Verwendung großer Sprachmodelle ein gerechterer Mechanismus zum Schutz der Rechte und Interessen der Urheber geschaffen werden kann, bedarf einer ausführlichen Diskussion in akademischen und urheberrechtlichen Kreisen.

Großes Sprachmodell (LL.M.) stützen sich für das Training in der Regel auf große Datenmengen, die aus dem Internet entnommen werden. Diese Daten umfassen Milliarden sprachlicher Informationen (sogenannte „Tokens“), und durch die Analyse der Muster zwischen diesen Tokens ist das Modell in der Lage, flüssigen Text zu generieren. Aufgrund ihres reichhaltigen Inhalts und ihrer hohen Informationsdichte sind wissenschaftliche Arbeiten wertvoller als große Mengen gewöhnlicher Daten und eine wichtige Datenquelle im KI-Training. Der Datenanalyst der Mozilla Foundation, Stefan Baack, analysierte, dass wissenschaftliche Arbeiten für das Training großer Sprachmodelle sehr hilfreich sind, insbesondere im Hinblick auf die Argumentationsfähigkeiten zu wissenschaftlichen Themen. Gerade wegen des hohen Wertes von Daten haben große Technologieunternehmen riesige Summen für den Kauf von Datensätzen ausgegeben.

You Yunting, Senior Partner und Anwalt der Anwaltskanzlei Shanghai Dabang, sagte, dass das größte Problem mit dem „akademischen“ Bereich der MiTa AI-Suche darin besteht, dass der Inhalt des Artikels vollständig angezeigt werden kann Die Forschungsergebnisse können zwar nicht heruntergeladen werden, der Benutzer kann sie jedoch auf der Ergebnisseite finden.“ Sie können den vollständigen Text dieses Artikels anzeigen, indem Sie auf den PDF-Link klicken, was gegen das Recht des Artikels zur Online-Verbreitung von Informationen verstößt. „Aber Wenn KI die Essenz des Artikels aufnimmt und sie auf ihre eigene Weise an den Benutzer weitergibt, sieht das Urheberrechtsgesetz vor, dass angemessenes Zitieren eines Teils des Werks zur Erläuterung eines bestimmten Problems als faire Verwendung gilt.

Bezüglich der Verwendung von Papierdaten für das Training großer Modelle sagte You Yunting, dass dieses Verhalten die nationale Wissensinfrastruktur Chinas nicht verletze. Nach dem Urheberrechtsgesetz handelt es sich beim Training um das Kopieren und Lernen von Artikeln aus dem Internet auf den Server. Derzeit gibt es keine eindeutige rechtliche Beurteilung, ob das Lernen einen Verstoß darstellt. Unabhängig davon, ob es sich um das Recht der Vervielfältigung, des Studiums oder anderer Rechte im Zusammenhang mit dem Urheberrecht handelt, ist CNKI nicht der Rechteinhaber des Papiers.

Zhang Hongwei sagte offen, dass CNKI im Zeitalter großer KI-Modelle ein Ökosystem und eine Zusammenarbeit aufbauen muss.

„Wenn es keinen Upstream, keine Verlagsbranche und keine kontinuierliche Versorgung mit qualitativ hochwertigen Daten aus der Datenbranche gibt, wird es für unsere Branche der künstlichen Intelligenz tatsächlich schwierig sein, eine qualitativ hochwertige Entwicklung aufrechtzuerhalten. Um ein solches Problem zu lösen, müssen wir tatsächlich.“ Unsere gesamte Branche muss die Weisheit testen. Wir müssen zusammenarbeiten, um eine zu schaffenAIGCDie gute Ökologie der Zeit wird gemeinsam die qualitativ hochwertige Entwicklung dieser Branche fördern. Wir, CNKI, sind in dieser Hinsicht bereit, mit allen zusammenzuarbeiten, um die nachhaltige und qualitativ hochwertige Entwicklung der Branche zu fördern. „Sagte Zhang Hongwei.