2024-08-16
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
(Kuvan lähde: unsplash)
Titanium Media App -uutisia 16. elokuutaKotimainen AI-startup "Shanghai MiTa Network Technology Co., Ltd" (jäljempänä "MiTa Technology") antoi lausunnon, jossa todettiin, että CNKI varoitti äskettäin tekoälyhakuyritystä MiTa Technologya akateemisten tietojen esittämisestä tekoälyn hakutuloksissa. ilman lupaa asiakirjan otsikko, sisällysluettelo ja tiivistelmä muodostavat vakavan loukkauksen, ja rikkomusilmoitus on 28 sivua pitkä.
Secret Tower Technology korostaa,Vaikka yritys ei ymmärtäisi tätä käytöstä, se kunnioittaa CNKI:n valintaa. Tästä eteenpäin Secret Tower AI Search ei enää sisällä CNKI-asiakirjojen bibliografisia ja abstrakteja tietoja, vaan se sisältää muiden arvovaltaisten kiinalaisten ja englanninkielisten tietokantojen bibliografiset ja abstraktit tiedot. Myös muut tietokannat ovat tervetulleita yhteistyöhön ja keskusteluun.
On raportoitu, että MiTa Technology perustettiin vuonna 2018. Yrityksen toimitusjohtaja Min Kerui oli aiemmin Cheetah Mobilen päätutkija ja tällä hetkellä Pekingin yliopiston Legal Artificial Intelligence Laboratoryn älykäs tutkija.
Vuonna 2018 MiTa lanseerasi peräkkäin laillisen tekoälykäännöstuotteen "MiTa Translation" ja virheenkorjaus- ja oikolukutuotteen "MiTa Writing Cat" vuonna 2022, se lanseerasi artikkelisukupolven tuotteen "Quantum Sketch", jonka päivittäisiä käyttäjiä on yli 10 000 viikossa. verkkoon siirtymisestä.
Tämän vuoden maaliskuusta lähtien Mita Technologyn luomasta "Mita AI Searchista" tuli yhtäkkiä suosittu ja se herätti markkinoiden huomion. Sivuston pääsytietojen seurantaalustan, samankaltaisen Webin mukaan MiTa Searchin käyntien määrä maaliskuussa sijoittui kolmanneksi AI-tuotteiden joukossa Kiinassa, toiseksi vain Baidu Wenxin Yiyanhen jälkeen.kuun pimeä puoliKimiKuukauden kasvu oli 550 %.
Tämän vuoden elokuussa MiTa Technology ilmoitti saaneensa päätökseen yli 100 miljoonan RMB:n A-sarjan rahoituksen, jota johti Ant Group ja jonka rahansiirron jälkeinen arvostus on US$150 miljoonaa (noin 1,077 miljardia RMB). Secret Towerin aiempia vanhoja osakkeenomistajia ovat olleet Mingshi Capital, Cheetah Mobile ja Fengyuan Capital.
Tuotenäkökulmasta verrattuna perinteisiin hakukoneisiin tekoälyhaku antaa käyttäjille suoraan vastauksia kysymyksiin ja liittää lähdelinkkejä. MiTa AI -haun virallisilla verkkosivuilla on kolme vastaustilaa: "tiivis", "syvä" ja "tutkimus", ja hakualueeksi voidaan asettaa "koko verkko", "kirjasto", "akateeminen", "podcast" ja muista lähteistä.
Mitä tulee ilmoituskirjeen seurantaan, Southern Metropolis Dailyn mukaan Mita Technologyn operatiivinen johtaja Wang Yiwei totesi, että CNKI ei nimenomaisesti maininnut ilmoituskirjeessä, mitä oikeuksia ja etuja on loukattu. MiTa AI -haku CNKI:n "akateemisesta" osiosta voi myös tuoda liikennettä CNKI:lle. Jotkut käyttäjät aktivoivat CNKI-tilinsä MiTA AI -haun kautta ja maksavat CNKI:stä, mikä on sinänsä etu CNKI:lle. Ottaen huomioon CNKI:n vaatimuksen katkaista yhteys, "emme pakota mitään risteystä".
Wang Yiwein mukaan aiemmat tekoälyhakutulokset eivät ole vain linkittäneet CNKI:hen, mutta muutkin viralliset kiinalaiset ja englantilaiset tietokannat eivät ole vielä pyytäneet yhteyden katkaisemista.CNKI-linkin irrottaminen ei kuitenkaan vaikuta MiTa-tuotteiden käyttökokemukseen.
Titanium Media App oppi, ettäTongfang CNKI (Beijing) Technology Co., Ltd., CNKI:n emoyhtiö, työskenteli äskettäin Huawein kanssa luodakseen mallin nimeltä Chinese Knowledge Big Model (Huazhi Big Model), joka voi tukea tietopalveluja, tieteellistä tutkimusta, kyselyoppimista, tuotanto ja käyttö, apudiagnoosi ja -hoito, skenaariot sellaisilla aloilla kuin älykäs oikeus.
Tongfang CNKI:n pääjohtaja Zhang Hongwei paljasti tämän vuoden heinäkuussa, että CNKI on alan johtava digitaalinen julkaisu- ja tietopalveluyritys, jolla on käyttäjiä yli 90 maassa ympäri maailmaa, mukaan lukien koulutus, tieteellinen tutkimus, ajatushautomot, hallitukset ja yritykset. CNKI:n käyttäjillä, erityisesti kotimaisilla koulutus- ja tutkimuslaitoksilla, on periaatteessa 100 %:n markkinaosuus. Tällä hetkellä Tongfang CNKI on sidoksissa China National Nuclear Corporationiin ja on valtion omistama yritys. Organisaatio on luonut yhteistyösuhteita yli 20 000 julkaisuorganisaation kanssa yli 70 maassa ympäri maailmaa järjestelmä ja ylläpitää maailman suurinta kiinalaista tietoresurssikirjastoa.
Zhang Hongwei huomautti, että Huazhin suureen malliin perustuen yhtiö on toteuttanut perusteellisen muutoksen koko CNKI-tuotesarjaan prosessoinnista ja huomautuksista tämän työkalun lisäämiseen eri teollisuudenalojen palvelualustaan. Sen jälkeen kun se avattiin virallisesti yleisölle tämän vuoden toukokuun puolivälissä, Huazhin käyttäjien määrä on kasvanut nopeasti, ja nykyinen yksittäisten käyttäjien määrä on ylittänyt 10 miljoonaa.
CNKI:lle on kuitenkin määrätty sakkoja useaan otteeseen, ja toimiala epäilee kehitysmalliaan. Valtion markkinasääntelylaitos teki 26.12.2022 lain mukaisen hallinnollisen seuraamuspäätöksen, jossa määrättiin CNKI:n lopettamaan laiton toiminta, ja määräsi 5 % sakon sen Kiinan kotimaan myynnistä vuonna 2021 1,752 miljardia juania. Kiinan kyberavaruushallinto teki syyskuussa 2023 yhteensä 87,6 miljoonaa yuania lain mukaisista hallinnollisista seuraamuksista, jotka liittyvät CNKI:n verkkoturvallisuusarviointiin, määräsi sen lopettamaan henkilötietojen laittoman käsittelyn ja määräsi 50 RMB:n sakon; miljoonaa euroa, vedoten CNKI:n mobiilitoimintoihin ja sen operoimiin CNKI-toimintoihin. Kaikkia 14 sovellusta syytettiin asiaan liittyvistä ongelmista, mukaan lukien henkilötietojen kerääminen välttämättömyyden periaatteen vastaisesti, henkilötietojen kerääminen ilman lupaa, keräämis- ja käyttösääntöjen paljastamatta jättäminen tai nimenomainen ilmoittaminen. , ei tarjoa tilin peruutustoimintoa ja ei poista käyttäjän henkilökohtaisia tietoja ajoissa sen jälkeen, kun käyttäjä on peruuttanut tilin tiedot jne.
Kiinan valtiotieteen ja oikeustieteen yliopiston vertailevan oikeuslaitoksen professori Liu Wenjie uskoo, että abstrakti on tiivistetty tiivistelmä artikkelin sisällöstä, erityisesti ajatuksista ja ideoista, jos Internetin käyttäjille tarjotaan hakupalveluita ja julkisten tietojen indeksoiminen Internetissä tiivistelmien tarjoamiseksi, se ei yleensä ole tekijänoikeusloukkaus.
Äskettäin kansainvälisesti tunnetun Nature-lehden toimittaja Elizabeth Gibney julkaisi artikkelin, jossa todettiin, että yhä useammat akateemiset kustantajat lisensoivat tutkimuspapereita teknologiayhtiöille tekoälymallin kouluttamiseksi. Yksi akateeminen kustantaja ansaitsi tästä 23 miljoonaa dollaria, kun taas kirjailija ansaitsi nollaa. Nämä liiketoimet, monissa tapauksissa ilman tekijöiden kuulemista, ovat herättäneet suurta tyytymättömyyttä joidenkin tutkijoiden keskuudessa.
"Jos paperiasi ei ole käytetty tekoälyn koulutusdatana, siitä tulee todennäköisesti pian osa koulutusta." Elizabeth Jipney huomautti artikkelissa, että tällä hetkellä akateemisten julkaisujen kirjoittajilla ei ole juurikaan valinnanvaraa, kun he kohtaavat kustantajia, jotka myyvät tekijänoikeudella suojattuja teoksiaan. häiriötä. Julkisesti julkaistuille artikkeleille ei ole olemassa mekanismia sen varmistamiseksi, käytetäänkö näitä sisältöä tekoälyn harjoitustietoina. Suurten kielimallien käytössä oikeudenmukaisempi mekanismi tekijöiden oikeuksien ja etujen suojaamiseksi ansaitsee laajaa keskustelua akateemisissa ja tekijänoikeuspiireissä.
Suuri kielimalli (LLM) luottavat yleensä suuriin tietomääriin, jotka on kerätty Internetistä harjoittelua varten. Nämä tiedot sisältävät miljardeja kielellisiä tietoja (kutsutaan "tokeneiksi"), ja analysoimalla näiden merkkien välisiä kuvioita malli pystyy luomaan sujuvaa tekstiä. Runsaan sisältönsä ja suuren tietotiheytensä vuoksi akateemiset paperit ovat arvokkaampia kuin suuret määrät tavallista dataa ja ovat tärkeä tietolähde tekoälykoulutuksessa. Mozilla Foundationin dataanalyytikko Stefan Baack analysoi, että tieteelliset artikkelit ovat erittäin hyödyllisiä suurten kielimallien koulutuksessa, erityisesti tieteellisten aiheiden päättelykyvyn kannalta. Juuri tiedon suuren arvon vuoksi suuret teknologiayritykset ovat käyttäneet valtavia summia tietokokonaisuuksien ostamiseen.
You Yunting, Shanghai Dabang -lakitoimiston vanhempi kumppani ja asianajaja, sanoi, että MiTa AI -haun "akateemisen" osion suurin ongelma on, että se voi näyttää artikkelin sisällön kokonaisuudessaan "Paperin PDF on mukana Vaikka sitä ei voi ladata, käyttäjä löytää sen tulossivulta." Voit tarkastella tämän artikkelin koko tekstiä napsauttamalla PDF-linkkiä, mikä loukkaa artikkelin oikeutta levittää tietoa verkossa. "Mutta. jos tekoäly omaksuu artikkelin olemuksen ja välittää sen käyttäjälle omalla tavallaan, tekijänoikeuslain mukaan teoksen osan kohtuullinen lainaus tietyn asian selittämiseksi katsotaan reiluksi käytöksi.
Mitä tulee paperitietojen käyttöön suurten mallien koulutukseen, You Yunting sanoi, että tämä käyttäytyminen ei loukkaa Kiinan kansallista tietoinfrastruktuuria. Tekijänoikeuslain mukaan koulutus on kopiointia ja oppimista. Kopiointi on artikkeleiden kopiointia palvelimelle koulutusta varten. Tällä hetkellä ei ole olemassa selkeää oikeudellista tuomiota, jonka perusteella voidaan määrittää, onko oppiminen loukkaus. CNKI ei kuitenkaan ole paperin oikeudenhaltija, olipa kyse kopiointi-, opiskelu- tai muista tekijänoikeuteen liittyvistä oikeuksista.
Zhang Hongwei sanoi suoraan, että suurten tekoälymallien aikakaudella CNKI:n on perustettava ekosysteemi ja yhteistyö.
"Jos ei ole alkupäätä, ei julkaisuteollisuutta eikä jatkuvaa korkealaatuista dataa datateollisuudesta, tekoälyteollisuutemme on itse asiassa vaikea ylläpitää korkealaatuista kehitystä. Sellaisen ongelman ratkaisemiseksi me itse asiassa Tarvitsemme koko toimialamme testaamaan viisautta. Meidän on tehtävä yhteistyötä rakentaaksemme aAIGCAjan hyvä ekologia edistää yhdessä tämän toimialan laadukasta kehitystä. Me, CNKI, olemme valmiita tekemään yhteistyötä kaikkien kanssa tässä suhteessa edistääksemme alan kestävää ja laadukasta kehitystä. "Zhang Hongwei sanoi.