AI Weekly Report |. Suuri malli ei voi määrittää, onko 9.11 vai 9.9 suurempi, julkaisee kevyen mallin GPT-4o mini

AI Weekly Report |. Suuri malli ei voi määrittää, kumpi on suurempi, 9.11 vai 9.9, OpenAI julkaisee kevyen GPT-4o minin

2024-07-21

Suuri malli ei voi määrittää, kumpi on suurempi, 9.11 vai 9.9

Ala-asteen oppilaille vaikea matemaattinen ongelma on järkyttänyt monia suuria tekoälymalleja kotimaassa ja ulkomailla. Kumpi on isompi, 9.11 vai 9.9? Tämän ongelman osalta China Business News -toimittajat testasivat 17. heinäkuuta 12 suurta mallia, joista Alibaba Tongyi Qianwen, Baidu Wenxinyiyan, Minimax ja Tencent Yuanbao vastasivat oikein, mutta ChatGPT-4o, Byte Doubao, Dark of the Moon Mian kimi, Zhipu Qingyan , Zero One All Things Knowledge, Step Stars Yuewen, Baichuan Zhibai Xiaoying, Shangtang Discussion saivat kaikki vääriä vastauksia, ja väärät tavat ovat erilaisia. Useimmat suuret mallit vertailevat virheellisesti desimaalipilkun jälkeen olevia lukuja kysymyksissään ja vastauksissaan luullen, että 9.11 on suurempi kuin 9.9.

Kommentti: Virheiden takana suurten mallien huono matemaattinen kyky on pitkäaikainen ongelma. Jotkut alan sisäpiiriläiset uskovat, että generatiiviset kielimallit on suunniteltu pikemminkin kirjaimelliseen kuin numeeriseen ajatteluun. Kohdennettu korpuskoulutus saattaa kuitenkin vähitellen parantaa mallin kykyä vastata tieteen kysymyksiin tulevaisuudessa.

OpenAI julkaisee kevyen mallin GPT-4o mini, mallin hinta laski 99% kahdessa vuodessa

18. heinäkuuta paikallista aikaa OpenAI julkaisi uuden kevyen suuren mallin GPT-4o mini. Raporttien mukaan GPT-4o mini korvaa GPT-3.5 Turbon tästä lähtien kysymys-vastausrobotin ChatGPT:ssä, ja yrityskäyttäjät pääsevät käyttämään GPT-4o miniä ensi viikosta alkaen. "Odotamme, että GPT-4o mini laajentaa tekoälyn soveltamista ja tekee tekoälystä edullisempaa OpenAI:n virallisella verkkosivustolla olevan artikkelin mukaan GPT-4o minin syöttöhinta on 15 senttiä (0,15 dollaria)/miljoona tokenia." (sanaelementit), tuotantohinta on 60 senttiä (0,6 USD)/milj. tokeneita, 60 % halvempi kuin GPT-3.5 Turbo. OpenAI sanoi, että yritys jatkaa myös kustannusten alentamista ja parantaa mallin suorituskykyä. Verrattuna vuoden 2022 text-davinci-003-malliin GPT-4o minin hinta on laskenut 99%.

Kommentti: Vaikka OpenAI ei ole julkaissut seuraavan sukupolven mallia GPT-5, se päivittää edelleen mallia nykyisten ominaisuuksiensa perusteella ja jatkaa suurten mallien kustannusten alentamista. Myös muut suuret mallivalmistajat mainostavat tänä vuonna kevyitä malleja. Google julkaisi tämän vuoden toukokuussa kevyen mallin Gemini 1.5 Flash. Anthropicin maaliskuussa julkaisema Claude 3 -sarja sisältää kevyen Claude 3 Haikun. Suuret mallit pienemmillä parametreilla ovat osoittaneet suurta potentiaalia tänä vuonna. Koulutus voi parantaa suorituskykyä lisäämällä tiedon määrää parametrien määrää lisäämällä.

Kuusi suurta mallivalmistajaa vastasi suurten mallien huonojen digitaalisten ominaisuuksien ongelmaan

China Business News -toimittajat ottivat äskettäin yhteyttä ja haastattelivat useita suuria mallivalmistajia, mukaan lukien Alibaba Tongyi, Tencent Hunyuan Team, Dark Side of the Moon Kimi, MiniMax Conch, Xueersi Jiuzhang, NetEase Youdao jne. Haastattelun aikana he vastasivat tärkeimpiin kysymyksiin. huonon mallimatematiikan ongelma. Alibaba Tongyi Laboratoryn tuotepäällikkö Wang Xiaoming sanoi, että samanlaiset ongelmat ovat yleisiä matemaattisia laskenta- ja loogisia päättelyongelmia, ja ne ovat myös tapauksia, joita kehittäjät usein testaavat mallin harjoittelun ja käytön aikana. Suuret mallit voivat vastata "oikein" tai ". väärin" "Se on itse asiassa todennäköisyyskysymys. Tencentin Hunyuan-tiimi totesi, että suuri malli itsessään on todennäköisyysmalli, ja sitä on vaikea mahdollistaa vakaasti ratkaisemaan tällaisia numeerisia laskenta- tai vertailuongelmia erilaisissa olosuhteissa.

Kommentti: "Kumpi on isompi, 9.11 vai 9.9?" ei ole vaikeaa ihmisille, mutta suurille malleille ei välttämättä ole helppo vastata. Kattavien vastauksista päätellen suurista mallivalmistajista vastaavien henkilöiden mainitsemat näkemykset sisältävät, että suuret mallit eivät vielä tarkasti ohjaa lukujen välisiä laskenta- tai vertailusääntöjä hyvin varhaisessa vaiheessa. Myös monet alan sisäpiiriläiset uskovat, että taustalla olevan perusmallin älykkyyttä on jatkossa nostettava ja tällaiset virheet ratkaistava koulutustietojen ja ulkoisten työkalujen tasolta. Lopullinen ratkaisu voi olla seuraavan sukupolven kykyjen parantaminen malli. Tällaisten tapausten löytäminen auttaa valmistajia lisäämään ymmärrystään suurten mallien ominaisuuksien rajoista.

Tekoälylaki tulee voimaan koko EU:ssa 1. elokuuta

Maailman ensimmäinen Euroopan unionin antama tekoälylaki (EU AI Act) astuu voimaan koko EU:ssa 1. elokuuta. Kyseessä on myös tähän mennessä kattavin maailmassa julkaistu tekoälyä koskeva laki. EU:n tekoälylaki luo pohjan myös maailmanlaajuiselle tekoälysääntelylle, jolla pyritään saavuttamaan sama "Brysselin vaikutus" kuin yleisellä tietosuoja-asetuksella (GDPR). Uusimman lain mukaan määräyksiä rikkoville yrityksille määrätään hallinnollisia sakkoja, jotka ovat enintään 35 miljoonaa euroa tai 7 % vuotuisesta enimmäisliikevaihdosta sen mukaan, kumpi on suurempi.

Kommentti: EU on aina ollut teknologian sääntelyn eturintamassa. EU:n tekoälylaki on maailman ensimmäinen kattava tekoälyä säätelevä laki, joka osoittaa EU:n kaukonäköisyyden ja johtajuuden teknologian sääntelyn alalla. Säännöt nostavat kuitenkin myös yritysten toimintakustannuksia, Shanghai Dabang -lakitoimiston yhteistyökumppani You Yunting sanoi, että GDPR:n käyttöönoton jälkeen yritysten kustannukset, erityisesti noudattamiskustannukset, ovat nousseet merkittävästi. Tekoälylain odotetaan olevan sama, mikä tarkoittaa, että yritysten on panostettava uusiin säännöksiin ja palkattava erikoishenkilöstöä noudattamaan käytäntöjä. Lisäksi kustannuksia lisäävät rikkomusilmoitusten käsittely, julkistamisjärjestelmät jne.

Seitsemän suuren mallin pisteet "College Entrance Examination" -kokeeseen osallistumisen jälkeen julkaistaan: vain kaksi tiedeainetta voidaan suorittaa

Aiemmin kesäkuussa Shanghai Artificial Intelligence Laboratoryn alainen Sinan-arviointijärjestelmä OpenCompass julkaisi tekoälyn korkeakoulun pääsykokeen ensimmäiset täysimittaiset arviointitulokset, jotka osoittivat, että tekoälyehdokkaat voivat saada enintään 303 pistettä kielen lisäksi kolmesta aiheesta. ja matematiikassa, ja epäonnistui kaikessa matematiikassa. OpenCompass julkaisi 17. heinäkuuta arvioinnin, joka laajensi oppiaineiden valikoimaa. Tiimi testasi seitsemää suurta tekoälymallia kaikissa yhdeksässä korkeakoulun pääsykokeessa, jotta niitä voidaan verrata korkeakoulun pääsykokeen tuloksiin.

Jos tekoäly suorittaa korkeakoulun pääsykokeet, mihin yliopistoon se voidaan hyväksyä? OpenCompass-testissä todettiin, että jos suuri malli suorittaa taiteiden kokeen, parhaat pisteet voidaan "hyväksyä" yhteen kirjaan, mutta jos se suorittaa luonnontieteiden kokeen, se voidaan "hyväksyä" enintään kahteen kirjaan (perustuu Henanin maakunnan pisteviiva, jolla on eniten korkeakoulujen pääsykokeita tänä vuonna) viitteeksi).

Kommentti: Arvosteluopettajien arvioinnin perusteella nykyisellä suurella mallilla on ihmisehdokkaisiin verrattuna edelleen suuria rajoituksia. Arvosanan suorittamisen jälkeen opettajat olivat yhtä mieltä siitä, että vaikka iso malli onnistui hyvin perustiedon hallitsemisessa, se oli silti epätyydyttävä loogisen päättelyn ja tiedon joustavan soveltamisen kannalta. Erityisesti, kun vastataan subjektiivisiin kysymyksiin, suuret mallit eivät usein ymmärrä täysin kysymysrunkoa eivätkä ymmärrä pronominien suuntaa, mikä johtaa vääriin kysymyksiin Vastattaessa matemaattisiin kysymyksiin, ongelmanratkaisuprosessi on mekaaninen ja huonosti looginen. Tilalogiikassa esiintyy usein ristiriitaisia päätelmiä.

Li Feifei hautoo "yksisarvisia", World Labsin arvostus ylittää 1 miljardin dollarin

Heinäkuun 17. päivänä ilmoitettiin, että kuuluisan kiinalaisen tietotekniikan tutkijan Li Feifein perustaman World Labsin, "tilaälyn" startup-yrityksen arvo on ylittänyt miljardin dollarin. Startup käyttää pääasiassa ihmisen kaltaista visuaalista tietojenkäsittelytekniikkaa varustaakseen tekoälyn edistyneillä päättelykyvyillä.

Perustamisestaan tämän vuoden huhtikuussa lähtien World Labs on toteuttanut kaksi rahoituskierrosta, ja sijoittajina ovat olleet huipputeknologiasijoittaja Andreessen Horowitz ja tekoälyrahasto Radical Ventures. On selvää, että yhtiön viimeisin rahoituskierros voi nousta noin 100 miljoonaan dollariin. Li Feifei, Andreessen Horowitz ja Radical Ventures eivät vastanneet kommenttipyyntöihin.

Kommentti: Legendaarisena hahmona Li Feifein yrittäjyystrendit ovat herättäneet paljon huomiota myös alalla. Li Feifeista tuli vakituinen professori Stanfordin tietojenkäsittelytieteen laitoksella 33-vuotiaana, National Academy of Engineeringin akateemikko 44-vuotiaana, ja hän on tällä hetkellä Stanfordin ihmiskeskeisen tekoälyinstituutin (HAI) johtaja. ). Hän ohjasi myös ImageNetiä, joka on tietokonenäön vertailusaavutus. Hänellä on monia opetuslapsia, kuten Andrej Karpathy, joka on työskennellyt OpenAI:ssa ja Teslassa, ja Jim Fan, joka työskentelee tällä hetkellä Nvidiassa jne. He ovat myös vaikuttavia hahmoja tekoälyn alalla.

AI-siru- ja pilvivalmistajajättit "sappaavat" maailmanlaajuisia tekoälyyrityksiä

Yrityspalveluiden tietokantayhtiön Crunchbasen tilastojen mukaan maailmanlaajuisten tekoälyyritysten rahoitus kasvoi tämän vuoden ensimmäisellä puoliskolla 24 % vuodentakaisesta 35,6 miljardiin dollariin. Toinen vuosineljännes on ollut eniten Tekoälyinvestoinnit viime vuosina. China Business Newsin julkisten tilastojen mukaan Nvidia on investoinut tai ostanut peräti 16 tekoälyyn liittyvää yritystä tänä vuonna, ja suurin osa rahoituskierroksista oli yhteensä yli 100 miljoonaa Yhdysvaltain dollaria. Sen jälkeen kun Microsoft investoi OpenAI:han, se osallistui myös useisiin rahoituskierroksiin yhteensä yli 100 miljoonan Yhdysvaltain dollarin arvosta tänä vuonna. Google on ottanut laajasti käyttöön tekoälyekosysteemiä useiden sijoitusalustojensa kautta ja osallistunut peräti 31 rahoituskierrokseen. Tällä AI-sijoitusbuumin kierroksella aktiivisia lukuja ovat muun muassa AMD, Amazon, SoftBank jne.

Kommentti: Tekoälyn suosio heijastuu intuitiivisesti investointeihin. Suurten jättiläisten sijoitustyylit ja mieltymykset eivät ole täysin samoja. On syytä pohtia, että ovatko ne valmistajia, joiden pääliiketoiminta on puolijohdelaitteistot, kuten Nvidia ja AMD, tai pilvivalmistajia, kuten Microsoft, Google ja Amazon, he kaikki. Toivon investoivansa joihinkin suuriin yrityksiin Mallitoimittajat ja pilvitoimittajat ovat halukkaampia sitomaan vahvasti suuria malliyrityksiä. Alan tämän vuoden suurimpia rahoituskierroksia tarkkailemalla voimme huomata, että suuret perusmallit, autonominen ajo, tekoälydata ja humanoidirobotit ovat suurimmat kohdat.

Iso-Britannia käynnistää kilpailunrajoitustutkimuksen Microsoftin Inflection AI -sopimuksesta

Britannian kilpailuviranomainen, Competition and Markets Authority (CMA), ilmoitti äskettäin aloittaneensa virallisen kilpailunrajoitustutkimuksen Microsoft-Inflection AI -transaktiosta. Tämän vuoden maaliskuussa Microsoft suostui maksamaan 650 miljoonaa dollaria tekoälyn startup-yritykselle Inflection AI lisensoidakseen tekoälyohjelmistonsa. Lisäksi Microsoft ilmoitti palkkaavansa Inflection AI:n perustajat Mustafa Suleymanin ja Karén Simonyanin sekä suurimman osan yrityksen työntekijöistä.

Kommentti: Inflection AI:n arvo on noin 4 miljardia dollaria. Alan sisäpiiriläiset sanovat, että Microsoftin toiminta vastaa Inflection AI:n liittämistä alhaiseen hintaan. Toisin kuin yritysosto, Inflection AI säilyttää edelleen oman teknologiansa. Ison-Britannian lisäksi viime kuussa raportoitiin, että myös Yhdysvaltain liittovaltion kauppakomissio (FTC) tarkasteli sopimusta. Raporttien mukaan FTC on lähettänyt Microsoftille ja Inflection AI:lle haasteita, joissa vaaditaan asiaankuuluvia asiakirjoja kahden viime vuoden ajalta.

Humanoidirobottiyritys Zhuji Dynamics saa päätökseen A-sarjan rahoituksen

15. heinäkuuta China Business News sai tietää, että yleinen humanoidirobottiyritys Zhuji Dynamics sai päätökseen A-sarjan rahoituksen, jota johtivat China Merchants Venture Capital, SAIC Groupin pääomasijoitusalusta Shangqi Capital ja vanhat osakkeenomistajat Fengrui Capital, Oasis Capital ja Mingshi Capital. investointi, eikä rahoituksen määrää ole julkistettu. Aiemmin Alibaba sijoitti myös Zhuji Dynamicsiin. Zhuji Dynamics perustettiin vuonna 2022. Perustaja Zhang Wei on vakinainen professori Southern University of Science and Technologyssa Zhuji Dynamicsin tuotteita ovat täysikokoiset humanoidirobotit, nelijalkaiset robotit, kaksijalkaiset robotit ja niihin liittyvät ratkaisut.

Kommentti: Monet humanoidirobottiyritykset ovat edelleen rahoitusprosessissa. Humanoidirobottiradalla on tänä vuonna ollut jatkuvaa rahoitustapahtumia. Tämän vuoden tammikuussa Xingdong Era ilmoitti saaneensa päätökseen yli 100 miljoonan yuanin enkelikierroksen rahoituksen. Myöhemmin Yushu Technology ilmoitti saaneensa päätökseen miljardin yuanin B2-kierroksen rahoituksen, Kepler Exploration Robot sai päätökseen enkelikierroksen rahoituksen ja Galaxy Universal Robots enkelikierroksen. pyöreä rahoitus 700 miljoonaa yuania. Internet-jättiläiset Tencent, Baidu ja Alibaba ovat investoineet vastaavasti UBTECHiin, Zhiyuan Robotiin ja Zhuji Dynamicsiin, kun taas Meituan on sijoittanut Galaxy Universal Robotsiin ja Yushu Robotiin. Kun humanoidirobottiyritykset ovat keränneet varoja, seuraava askel on massatuotannon toteuttaminen.

NVIDIA ja Mistral AI julkaisevat suuren Mistral-NeMo-mallin

Heinäkuun 19. päivänä julkaistujen uutisten mukaan NVIDIA ja ranskalainen startup Mistral AI julkaisivat Mistral-NeMo AI:n suuren kielimallin, jossa on 12 miljardia parametria ja kontekstiikkuna (maksimi määrä tokeneita, joita AI-malli voi käsitellä kerralla) 128 000 tokenista. Mistral-NeMo AI-suuri malli on suunnattu pääasiassa yritysympäristöihin ja toteuttaa tekoälyratkaisuja ilman suuria pilviresursseja.

Kommentti: Mistral AI on saanut tänä vuonna päätökseen 600 miljoonan euron rahoituksen ja sijoittajalistalla ovat Nvidia ja Samsung. Microsoft on myös aiemmin ilmoittanut 15 miljoonan euron sijoituksesta Mistral AI:hen, joka muunnetaan omaksi pääomaksi Mistral AI:n seuraavassa rahoituskierroksessa. Mistral AI on tehnyt yhteistyötä Nvidian kanssa suurten mallien lanseeraamiseksi, ja yritys myös tasapainoilee ja etsii yhteistyötä suurten jättiläisten kesken. Nvidia osallistuu entistä enemmän tekoälyn ekosysteemiin. Se on aiemmin kehittänyt avoimen lähdekoodin Nemotron-4 340B -sarjan mallin, jota kehittäjät voivat käyttää synteettisten tietojen luomiseen suurten kielimallien harjoittamiseen.

uutiset

AI Weekly Report |. Suuri malli ei voi määrittää, kumpi on suurempi, 9.11 vai 9.9, OpenAI julkaisee kevyen GPT-4o minin

Johdanto

yhteystietoni