uutiset

Anthropic julkaisee järjestelmäkehotteita Claude AI -mallille

2024-08-27

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

IT House News 27. elokuuta, teknologiamedia Techcrunch raportoi eilen (26. elokuuta),Anthropic on paljastanut ClaudeAI-mallin "järjestelmäkehotteet".

Järjestelmäkehote

Jotta tekoälymalli voisi ymmärtää paremmin ihmisen ohjeita, kehoteprojekti sisältää itse asiassa kaksi kerrosta ydinsisältöä, käyttäjäkehotteet ja järjestelmäkehotteet:

  • Käyttäjän kehotussanat: käyttäjän syöttämät sanat, ja sitten AI-malli luo vastaukset käyttäjän kehotteiden perusteella.

  • Järjestelmäkehotesanat: Nämä ovat järjestelmän luomia kehotteita, joita käytetään yleensä asettamaan keskustelun konteksti, antamaan ohjeita tai sanelemaan sääntöjä.

Huomautus IT Homesta: Normaalisti järjestelmäkehotteiden avulla malli ymmärtää sen perusominaisuudet sekä mitä sen pitäisi tehdä ja mitä ei.

Alan yleinen käytäntö

Jokainen luova tekoälytoimittaja OpenAI:sta Anthropiciin käyttää järjestelmäkehotteita estääkseen (tai ainakin yrittääkseen estää) malleja toimimasta väärin ja ohjatakseen mallin vastausten yleistä sävyä ja tunnetta.

Esimerkiksi järjestelmäkehote voi kertoa mallille, että sen tulee olla kohtelias, mutta ei koskaan anteeksipyytävä, tai myöntää rehellisesti, ettei se voi tietää kaikkea.

Valmistajat voivat kuitenkin pitää nämä järjestelmäkehotteet salassa esimerkiksi kilpailun vuoksi ja estääkseen huonoja käyttäjiä ohittamasta suojausta saatuaan nämä tiedot.

Anthropic päättää paljastaa järjestelmän kehotussanat

Anthropic on kuitenkin työskennellyt kovasti esittääkseen itsensä eettisemmäksi ja läpinäkyvämmäksi tekoälytoimittajaksi, ja se on julkistanut järjestelmän uusimpiin malleihinsa (Claude 3.5 Opus, Sonnet ja Haiku) Claude iOS- ja Android-sovelluksissa sekä verkkovihjeissä. .

Alex Albert, Anthropicin kehittäjäsuhteiden päällikkö, sanoi X-julkaisussa, että Anthropic aikoo julkaista nämä tiedot säännöllisesti, kun se päivittää ja hienosäätää järjestelmän kehotteita.