2024-10-02
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
autor dieses artikels: li dan
quelle: harte ki
microsoft hat an diesem dienstag einen großen schritt gemacht und mit seinem persönlichen assistenten für künstliche intelligenz (ki), copilot, ein großes upgrade eingeleitet. microsoft hat mit der einführung einer reihe neuer copilot-funktionen für alle windows-benutzer begonnen, darunter neue tools, die computerbildschirme verstehen und darauf reagieren können probleme. gleichzeitig hat microsofts online-suchmaschine bing offiziell die von der ki generierte zusammenfassungsfunktion eingeführt, die eine direkte herausforderung für googles ähnliche generative ki-suchfunktion ai overviews darstellt.
ab dienstag, dem 1. oktober, eastern time, hat microsoft eine neue version der copilot-app für apple ios, google android, windows und das web herausgebracht und erklärt, dass die stile all dieser apps „einzigartiger“ und „herzerwärmender“ seien. microsoft hat auch chatbots in metas social-media-whatsapp eingeführt, die es benutzern ermöglichen, mit copilot über direktnachrichten (dm) zu chatten, ähnlich wie bei der verwendung anderer bots auf der messaging-plattform von meta.
copilot vision ist die herausragendste funktion von copilot. es kann die inhalte anzeigen, die benutzer auf ihren pcs anzeigen. insbesondere können damit die websites angezeigt werden, die benutzer mit microsoft edge, dem microsoft ai-browser, besuchen.
copilot vision ist eine neue experimentelle optionale funktion, die exklusiv für copilot pro verfügbar ist. benutzer können text und bilder auf webseiten analysieren lassen und benutzerfragen zum inhalt dieser webseiten beantworten. benutzer können beispielsweise fragen, wie das auf dem bild gezeigte essen zubereitet werden soll, und copilot kann rezepte bereitstellen.
benutzer können es aufrufen, indem sie „@copilot“ in die adressleiste von edge eingeben, ähnlich der suchtechnologie, die google in den browsern android und chrome bereitstellt. laut microsoft ist copilot vision jedoch leistungsfähiger und datenschutzorientierter als frühere bildschirmanalysen.
laut microsoft kann copilot vision benutzer beraten, welche schritte als nächstes zu unternehmen sind, ihre fragen beantworten, benutzer zu den von ihnen gewünschten aufgaben führen und ihnen bei der erledigung von aufgaben behilflich sein, indem sie einfach in natürlicher sprache mit ihnen sprechen. beispielsweise möchte der benutzer eine neue wohnung dekorieren. copilot vision kann bei der suche nach möbeln helfen, die richtige farbpalette finden, alles von teppichen bis überwürfen in betracht ziehen und sogar vorschlagen, wie die artikel, die der benutzer betrachtet, angeordnet werden sollen.
im hinblick auf den datenschutz betonte microsoft, dass benutzer gesprächsdaten sofort nach dem gespräch mit copilot vision löschen können. audio, bilder oder text, die von dieser funktion verarbeitet werden, werden nicht gespeichert oder zum trainieren des modells verwendet, zumindest nicht in dieser vorschauversion. darüber hinaus ist copilot vision auch hinsichtlich der arten von websites, die es analysieren kann, begrenzt und kann nur vorab genehmigte „populäre“ websites analysieren und interpretieren. derzeit blockiert microsoft die verarbeitung kostenpflichtiger inhalte und „sensibler“ inhalte auf websites hinter paywalls durch diese funktion, hat jedoch nicht offengelegt, was als vertrauliche inhalte gilt.
copilot vision ist derzeit nur in den usa verfügbar. microsoft sagte, die funktion werde die „maschinenlesbaren kontrollen der ki“ der website respektieren, beispielsweise regeln, die es bots verbieten, daten für ki-training zu sammeln. das unternehmen hat jedoch nicht klargestellt, welche kontrollen vision derzeit einhalten wird. wir haben microsoft um klarstellung gebeten.
microsoft hat am dienstag eine nachrichtenfunktion namens copilot daily gestartet, die benutzern sprachzusammenfassungen über das wetter und aktuelle ereignisse bietet. um die funktion zu unterstützen, bezahlt microsoft verlage für den kauf von inhalten, die in copilot daily erscheinen.
alexa und google assistant, die sprachassistenten von amazon und google, haben bereits für ähnliche tägliche briefings gesorgt. laut microsoft kann copilot daily „das vertraute gefühl der informationsüberflutung entschärfen“ und ist „einfach, unkompliziert und leicht zu verstehen. es bezieht nur inhalte aus autorisierten inhaltsquellen“ und bietet im laufe der zeit erinnerungen und anpassungsoptionen.
microsoft führt die copilot daily-funktion derzeit nur in den usa und im vereinigten königreich ein. reuters, axel springer, hearst magazines, usa today network und die financial times haben mit microsoft zusammengearbeitet, um quellen für diese funktion bereitzustellen. microsoft sagte, es plane, „bald“ kostenpflichtige verlage hinzuzufügen und copilot daily auf weitere länder auszudehnen.
wie vision soll auch copilots neue funktion think deeper den ki-assistenten von microsoft flexibler machen.
laut microsoft ermöglicht think deeper es copilot, über komplexere fragen nachzudenken, dank „inferenzmodellen“, die mehr zeit zum nachdenken benötigen und dann schritt-für-schritt-antworten geben. microsoft gab die spezifischen inferenzmodelle nicht bekannt, gab jedoch an, dass es „das neueste modell von openai verwendet, das microsoft verfeinert hat“. nach einschätzung der medien soll es sich um die angepasste version des o1-modells von openai handeln.
ab dienstag wird think deeper für eine begrenzte anzahl von copilot labs-benutzern in australien, kanada, neuseeland, den vereinigten staaten und dem vereinigten königreich verfügbar sein.
eine neue funktion von copilot ist copilot voice, die erstmals in neuseeland, kanada, australien, dem vereinigten königreich und den vereinigten staaten eingeführt wurde. microsoft hat vier synthetische stimmen hinzugefügt, sodass benutzer auswählen können, welche stimme sie verwenden möchten, wenn sie mit copilot sprechen.
wie der von openai für chatgpt bereitgestellte advanced voice mode kann copilot voice den ton des benutzers während des gesprächs erkennen und entsprechend reagieren. benutzer können auch jederzeit unterbrechen, wenn copilot voice antwortet, genau wie beim gespräch mit menschen.
allerdings gibt es bei copilot voice zeitliche begrenzungen. laut microsoft können copilot pro-abonnenten mehr gesprächszeit für copilot voice erhalten, die konkrete zeit ist jedoch „variabel“ und hängt von der nachfrage ab.
microsoft sagt, dass copilot bald besser auf benutzerpräferenzen reagieren wird, wenn neue personalisierungseinstellungen aktiviert sind. dabei werden die vergangenen interaktionen und der verlauf des benutzers sowie interaktionen mit anderen microsoft-apps und -diensten verwendet, um möglichkeiten zur verwendung von copilot zu empfehlen. dies erleichtert benutzern den einstieg in copilot und „bietet sowohl eine praktische anleitung zu den praktischen funktionen von copilot als auch einen gesprächsstarter.“
die personalisierungsfunktion von copilot kann im copilot-einstellungsmenü in windows deaktiviert werden und wird in naher zukunft im vereinigten königreich und in eu-ländern nicht verfügbar sein.
im juli dieses jahres startete microsoft eine testversion der generativen suche von bing. am dienstag wurde der dienst offiziell für alle us-benutzer gestartet. der einfachste weg, es aufzurufen, besteht darin, auf bing nach „bing generative search“ zu suchen.
microsoft gab bekannt, dass es eine option einführt, die es benutzern erleichtert, von bing generierte suchen nach „informationsabfragen“ auszulösen.
bings generative suche wird als produkt des direkten kampfes von microsoft mit der ki-suche von google angesehen.auf der google i/o developer conference 2024 in diesem monat stellte google drei wichtige neuerungen im suchmodell vor. die erste davon ist die ki-generierte zusammenfassungsfunktion namens ai overviews, die die generierten zusammenfassungen oben in den suchergebnissen anzeigt.
microsoft glaubt, dass die generative suche von bing mehr kann, als nur antworten zu finden. microsoft sagt, dass es suchanfragen versteht, millionen von informationsquellen unter die lupe nimmt, inhalte dynamisch abgleicht und suchergebnisse mit neuen ki-generierten layouts generiert, um die absicht von benutzeranfragen effektiver zu erfüllen.