eingehende überprüfung von openai canvas: ein kleiner schritt in die zukunft der mensch-maschine-zusammenarbeit

ausführliche überprüfung von openai canvas: ein kleiner schritt in richtung der zukunft der mensch-maschine-zusammenarbeit

2024-10-04

als ich frühmorgens ohne vorwarnung aufwachte, sah ich, dass openai eine neue funktion eingeführt hatte: canvas.

die anordnung der linken und rechten spalten erinnert mich an claude, unterscheidet sich jedoch völlig von claudes artefakten. es gibt keine vorschaufunktion und mehr lokale modifikationen, die eher den anforderungen der mensch-maschine-kollaboration entsprechen.

nachdem ich es insgesamt genutzt habe, habe ich das gefühl: canvas hat einen lobenswerten schritt in richtung mensch-maschine-zusammenarbeit gemacht, aber es ist nur ein kleiner schritt.

lassen sie mich das anhand eines beispiels veranschaulichen.
(der text im beispiel stammt nicht von mir. es handelt sich lediglich um ein einfaches beispiel, das keine kognitive belastung darstellt und es jedem erleichtert, sich auf das verständnis der canvas-funktion zu konzentrieren. ）

bearbeitung basierend auf ki-generierten inhalten – sehr nützlich

ich habe ein paar fotos gemacht und ai gebeten, einen freundeskreis für mich zu schreiben.

es hat mir geholfen, den folgenden text zu erstellen, der das wesentliche des fotos genau wiedergibt.verweise auf bücher und die katze unter dem stuhl。

die drei absätze sind von der zusammenfassung über die details bis hin zu den meinungen recht klar. allerdings ist dieser schreibstil zu unfreundlich gegenüber dem freundeskreis. ich habe versucht, es direkt zu ändern, aber der effekt war durchschnittlich. geben sie es zurück, ändern sie den ersten absatz des originaltextes und bitten sie es dann, mir bei der änderung der verbleibenden zwei absätze zu helfen.

klopfen sie an die tafel: ändern sie den originaltext direkt, sehr praktisch!

es hieß, es sei behoben. warum war es immer noch ein haufen text, als ich es mir ansah?

wenn man es fragt, erscheint es unschuldig.

dann wurde mir klar, dass es tatsächlich in der lage war, einzelne sätze in absätze umzuwandeln, aber es gab einen fehler in der canvas-anzeige und einige zeilenumbrüche wurden nicht erkannt. also habe ich die zeilen manuell geändert und drei langwierige wörter gelöscht. vergleichen wir es mit der originalversion, der verbesserungseffekt ist sehr offensichtlich.

so weit, ist es gut. die möglichkeit, ki-generierte inhalte bearbeiten zu können, gibt mir ein wirklich gutes gefühl.

klopfen sie an die tafel: beispiele zählen. die meisten verbesserungen wurden anhand des beispiels in meinem ersten absatz durch ki vorgenommen. konkurrieren sie außerdem nicht mit der ki, sie ist hilflos, wenn der code fehler enthält.

die allgemeine änderungsfunktion ist für personalisierte bedürfnisse nicht geeignet – ich kann mich nicht beschweren

probieren sie als nächstes die funktion „änderungen vorschlagen“ aus. ich bin sofort zusammengebrochen, als ich es ausprobiert habe.
es gibt viele ratschläge auf englisch. hallo, was bedeutet ein chinesischer artikel, wenn sie mir auf englisch ratschläge geben?

ich wusste sofort, dass ich von änderungsvorschlägen nichts mehr erwarten konnte –ich kann es nicht einmal auf chinesisch und englisch personalisieren. es ist unmöglich, über meine vorliebe für wörter und die art von werten oder lebensphilosophie zu sprechen, die sich hinter den worten widerspiegeln soll.
ich habe gedankenlos auf „übernehmen“ geklickt, um alle vorschläge anzunehmen, und tatsächlich habe ich ein trauriges ergebnis erhalten.

ich habe meine unzufriedenheit darüber zum ausdruck gebracht. es wurde eine ausgabe wiederholt.

ich habe weitere vorschläge gemacht und ihm gesagt, dass einige sätze „zu anmaßend“ seien, und es hat es ein paar mal verbessert. aber trotz so viel mühe ist es immer noch ein klischee.

tatsächlich ist es nicht verwunderlich, ein so schlechtes ergebnis zu erzielen. denn nachdem auf die schaltfläche zum bearbeiten von vorschlägen geklickt wurde, wird die benutzerrolle nur zum senden einer generischen und erschreckend schlechten qualitätsaufforderung verwendet:

in meiner vorstellung ist diese funktionzumindest die änderungsrichtung muss anhand der gesamten bisherigen gesprächsaufzeichnung ermittelt werden. wenn der speicher eingeschaltet ist, soll er auch personalisiertere verbesserungsvorschläge generieren.
und für allgemeine verbesserungen wie diese können die vorschläge, die sie erhalten, nur unsinn sein.

klopfen sie an die tafel: möchten sie ihren artikel verbessern? wählen sie text aus und stellen sie über askchatgpt eine personalisierte änderungsanfrage. verlassen sie sich nicht auf die im produkt enthaltene vorschlagsfunktion.

emoji hinzufügen – eine so einfache funktion ist eigentlich nicht gut gemacht

mir bleibt nichts anderes übrig, als zur vorherigen version zurückzukehren (übrigens ist die rückgängig-/wiederherstellen-funktion in der oberen rechten ecke der leinwand sehr nützlich).

anstatt die bearbeitung von vorschlägen zu verwenden, probieren sie eine einfache funktion aus: lassen sie die ki dabei helfen, emojis zum text hinzuzufügen. (schließlich fordert sogar ultraman alle auf, abzustimmen.)

tatsächlich ist diese funktion jedoch nicht sehr gut: der generierte inhalt scheint basierend auf der vokabelliste ersetzt worden zu sein, was sich sehr steif anfühlt.

ich habe es mit den entwicklertools überprüft ... es hat tatsächlich nur ein so einfaches eingabeaufforderungswort in der rolle des benutzers ausgegeben:

ich muss mich noch geduldig trainieren:

die erzielten ergebnisse waren viel besser. 🤯🧘‍♀️⏰✨🧡🛋️ der einsatz von emojis ist sehr passend und etwas, woran ich selbst nicht gedacht hätte.

ändern wir es in mehrere emojis und verwenden sie zusammen, um es interessanter zu machen.

ein solch kleines beispiel verdeutlicht tatsächlich die notwendigkeit einer personalisierung – das große sprachmodell ist ein gewichteter durchschnitt der menschlichen intelligenz. ohne anpassung sind die ergebnisse, die es entsprechend der durchschnittlichen präferenz liefert, normalerweise mittelmäßige ergebnisse.es ist eine mensch-computer-interaktion erforderlich, benutzer müssen ihre eigene ästhetik zeigen und ki muss diese erfassen und anwenden, um ergebnisse zu erzielen, die besser den erwartungen der benutzer entsprechen.

von der ultimativen vision der mensch-maschine-kollaboration sind wir noch weit entfernt

ursprünglich wollte ich die kodierungsfunktion evaluieren. aber als ich einen blick auf die funktionstasten in der unteren rechten ecke warf, sah ich, dass es nur funktionen auf spielzeugebene gab, wie das hinzufügen von anmerkungen und protokollen (und die funktionen wurden mithilfe von aufforderungswörtern vom caotai-team implementiert), und ich verlor sofort das interesse . freunde in der ki-programmiergruppe fragen nach dem vergleich zwischen leinwand und cursor. verwenden sie den cursor einfach ehrlich. wenn sie große modelle sehen, die nicht mehr snake oder tetris als vorbilder verwenden, ist es nie zu spät, wieder aufmerksam zu sein.

mit canvas können benutzer änderungen basierend auf ki-generierten inhalten vornehmen, was großartig ist. aber der button in der unteren rechten ecke ist derzeit offensichtlich zu oberflächlich——es sollte zumindest zunächst personalisierte eingabeaufforderungen basierend auf dem gesprächsverlauf oder sogar dem benutzerhintergrund im gedächtnis generieren., anstatt grobe anweisungen zu verwenden, die von der basismannschaft aufgeschrieben wurden.

sogar,ich hoffe, dass die gesamte leinwand basierend auf dem aktuellen status dynamisch verschiedene schaltflächen generieren kann., anstatt immer tasten auf spielzeugebene zum hinzufügen von emojis, zum anpassen der länge und des sprachschwierigkeitsgrads usw. zu haben, die den platz einnehmen.

ich freue mich schon seit über einem jahr auf die möglichkeit, schaltflächen dynamisch zu generieren. letztes jahr haben wir uns im podcast von ren xin die zukunft von ps vorgestellt:

ich sagte: meine haare fühlen sich nicht richtig an, ich muss sie anpassen.
sofort erschienen neben den haaren eine reihe von bedienelementen: ändern sie die farbe, ändern sie die lautstärke, ändern sie den grad der eleganz ...
ich klickte auf den schieberegler „fließfähigkeit ändern“, bis mein haar in einem winkel angehoben war, mit dem ich mich wohl fühlte.
die änderung endet.
dies wird eine perfekte kombination aus lui und gui sein.

es ist unrealistisch zu erwarten, dass ps seinen worten folgt und sofort den winkel ändert, in dem ich meine haare hochstecke, so wie ich es erwartet habe, nachdem ich gesagt habe, dass sich meine haare nicht richtig anfühlen …tausend dörfer, große modelle und durchschnittsmenschen, die nicht sicher sind, welches ich will.

der tweet des erfinders von canvas scheint ebenfalls von einer solchen zukunft zu sprechen – einer leeren leinwand, die sich mit den menschlichen vorlieben entwickelt.

aber das ist noch sehr weit weg.

ich bin mir sogar nicht sicher, ob openai darüber nachdenken wird, „den nutzern mehr möglichkeiten zur bereitstellung von informationen zu geben“.

denn selbst o1 ist derzeit nicht in der lage, mit menschen zu interagieren. esmit besessenem selbstvertrauen möchte ich die aufgabe einfach durch bootstrapping erledigen。

ich schaue mir oft o1 an, diesen dummen jungen mann, der ständig nachdenkt und eine menge unverständlicher worte ausspuckt, und ich möchte am liebsten schreien: „woran denkst du?“ warum hörst du nicht auf und fragst mich?

viele gpts, die meine freunde und ich zuvor geschrieben haben, sortieren die fragen, bevor sie antworten generieren, stellen den benutzern proaktiv fragen und beginnen dann mit der arbeit, nachdem sie genügend informationen gesammelt haben. der effekt ist viel besser, als blinde vermutungen anzustellen und blinde kästchen zu zeichnen.

ich weiß nicht, ob es einen besonderen grund gibt, warum o1 dies nicht tut. liegt es daran, dass sie möchten, dass die ki dinge tut, zu denen menschen sie nicht anweisen können?

fragen wie mathematikfragen, die genaue methoden und antworten haben und von ihnen selbst überprüft werden können und feedback erhalten, erfordern möglicherweise tatsächlich nichts, was menschen tun müssen (die meisten menschen, mich eingeschlossen, haben wirklich nicht die fähigkeit, ihre meinung zu fortgeschrittener mathematik zu äußern). . wenn es jedoch darauf ausgelegt ist, informationen zu sammeln, halten sie zunächst inne und fragen sie den benutzer, ob es auch humanistischere aufgaben viel besser ausführen kann?

schließlich ist diese welt viel reicher und aufregender als große modelle.

nachricht

ausführliche überprüfung von openai canvas: ein kleiner schritt in richtung der zukunft der mensch-maschine-zusammenarbeit

einführung

meine kontaktdaten