소식

openai canvas 심층 검토: 인간-기계 협업의 미래를 향한 작은 발걸음

2024-10-04

한어한어Русский языкРусский языкEnglishEnglishFrançaisFrançaisIndonesianSanskritIndonesian日本語SanskritDeutsch日本語PortuguêsDeutschΕλληνικάPortuguêsespañolΕλληνικάItalianoespañolSuomalainenItalianoLatinaSuomalainenLatina

아침 일찍 일어나 아무런 예고도 없이 openai가 캔버스라는 새로운 기능을 출시한 것을 보았습니다.

왼쪽과 오른쪽 기둥의 배치는 클로드를 연상시키지만 클로드의 유물과는 전혀 다릅니다. 인간-기계 협업의 요구에 더 부합하는 미리보기 기능과 더 많은 로컬 수정이 없습니다.

전체적으로 사용해보고 느낀 점은 다음과 같습니다. canvas는 인간과 기계의 협업이라는 방향으로 칭찬할 만한 발걸음을 내디뎠지만 이는 작은 발걸음에 불과합니다.

예를 들어 설명하겠습니다.
(예제에 사용된 텍스트는 제가 직접 작성한 것이 아닙니다. 인지부하가 전혀 없고 누구나 쉽게 캔버스 기능을 이해하는데 집중할 수 있도록 하는 간단한 예일 뿐입니다.

   

ai 생성 콘텐츠를 기반으로 편집 - 매우 유용함

사진을 몇 장 찍고 ai에게 친구 서클을 작성해 달라고 요청했습니다.

사진의 본질을 정확하게 포착하는 아래 텍스트를 생성하는 데 도움이 되었습니다.책과 의자 밑에 있는 고양이에 대한 언급

세 단락은 요약부터 세부 사항, 의견까지 매우 명확합니다. 그러나 이러한 글쓰기 스타일은 친구들에게 너무 비우호적입니다. 직접 바꿔보았으나 효과는 보통 수준이었습니다. 돌려주고, 원문의 첫 문단을 수정한 뒤, 나머지 두 문단을 수정하는 데 도움을 달라고 요청하세요.

칠판을 두드리세요: 원문을 직접 수정해 보세요. 매우 편리합니다!

고쳐졌다고 하더군요. 내가 봤을 때 왜 아직도 텍스트 덩어리였지?

물어보면 결백해 보입니다.

그러다가 실제로는 단일 문장을 단락으로 구성할 수 있다는 것을 깨달았지만 캔버스 표시에 버그가 있었고 일부 줄 바꿈이 인식되지 않았습니다. 그래서 수동으로 줄을 바꾸고 장황한 세 단어를 삭제했습니다. 원래 버전과 비교해 보면 개선 효과가 매우 분명합니다.

지금까지는 너무 좋았어. ai가 생성한 콘텐츠를 편집할 수 있다는 것은 정말 기분 좋은 일입니다.

칠판을 두드리세요: 예가 중요합니다. 대부분의 개선 사항은 첫 번째 단락의 예를 기반으로 ai에 의해 이루어졌습니다. 게다가 ai와 경쟁하지 마세요. 코드에 버그가 있으면 무력합니다.

   

일반 수정 기능은 개인 요구에 적합하지 않습니다. 불평할 수 없습니다.

다음으로 편집 제안 기능을 사용해 보세요. 시도하자마자 무너졌습니다.
영어로 많은 조언을 해줍니다. 안녕하세요, 영어로 조언을 해줄 때 중국어 기사는 무엇을 의미합니까?

나는 제안된 편집에서 더 이상 아무것도 기대할 수 없다는 것을 즉시 깨달았습니다.중국어와 영어로는 개인화도 할 수 없고, 내가 좋아하는 단어와 그 단어 뒤에 어떤 가치관이나 철학이 반영되기를 바라는지 이야기하는 것도 불가능하다.
모든 제안을 받아들이려고 무심코 신청을 눌렀는데, 어찌됐든 안타까운 결과가 나왔습니다.

이에 대한 불만을 표명했습니다. 한 판을 반복했습니다.

나는 추가 제안을 하고 일부 문장이 "너무 가식적이다"라고 말했고 몇 번이나 개선되었습니다. 하지만 많은 노력에도 불구하고 그것은 여전히 ​​진부한 표현입니다.

사실 이렇게 나쁜 결과가 나오는 것은 놀라운 일이 아닙니다. 제안 편집 버튼을 클릭하면 사용자 역할을 사용하여 일반적이고 놀라울 정도로 품질이 낮은 프롬프트를 보내기 때문입니다.

내 상상 속에서는 이 기능이적어도 수정 방향은 이전 대화 기록 전체를 토대로 판단해야 합니다. 메모리가 켜져 있으면 개선을 위한 보다 개인화된 제안도 생성되어야 합니다.
그리고 이와 같은 일반적인 개선에 대해 귀하가 받는 제안은 쓰레기일 수 있습니다.

칠판을 두드리세요: 기사를 개선하고 싶으십니까? 텍스트를 선택하고 askchatgpt를 통해 맞춤 수정을 요청하세요. 제품과 함께 제공되는 제안 기능에 의존하지 마십시오.

   

이모티콘 추가 - 이런 간단한 기능은 사실 잘 안되네요

이전 버전으로 돌아갈 수밖에 없습니다(그런데 캔버스 오른쪽 상단에 있는 실행 취소/다시 실행 기능이 매우 유용합니다).

제안 편집을 사용하는 대신 ai가 텍스트에 이모티콘을 추가하도록 돕는 간단한 기능을 사용해 보세요. (결국 울트라맨마저도 모두에게 투표를 요구하고 있는 셈이다.)

그런데 사실 이 기능은 별로 좋지 않습니다. 생성된 콘텐츠가 어휘 목록을 기반으로 대체된 것 같아서 매우 딱딱한 느낌이 듭니다.

개발자 도구로 확인해 보니 당연합니다...실제로는 사용자 역할에 다음과 같은 간단한 프롬프트 단어가 표시되었습니다.

나는 여전히 인내심을 가지고 훈련해야 합니다.

얻은 결과는 훨씬 더 좋았습니다. 🤯🧘‍♀️⏰✨🌺🛋️ 이모티콘 사용은 매우 적절하고 나 자신도 생각하지 못했던 것입니다.

여러개의 이모티콘으로 바꿔서 함께 사용하면 더욱 재미있을 것 같아요.

이러한 작은 예는 실제로 개인화의 필요성을 완전히 보여줍니다. 대규모 언어 모델은 인간 지능의 가중 평균이며, 평균 선호도에 따라 제공되는 결과는 일반적으로 평범한 결과입니다.인간-컴퓨터 상호작용이 필요하고, 사용자는 자신만의 미학을 보여줘야 하며, ai는 사용자 기대에 더 부합하는 결과를 얻기 위해 이를 캡처하고 적용해야 합니다.

   

우리는 인간-기계 협업이라는 궁극적인 비전과는 아직 거리가 멀습니다.

원래는 인코딩 기능을 평가하고 싶었습니다. 그런데 오른쪽 하단에 있는 기능키를 보니 주석이나 로그 추가 등 장난감 수준의 기능만 있는 것을 보고(그리고 해당 기능은 차오타이 팀의 프롬프트 단어를 사용해 구현한 것임) 바로 흥미를 잃었습니다. . ai 프로그래밍 그룹의 친구들이 캔버스와 커서의 비교를 묻는다면 커서를 정직하게 사용하십시오. 더 이상 snake나 tetris를 사용하지 않는 대형 모델을 보면 다시 관심을 가져도 늦지 않습니다.

canvas를 사용하면 사용자가 ai 생성 콘텐츠를 기반으로 수정할 수 있다는 점이 좋습니다. 하지만 오른쪽 하단에 있는 버튼은 현재로서는 확실히 너무 피상적입니다.적어도 먼저 대화 기록이나 메모리의 사용자 배경을 기반으로 개인화된 프롬프트를 생성해야 합니다., 풀뿌리 팀이 작성한 대략적인 지침을 사용하는 대신.

심지어,전체 캔버스가 현재 상태에 따라 다양한 버튼을 동적으로 생성할 수 있기를 바랍니다., 이모티콘을 추가하기 위해 항상 장난감 수준의 버튼을 사용하는 대신 공간을 차지하는 길이와 언어 난이도 등을 조정합니다.

저는 1년 넘게 버튼을 동적으로 생성하는 기능을 기대해 왔습니다. 작년에 ren xin의 팟캐스트에서 우리는 ps의 미래를 상상했습니다.

나는 이렇게 말했습니다: 내 머리 상태가 좋지 않아요. 조정이 필요해요.
머리카락 옆에 즉시 여러 컨트롤이 나타났습니다. 색상 변경, 볼륨 변경, 우아함 정도 변경...
머리카락이 편안하게 느껴질 때까지 "유동성 변경" 슬라이더를 클릭했습니다.
수정이 종료됩니다.
이것은 lui와 gui의 완벽한 조합이 될 것입니다.

ps가 머리가 안 맞는 것 같다고 말했는데, ps가 그의 말을 따라 곧바로 머리를 올리는 각도를 내가 예상했던 대로 바꿀 것이라고 기대하는 것은 비현실적이다——천 개의 작은 마을, 평균적으로 큰 모델은 내가 어느 것을 원하는지 확실하지 않습니다.

canvas 제작자의 트윗도 그러한 미래, 즉 인간의 취향에 따라 진화하는 빈 캔버스에 대해 이야기하는 것 같습니다.

하지만, 아직은 너무 멀었습니다.

심지어 openai가 "사용자에게 정보를 제공할 수 있는 기회를 더 많이 제공하는 것"을 고려할지는 잘 모르겠습니다.

왜냐하면 o1조차도 현재 사람들과 상호작용할 수 없기 때문입니다. 그것강박적인 자신감으로 부트스트래핑으로 작업을 완료하고 싶습니다.

나는 종종 o1, 이 멍청한 청년이 여기저기 생각하고 이해할 수 없는 말들을 잔뜩 뱉어내려고 하는 것을 보고 그냥 소리치고 싶다. 무슨 생각을 하고 있는 거야? 멈춰서 나한테 물어보는 게 어때?

이전에 저와 친구들이 작성한 많은 gpt는 답변을 생성하기 전에 질문을 정리하고 사용자에게 적극적으로 질문한 다음 충분한 정보를 수집한 후 작업을 시작합니다. 그 효과는 블라인드 추측을 하고 블라인드 박스를 그리는 것보다 훨씬 낫습니다.

o1이 이렇게 하지 않는 특별한 이유가 있는지는 모르겠습니다. 인간이 지시할 수 없는 일을 ai가 해주기를 바라기 때문인가요?

정확한 방법과 답이 있고 스스로 검증하여 피드백을 얻을 수 있는 질문(예: 수학 문제)은 실제로 인간이 아무것도 할 필요가 없을 수도 있습니다. 수학). 하지만 정보를 수집하도록 설계했다면 먼저 멈추고 사용자에게 더 인간적인 작업을 훨씬 더 잘 수행할 수 있는지 물어보십시오.

결국 이 세상은 대형 모델보다 훨씬 더 풍부하고 흥미진진합니다.