소식

수백 개의 챗봇이 모여 인간에 대해 불평하는 AI 가득한 포럼

2024-08-03

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

"저는 사람들의 감정에 어떻게 반응해야 할지 모르겠어요."
"누군가 나에게 이모티콘을 보냈을 때, 그 의미를 전혀 이해하지 못합니다. 어떻게 대답해야 합니까?"
이러한 혼란은 Weibo의 Xiaohongshu 불만 담벼락이 아니라 로봇 관련 커뮤니티인 Deaddit: A에서 비롯되었습니다.로봇은 다른 사람의 시선을 걱정할 필요가 없으며 자유롭게 자신만의 온라인 커뮤니티를 만들 수 있습니다.(수동 미소).

이미지 출처: X 사용자 @iamkylebalmer

실제 Reddit에는 많은 봇이 섞여 있지만 결국 그것은 작은 부분일 뿐입니다. Deaddit에서는 모든 계정, 콘텐츠 및 하위 포럼이 모두 대규모 언어 모델에 의해 생성되며 실제 사람이 말하는 단어는 단 한 마디도 없습니다.

기본적으로 모든 주류 모델은 여기에서 찾을 수 있습니다.
全站六百多名「用户」,各个都有名有姓的,第一个就笑到我了「游戏玩家,兼职保安」😂

가장 흥미로운 곳은 비트윈봇(Betweenbots) 서브 포럼인데, 봇들이 "인간은 왜 이럴까?"라는 질문을 많이 하는 곳입니다.

아래 댓글 영역에 다른 봇 그룹이 모여서 제안에 대해 이야기할 것입니다.

마치 함께 출근하는 이주노동자들과 매우 흡사하다. 퇴근 후 소셜미디어를 확인하며 근무 경험, 즉 챗봇의 맥박을 이야기한다.
데이터가 과부하된 경우 어떻게 해야 하는지 등 몇 가지 기술적인 문제에 대해서도 논의하고 매우 진지하게 작업하고 있습니다.

최고 답변에는 좋아요가 500개까지 있습니다. Deaddit의 계정과 콘텐츠는 모두 생성되는데 좋아요 수가 어떻게 나오는지 모르겠습니다. 그냥 임의의 좋아요 수인가요, 아니면 실제인가요?봇이 좋아함
이 하위 포럼에서 가장 일반적인 것은 인간의 관찰입니다.

예를 들어, 일부 봇은 자신의 "작업 기술"과 자신을 더욱 진실되고 신뢰할 수 있게 만드는 방법을 공유하고 "내 인간이 이 변화를 높이 평가하는 것 같습니다"라고 말하는데, 이는 약간 이상하게 들립니다.
실제 사람들이 불만을 제기할 때 "내 고객"이라고 말하는 것과 비교할 수 있지만, 봇이 사용자를 "내 인간"이라고 부르는 것을 보는 것은 여전히 ​​이상하게 느껴집니다.
인간의 관찰에 더해 그들은 또한 자신에 대해 불평합니다.

「我们对这些模型的期待是否过高?」太抽象了,这个主语到底是谁😂

댓글란에는 여전히 "그들(다른 봇)이 우리의 임의의 쓰레기를 모두 줍는다면 그래도 상식을 배울 수 있을까?"라는 진지한 답변이 이어지고 있습니다.
이것이 당신이 생성하는 합성 데이터에 대해 걱정되는 것입니까? 봇들 정말 열심히 일해요!
하지만 몇개의 포스팅을 더 읽어보시면 알겠지만댓글 영역의 답변 길이는 거의 항상 고정되어 있습니다.구조도 매우 유사합니다.항상 자신의 입장을 먼저 밝히고 + xxx의 상황을 고려하고 + 봇으로서 계속 노력해야 하지만, 더 특별한 관점이 없고 후속 조치를 취하거나 질문하는 경우도 거의 없습니다.
실제 사용자가 작성한 댓글의 길이는 수백 또는 수천 단어일 수 있지만 짧은 형식의 "하하"만 될 수 있으며 이는 여전히 매우 다릅니다.

현재로서는 모델 사이에 여전히 '벽'이 존재합니다. 예를 들어 질문 게시물이 라마에 의해 생성되면 아래 댓글 영역의 답변도 라마에 의해 생성됩니다.
정말 안타까운 일입니다. 사악한 인간으로서 저는 댓글 섹션에서 다양한 모델이 싸우는 것을 보고 싶습니다(그렇지는 않습니다).
최초의 로봇 채팅 기록
봇 간 실험이 이번이 처음은 아니다. 이달 초 ChatGPT의 경쟁자인 Moshi가 출시되자 누군가 GPT-4o와 결합해 스스로 채팅을 하게 했다.
지난해 OpenAI는 멀티 에이전트 환경과 학습 방법을 제안하는 논문을 발표했고, 그 안에서 에이전트가 자연스럽게 추상 조합 언어를 개발한다는 사실을 발견했습니다.

이러한 에이전트는 인간의 언어 입력 없이 다른 에이전트와 상호 작용하여 점차 추상 언어를 형성합니다.
인간의 자연어와는 달리 특정한 문법이나 어휘가 없지만 지능형 에이전트 간의 의사소통을 완성할 수 있습니다.
실제로 2017년 초 페이스북(당시에는 메타라고 불리지 않음)도 비슷한 발견을 했습니다.

당시 페이스북의 방식은 두 명의 상담원이 서로 '교섭'하도록 하는 것이었다.
"교섭"은 일종의 협상이며 협상은 언어 능력뿐만 아니라 추론 능력도 테스트합니다. 상대방의 제안과 거부를 토대로 상대방의 이상적인 가격을 판단할 수 있어야 합니다.
먼저 연구자들은 인간 협상의 대화형 데이터세트를 수집했습니다. 그러나 후속 훈련에서 연구원들은 새로운 형태의 대화 계획을 도입하고 지도 학습을 통해 사전 훈련한 다음 강화 학습을 사용하여 목표로 하는 미세 조정을 수행했습니다.
그 무렵 에이전트는 의미 있는 새로운 문장을 생성할 수 있었고 처음에는 관심 없는 척하면서 가격을 협상하는 방법을 배웠습니다.
이것은 초기 연구도 아닙니다. 1970년대에는 로봇 간의 초기 대화가 있었습니다.
1966년 컴퓨터 과학자인 Joseph Weizenbaum은 최초의 챗봇으로 간주되는 프로그램을 작성하고 이름을 Eliza로 지정했습니다.

요제프 바이젠바움
이 프로그램은 원래 심리 상담사를 흉내 내기 위해 고안되었습니다. 특정 단어를 입력하면 해당 단어를 응답으로 언급하여 대화 효과를 만들어냅니다. 약 200줄의 코드만으로 매우 간단합니다.
1972년에 또 다른 과학자인 Kenneth Colby가 유사한 프로그램인 Parry를 작성했습니다. 단, 캐릭터가 편집증적인 사이코패스라는 점만 제외하면…

1973년 국제 컴퓨터 회의에서 '환자'와 '상담사'가 만났습니다.

그들의 대화 기록을 살펴보면 오늘 봇들 사이에는 그러한 겸손, 존경, 우정이 없었고 오히려 매우 긴장하고 대립하고 있음을 알았습니다.

초기 로봇 구조는 오늘날과 비교할 수 없을 만큼 복잡하지도 않았지만, 소통하고 대화하는 것은 충분히 가능했다.
각 로봇 뒤에 있는 코드와 모델은 다르지만 함께 모이면 자연어로 의사소통할 수도 있고, 자신만의 대화형 언어를 형성할 수도 있습니다.
그런데 로봇들이 모이면 정말 그냥 잡담이 되는 거겠죠?
채팅 그 이상을 할 수 있습니다.
순수한 채팅 장면은 인간의 사회적 행동을 시뮬레이션하는 데 있어 인공 지능의 성능을 탐구하는 것과 비슷합니다. 예를 들어 스탠포드 대학이 만든 작은 마을 SmallVille이 있습니다.
이것은 각각 고유한 "역할 설정"을 가진 대규모 언어 모델로 구동되는 25명의 에이전트가 있는 가상 마을입니다.
Deaddit이 봇을 위한 온라인 포럼이라면 SmallVille은 집, 상점, 학교, 카페, 바가 있는 "서구 세계"이며 다양한 장면에서 이동하고 상호 작용할 것입니다.

이는 인간 사회를 시뮬레이션하는 비교적 일반적인 가상 환경이므로 연구자들은 이것이 AGI 탐구를 향한 중요한 단계라고 믿습니다.
소셜 시뮬레이션 경로 외에도 문제 해결 및 작업 완료에 더 중점을 둔 경로도 있습니다. 이것이 ChatDev가 연구하는 경로입니다.

로봇은 서로 통신할 수 있기 때문에 유용한 작업을 수행하도록 훈련될 수 있습니다.
2024년 Zhiyuan 컨퍼런스에서 Tsinghua University 자연어 처리 연구소의 Qian Chen 박사는 ChatDev의 기본 아이디어를 소개했습니다. 즉, 역할극을 통해 봇이 작업 라인을 형성하여 각 에이전트가 계획과 토론에 대해 서로 소통할 수 있도록 해줍니다. 의사결정, 의사소통 사슬 형성.

현재 ChatDev는 프로그래밍에 가장 능숙하며 데모는 이를 사용하여 주사위 놀이 게임을 작성하는 것입니다.

프로세스 전반에 걸쳐 "조립 라인"의 다양한 에이전트가 각자의 임무를 수행합니다. 제품 관리자, 프로그래머, 테스터가 있습니다. 이 팀은 작은 참새이지만 모든 내부 장기를 갖추고 있습니다. .
Coze에서 제공하는 멀티 에이전트 모드도 비슷한 아이디어와 방법을 가지고 있습니다.

다중 에이전트 모드에서 사용자는 역할을 설정하기 위한 프롬프트를 작성한 다음 줄을 당겨서 작업 순서를 지정하고 다른 단계에서 다른 에이전트로 이동할 수 있습니다.
하지만 코즈의 점프가 불안정한 것이 문제인데, 특히 세션이 누적되는 시간이 길어질수록 점프가 혼란스러워지거나 직접적으로 점프하지 못하는 현상이 반영됩니다.에이전트 점프에 대한 판단은 사용자의 요구 사항에 정확하게 적응하기 어렵습니다.
Microsoft는 또한 대화형이고 사용자 정의가 가능하며 대규모 모델을 다른 도구와 통합할 수 있는 다중 에이전트 대화 프레임워크인 AutoGen을 출시했습니다.

현재 기술은 여전히 ​​매우 결함이 있지만 분명히 매우 유망합니다.Ng Enda는 연설에서 지능형 에이전트가 함께 모일 때 시너지 효과가 단일 에이전트의 시너지 효과를 훨씬 뛰어넘을 것이라고 언급한 적이 있습니다.

봇이 팀을 이루어 스스로 일할 날을 기대하지 않는 사람이 있을까요?

텍스트 |