소식

1콜 비용은 1센트, 짜증나는 AI 아웃바운드 콜을 대형 모델에 적용한 가장 성공적인 사례는 무엇일까?

2024-07-31

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

기예 왕린

표지 소스 그림 곤충의 창의성



대형 모델을 가장 성공적으로 적용할 때 가장 먼저 떠오르는 것은 대화형 로봇입니다.키미, Doubao, Wen Xinyiyan 등 월간 사용자 수가 수백만 명에 달하는 이러한 스타 제품은 아직 수익성이 없으며 "9.11과 9.8 중 어느 것이 더 큽니까?"라는 질문에 대답할 준비도 되어 있지 않습니다.

 

그 뒤에는 강력한 기술 지원이 필요하지만 이를 실현하는 데는 거리가 멀습니다. 4개월 전, 맞아요.AIGC (인공지능이 생성한 콘텐츠) 미래의 발전이 충분히 낙관적이지 않아 진샤장벤처캐피탈의 경영파트너인 주샤오후(Zhu Xiaohu)의 견해가 뜨거운 검색에 몰렸다. 그의 견해로는 중국 AIGC 기회의 첫 번째 물결은 비즈니스를 빠르게 시작하고 즉각적으로 생산성을 향상시킬 수 있는 엔터프라이즈 서비스에서 발생했습니다. 더 중요한 것은 마지막 AI 열풍의 치명적인 타격을 경험한 후 점점 더 많은 사람들이 시장을 신뢰하고 지갑을 꽉 쥐게 되었다는 것입니다.

 

To B 필드에서는 AI 아웃바운드 통화보다 구현 효과가 더 확실한 시나리오가 거의 없습니다. 대형 모델은 서비스 산업에 효율성 혁명을 가져올 수 있을 것으로 보입니다. 월급 2,000위안을 받는 직원은 하루에 수백 통의 전화만 걸 수 있지만 성능은 두 배, 심지어 10배까지 높일 수 있고 가격도 저렴합니다. .

 

그러나 소비자는 이를 구매하지 않습니다. AI 발신 전화에 침착하게 응답할 수 있는 사람은 거의 없습니다.

 

상대방은 친황다오(秦皇島)에 있는 단독주택을 팔 수도 있고, 갓 대학을 졸업한 7~8세 아이들을 위한 프로그래밍 수업을 추천할 수도 있고, 저금리 대출이나 보험을 신청할 수도 있습니다. 금융상품도 그렇고...

 

대부분의 AI 애플리케이션이 높은 고객 확보 비용, 막대한 기술 투자, 시나리오 변경의 어려움으로 어려움을 겪고 있는 상황에서 대형 모델이 지원하는 AI 아웃바운드 통화는 특히 618, 더블11과 같은 주요 프로모션 기간 동안 모든 사람의 일상에 거의 침투했습니다. 노드 푸.

 

하지만 현실은 상상만큼 아름답지 않다.



1번의 전화 통화 비용은 1센트입니다.


현대 인터넷 사용자들의 가장 큰 걱정 중 하나는 알 수 없는 이유로 판매 전화로 괴롭힘을 당하고 있다는 것입니다. 더군다나 수동 차단은 절대 완료할 수 없을 것 같습니다. 화를 내고 싶은데 상대방은 계속해서 담담하게 이야기를 합니다.

 

이런 전화는 실제 사람이 하는 것이 아닙니다. 결국 인간에게는 AI만큼 차분한 감정이 있습니다. 사실 그들은 실제로 AI입니다. 시스템은 좋은 어휘를 구성하고, 일련의 전화번호를 스캔하고, 잠재 고객을 찾기 위해 하나씩 전화를 겁니다. 이는 오늘날 기업의 일반적인 작업입니다.

 

요점은 AI가 인간보다 저렴하다는 것입니다. 테크플래닛은 AI 아웃바운드 통화 서비스를 출시한 여러 기업에 대해 컨설팅을 했는데, 업계에는 일반적으로 6초당 1센트, 6초 미만에 대해 6초 단위로 요금을 부과하는 두 가지 모델이 있다고 밝혔습니다. 비용은 두 부분으로 구성되는데, 하나는 교환원의 기본 통화 회선 요금이고, 다른 하나는 AI 로봇 요금입니다." 국내 일부 대표적인 스마트 고객 서비스 업체도 교통량에 따라 요금을 부과하기 때문에 전화 통화 비용은 몇 센트에 불과하다고 합니다.

 

청구 규칙은 업계와도 관련이 있습니다. 업계 관계자는 "금융업은 분당 0.15위안, 비금융업은 분당 0.13위안"이라고 말했다.

 

대형 모델은 항상 생산성 혁신을 위한 도구로 간주되어 왔습니다.

 

테크플래닛에 따르면 현재 AI 아웃바운드 통화 업계 평균 수준은 로봇이 하루에 800~1,200건의 전화를 걸 수 있는 수준이다. 이는 3~5명의 작업량에 해당합니다. 비용으로 계산하면 분당 1콜 기준으로 1,200콜에 최대 180위안이 든다. 분명히 사람보다 훨씬 저렴합니다.

 

AI 아웃바운드 통화는 일반적인 SAAS 서비스입니다. 일부 회사에서는 맞춤형 음성 기술, 대화 프로세스, 지식 기반, 로봇 교육 등이 필요할 수 있습니다. 이러한 링크에 대한 수수료는 수천에서 수만 달러에 이릅니다. 그러나 실제로 시스템은 개별적으로 요금을 청구하지 않고 대화 길이에 따라서만 요금을 청구하는 경우가 많습니다.

 

대부분의 AI 아웃바운드 통화 시스템은 연결이 되어야 요금이 차감되지만 연결 속도를 보장할 수는 없습니다. 효과를 보장하기 위해 많은 회사에서는 고객에게 의도 목록에 있는 번호로 여러 번 전화를 걸겠다고 약속합니다. AI 아웃바운드 통화업체 영업사원은 연결률은 회사에서 제공하는 데이터의 정확성과 더 관련이 있다고 말했다. 이제 AI 통화 연결률은 수동통화와 거의 비슷해진다.

 

AI 로봇이 하루에 걸 수 있는 통화 수는 회선 리소스에 따라 다릅니다. AI 아웃바운드 통화 로봇 회사의 한 영업사원은 Tech Planet에 도시 교통 시스템과 마찬가지로 AI 아웃바운드 통화도 일반적으로 오전 9시~오전 11시 30분, 오후 2시~오후 5시 정도에 피크 시간대가 있다고 말했습니다.

 

업무 효율성을 보장하기 위해 기업에서는 여러 라인을 준비하는 경우가 많습니다. 지역에 따라 매칭되며, 베이징에 있는 사용자에게 전화가 걸려오면 해당 사용자가 낯선 전화에 응답하지 못하도록 베이징 지역을 나타내는 회선을 사용합니다.

 

하지만 바쁜 이주노동자들은 AI로부터 걸려오는 전화를 받으면 첫 반응이 짜증스러운 나머지 해당 번호를 차단하는 경우가 많다. AI 아웃바운드 통화 업계 관계자는 테크플래닛에 괴롭힘을 당하지 않으려면 특정 번호 부문에 직접 불만을 제기할 수 있다고 전했다. 번호 세그먼트에 대한 불만이 제기되면 다른 번호 세그먼트, 즉 라인 리소스를 즉시 활성화해야 합니다.

 

불만사항이 너무 많으면 교환원이 해당 번호 구간을 괴롭히는 전화로 표시합니다. 이때 AI 아웃바운드 콜업체는 가끔씩 마크를 클리어하는 경우가 많다.


AI 아웃바운드 통화가 정말 유용할까요?


AI 아웃바운드 통화 업계 관계자가 자사의 백엔드 시스템을 테크플래닛에 선보인 뒤 소비자의 의도에 따라 카테고리 A는 명확한 소비자 의도를 나타내고, 카테고리 B는 에 속한다. 중간이고 카테고리 C는 바로 거부입니다. 이 데이터는 최종적으로 문서에 보관되어 고객에게 반환됩니다. 명확한 소비 의도가 있는 고객은 SMS 안내를 통해 후속 조치를 취하고 회사의 WeChat 또는 공식 계정을 팔로우할 수 있습니다.

참고: AI 아웃바운드 통화 회사의 백엔드 시스템 스크린샷.

 

그러나 AI 콜 로봇을 활용해 온 건축자재 기업은 기계가 인간만큼 유연한 의사소통 능력을 가질 수 없기 때문에 로봇이 인간을 완전히 대체하는 것은 불가능하다고 말했다. 로봇의 본질은 사람들이 사전 심사를 할 수 있도록 돕는 것입니다. 비금융업종의 접속률은 40~60%인 반면, 금융업종의 접속률은 25~40%에 그치거나 그보다 낮을 수도 있습니다. 효율성을 극대화하기 위해 기업은 일반적으로 관심 있는 고객에 대해 즉시 수동 후속 조치를 마련합니다.

 

그러나 이는 이상적인 상황일 뿐 실제로 AI 아웃바운드 통화로 인한 고객 전환은 이상적이지 않습니다. Tech Planet이라는 판매자가 두 개 이상 있습니다. 시장에 나와 있는 값싼 제품 중 다수는 소스 코드로 만든 OEM이며 R&D 기능이 전혀 없습니다. 많은 음성 기술이 충분히 유연하지 않습니다.

 

한 사업가는 “업계 선두 기업의 로봇을 사용하고 있는데 회선 상태가 매우 좋지 않고, 전화 연결률도 60%에 훨씬 못 미친다”고 말했다. 애프터 서비스를 제공하는 것은 초기 단계에서 모두 동일한 데이터를 사용하여 고객을 확보하는 것입니다. 이 사람들은 로봇은 물론이고 실제 사람이라 할지라도 반복적으로 공격을 받았습니다.

 

실제로 많은 소비자들은 처음으로 AI 아웃바운드 전화를 받았을 때 자신이 실제 사람이라고 생각했습니다. 한 명 이상의 AI 아웃바운드 통화 로봇 운영자는 자신의 목소리가 대형 모델이 합성한 것이 아니라 실제 사람이 녹음했다고 말했습니다. 하지만 좀 더 인간답게 되고 싶다면 더 많은 재정적, 기술적 투자가 필요합니다. 예를 들어, 말하기 기술을 몇 세트 더 수행하면 말하기 기술이 완성될수록 전화를 걸 때 능력이 더욱 다양해집니다.

 

AI 아웃바운드 통화 로봇 업계의 한 실무자는 처음에 전화를 많이 걸어야 돈을 벌 수 있는 기업은 거의 없다고 말했다. 테이크아웃이 도착할 때, 택배가 도착할 때, 전자상거래 이벤트가 올 때 등 매일 수천만 건의 AI 아웃바운드 통화를 하여 돈을 벌 수 있습니다. 그러나 현실은 많은 회사에서 하루에 수십만 건의 전화가 매우 좋은 것으로 간주된다는 것입니다.

 

"일반적으로 이 수준의 연구를 가진 사람들은 자체 연구를 수행하기로 선택하고 내부 연구 개발은 일부 Meituan, JD.com 등과 같은 외부 세계로 수출될 수도 있습니다. 실제로 정부 산업과 금융업은 돈을 벌 수 있고, 달리 할 수 ​​있는 게 없다”고 덧붙였다.


큰 물고기가 작은 물고기를 잡아먹고, 중소기업은 도태 위기에 처해 있다

올해 4월 Jinshajiang Venture Capital의 관리 파트너인 Zhu Xiaohu는 인터뷰에서 자신도 AGI(일반 인공지능)의 신봉자이지만 독실한 기술 신봉자는 아니라고 말했습니다. 즉시 상용화됩니다.

 

인구 기반과 수요가 크기 때문에 중국에는 AI 인터뷰, 마케팅 등 효율성을 향상할 수 있는 시나리오가 실제로 많습니다. Zhu Xiaohu는 LLaMA를 통해 2~3개월 훈련을 마치면 최소한 인간 수준 상위 30위까지 도달할 수 있으며 수동 판매의 50%가 즉시 사라질 것이라고 말했습니다.

 

오픈소스 모델 훈련은 2~3개월 안에 상용화를 시작하는데, 해자가 높지 않아 AI 아웃바운드 호출이 엇갈린다. 시중에 나와 있는 AI 아웃바운드 호출 로봇 중 다수는 스타트업 기업으로, 대형 모델을 개발할 만큼 자금력이 부족할 수 있다.

 

이로 인해 지난 AI 붐 시대에는 AI 아웃바운드 통화를 주력 사업으로 하는 스타트업이 자금을 지원받은 사례가 많았으나 이번 라운드에는 많지 않았다. OPPO, Xiaohongshu, Didi Chuxing 등 많은 주요 제조업체에 서비스를 제공한 지능형 고객 서비스 분야의 선두주자인 Wisdom Tooth Technology가 2022년에 마지막 자금 조달 라운드를 진행합니다.

 

최종 분석에서 대규모 모델의 효율성은 여전히 ​​컴퓨팅 성능, 알고리즘 및 계산에 따라 달라집니다. 그리고 이러한 자원은 선도 기업이나 대기업의 손에 더 많이 있습니다.

 

한 대형 제조사의 R&D 직원은 테크플래닛에 AI 아웃바운드 통화의 핵심 기술은 첫째, 상대방의 말을 이해한 뒤, 정확하게 대응하고, 마지막으로 상대방에게 답변하는 3가지 포인트가 있다고 말했다. 목소리.

 

여기에는 ASR 음성 인식 기술, NLP 자연어 처리, TTS 음성 합성 기술의 세 가지 기술이 포함됩니다. 시장의 많은 사람들이 TTS 음성 합성 기술을 잘 익히지 못해 수동 녹음을 사용합니다.

 

"예전에는 보코더 + 어쿠스틱 모델이었지만 이제는 큰 모델을 직접 제작합니다. 기술적인 패러다임을 완전히 바꿔 놓았습니다. 상호 작용이 매우 현실적일 수 있으며 실제 사람이 문장을 끊는 과정을 시뮬레이션할 수도 있습니다. 호흡과 생각, 방언도 이해할 수 있다”고 덧붙였다.

 

예를 들어 AI 아웃바운드 통화 로봇이 소비자에게 쿠폰을 추천하면 상대방은 "무엇이 있나요?"라고 묻지만 그 쿠폰으로 무엇을 살 수 있는지가 숨겨져 있다. 상대방이 출장으로 이동하는 것이 불편하다고 표현하면 소비자에게 가장 가까운 도시에서 어디에서 사용할 수 있는지 알려줄 수 있습니다.

 

중국에서는 이미 JD.com과 같은 기업이 축적되기 시작했습니다. 예를 들어 JD.com이 개발한 Yanxi 대형 모델은 자체 JD Fresh, JD 자체 운영 및 기타 제품에 사용될 뿐만 아니라 외부 세계로 수출되기도 합니다. 올해 1월 Yili는 새로운 탄산 우유 음료 제품인 'Milk Steam PET'를 출시했을 때 Yanxi를 사용하여 유명 대변인 'Times Youth League'의 음성을 맞춤화했습니다.

 

업계 관계자에 따르면 금융 데이터와 같은 일부 특수 산업에는 민영화 배포가 필요하며 가격은 일반적으로 500,000부터 시작하여 수백만 달러에 달하는 수수료를 포함해 수십만 달러에 이를 수 있습니다. 하지만 흩어져 있는 소규모 기업을 찾기보다는 규모와 힘이 더 큰 기업을 선택하는 경향이 있습니다. 결국, 누구도 자신의 돈이 낭비되는 것을 원하지 않습니다.

 

큰 물고기가 작은 물고기를 잡아먹고, 작은 회사들은 힘이 부족해서 결국 삼켜지게 됩니다.

 

하지만 기술이 점점 성숙해지면 소비자에게 더 편리하게 다가갈 수 있고, 상대방이 로봇인지 AI인지 구별하기가 점점 더 어려워진다면 이는 좋은 일이 아닐 수도 있습니다.

 

소비자를 과도하게 괴롭히지 않고 기업에 더 나은 서비스를 제공하는 방법은 업계의 영원한 제안입니다.



가이드 스타 Tech Planet에 오신 것을 환영합니다.🌟

第一时间接收文章更新👇