소식

soundnet, rte의 과거, 현재, 미래를 기록하는 신간 "실시간 상호 작용 이해" 출시

2024-09-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

미래 디지털 라이프를 위한 인프라로서 rte 실시간 상호작용은 사람들의 사회적 상호작용, 엔터테인먼트, 업무, 쇼핑 등 모든 측면에 완전히 침투하여 모든 계층의 가치 성장을 활용했습니다. 현재 aigc 열풍 속에서도 실시간 상호작용이 중요한 역할을 하며 인간과 ai 간의 상호작용이 텍스트에서 멀티모달 오디오 및 비디오로 업그레이드되는 것을 촉진하고 있습니다.
그런데 실시간 상호 작용이란 정확히 무엇입니까? rtc 실시간 오디오 및 비디오에서 어떻게 발전했습니까? 그 뒤에 있는 기술 원리는 무엇입니까? 지금까지 rte를 구현하기 위한 다른 시나리오는 무엇입니까? 미래에 대형 모델의 음성 대화 시간은 기술적인 어려움이 있습니까?
기계산업출판사 8월 27일 게재성광연구소그룹이 편찬한 실시간 인터랙티브 업계 도서 '실시간 인터랙션의 이해'가 공식 판매되고 있다. 이 책은 실시간 인터랙션을 체계적으로 소개한 업계 최초의 기술 대중과학 도서이기도 하다.
granite asia 수석 관리 파트너 jixun foo, csdn 창립자 겸 회장 jiang tao, wuyuan capital 창립 파트너 liu qin, 36kr 창립자 겸 회장 liu chengcheng, tsinghua university 교수 li donghong, peking university 교수 ma siwei, northwestern polytechnical university 교수 xie lei, idc 중국 부사장 겸 수석 분석가 wu lianfeng 등이 공동으로 추천했습니다.
실시간 상호작용을 이해하려면 이 책이면 충분하다
『실시간 상호작용의 이해』라는 책은 실시간 상호작용 발전의 과거와 현재, 미래를 자세하게 소개하고 있다.개발 이력, 개념 분석, 기술 원리, 응용 시나리오, 실시간 상호 작용의 빅 데이터 관찰을 다룹니다.등은 크게 다섯 부분으로 나누어진다.
·   1장: 실시간 상호작용의 과거, 현재, 미래를 되돌아보고 통찰력 얻기
1996년 세계 최초로 전화를 걸 수 있는 voip 전화가 탄생한 이후 인간이 ai와 실시간 음성 대화를 실현할 수 있게 된 지금까지 이 기간 동안 늑대인간 살해에서 어떤 시나리오와 기술 업그레이드, 기업 혁신이 이루어졌는가? 및 라이브 방송 연결 mai, 온라인 교육, 대화형 팟캐스트, yuanverse부터 올해 인기를 끌었던 aigc까지 shengwang은 하위 오디오 및 비디오 서비스 제공업체의 관점에서 기술 업그레이드와 실시간 상호 작용의 업계 변화를 분석합니다.
예를 들어 실시간 상호 작용이 어떻게 범 엔터테인먼트 애플리케이션의 표준 기능이 되었습니까? rtc 기능을 지원하면 iot 장치에서 모든 것을 어떻게 상호 작용할 수 있습니까? 1964년 화상회의 개념이 처음 등장한 이후 지금까지 개발자는 모든 앱에 화상회의 기능을 내장할 수 있습니다. 화상회의가 어떻게 단일 통신 도구에서 범용 기능으로 업그레이드되었습니까?
·   2장: 실시간 상호작용 및 관련 개념 분석
우리는 항상 rtc와 rte에 대해 이야기하지만 둘 사이의 차이점을 정말로 이해하고 있습니까? 잠깐, paas, saas, iaas 및 apaas도 있는데 이러한 개념을 구별하지 못해서 아직도 고민하고 계십니까?
나는 이 장을 읽은 후에 이러한 개념을 더 명확하고 명확하게 이해하게 될 것이라고 믿습니다.
·   3장: 실시간 오디오 및 비디오 기술 프로세스 분석
주요 이벤트는 여기에 있습니다. 업계 초보자로서 이 장은 실시간 오디오 및 비디오 기술을 이해하기 위한 최선의 선택입니다. 오디오 및 비디오 수집, 전처리, 인코딩, 전송부터 오디오 및 비디오 후처리에 이르기까지 아고라의 많은 기술 전문가와 팀을 이루어 더 긴 공간에서 더 많은 단어로 하나씩 다루었습니다.
이 장에서는 오디오 및 비디오 사전 처리에서 오디오 3a 처리 및 벨칸토의 모범 사례를 볼 수 있습니다. 라이브 방송 및 화상 통화와 같은 시나리오에서 미화를 달성하는 방법, vp8, vp9, ​​​​h. 264, h.265, av1 등. rtc에서 비디오 코덱 표준 적용의 차이점은 무엇입니까?
·   4장: 심층 분석최근 분석해 보세요200개의 실시간 대화형 응용 시나리오
현재 aigc 산업은 실시간 상호작용의 축복으로 인해 텍스트에서 다중 모드 오디오 및 비디오로 업그레이드되었습니다. ai 음성과 같은 대화형 ai 시나리오도 많이 등장했습니다. 조수, ai 음성 교사, ai 게임 npc, ai 가상 연인 등 ai 음성 비서를 예로 들면, 멀티모달 대형 모델 + rtc를 통해 사용자는 ai 비서와 1:1 실시간 음성 대화를 할 수 있습니다. prompt(ai 명령 또는 ai 프롬프트 단어)를 통해 어시스턴트에 대한 풍부한 개인 설정을 설정하고 rtc의 초저지연 전송과 협력하여 ai가 실제 어시스턴트처럼 상호 작용하고 도움을 제공할 수 있도록 합니다.
이러한 유형의 대화형 ai 시나리오에는 많은 기술적인 어려움이 있습니다. 예를 들어 ai 음성 대화는 일반적으로 지연 시간이 길어 대화 경험에 큰 영향을 미칩니다. 또한 rtc 전송의 낮은 지연 시간은 일반적으로 1 이내여야 합니다. -2s. 전화통화의 경험이 자연스럽고 원활해집니다. 동시에 스트리밍 대화에서는 주변 사람의 목소리와 소음이 사람과 기계의 대화를 쉽게 방해할 수 있습니다. 주변 소음의 간섭을 효과적으로 억제하고 사용자의 음성을 더 잘 식별하려면 aivad, agc, ains와 같은 오디오 기능이 필요합니다. 완전한 의미론은 음성 인식을 더욱 완전하고 정확하게 만듭니다.
새로 등장하는 대화형 ai 시나리오와 라이브쇼, 채팅방, 온라인 노래방 등 익숙한 시나리오 외에도 책에서는 병렬제어 분야의 클라우드 레이싱, 클라우드 레이싱 클라우드 컴퓨팅과 인공지능을 기반으로 매니아와 프로 레이서 간의 원격 운전 레이싱 대회에 주로 사용됩니다. 클라우드 플랫폼의 제어를 통해 운전자는 집에서 원격 경주 대회에 참가할 수 있습니다.
이러한 유형의 시나리오에서 기술적인 어려움은 주로 지연과 전송에 중점을 둡니다. 예를 들어, 경주용 자동차는 빠르고 높은 지연 시간 요구 사항을 충족해야 하며 실시간 이미지의 낮은 지연 시간과 전송 안정성도 충족해야 합니다. 다양한 고화질 백홀.
·   5장: 실시간 대화형 빅데이터 관찰
전 세계의 사용자들이 실시간으로 상호작용하고 있는 걸까요? app 운영자로서, 혹은 이 업계에 관심을 갖고 있는 동료로서, 실시간 오디오 및 비디오 빅데이터, 예를 들어 인기 있는 rtc 사용 모델 목록이 있다고 생각합니다. 전 세계 지역, 모델에 일반적으로 사용되는 네트워크의 비율, 오디오 및 비디오 사용 비율, 인기 있는 지역의 rtc 사용 등과 같은 다양한 모델이 데이터에 미치는 영향이 모두 관련됩니다. 또한 오디오 및 비디오 정지율은 사용자 사용 시간 및 유지율에 어떤 영향을 미치나요? 이를 최적화하는 방법은 rtc 업계 실무자가 놓칠 수 없는 내용입니다.
이 책은 또한 풍부하고 실용적인 지원 자료를 준비합니다., 실시간 상호 작용과 관련된 차트, 지도, 산업 개발 보고서 및 백서 등의 전자 문서를 포함하여 유용한 정보와 뛰어난 가치로 가득 차 있습니다. 이를 얻는 구체적인 방법은 qr 코드를 스캔하는 것입니다. 뒷표지에 이 책의 전용 클라우드 디스크에 들어가서 다운로드 받으세요.
"실시간 상호 작용 이해"는 어디에서 왔습니까?
실시간 인터랙티브 산업 환경의 급속한 발전과 사용 시나리오의 다양화 속에서 shengwang은 개발 이력, 응용 시나리오, 기술 측면에서 실시간 인터랙션을 체계적으로 소개한 책이 업계에 없다는 사실을 발견했습니다. 아키텍처 등을 다루며 실시간 상호 작용의 기술적 측면을 다루는 책은 소수에 불과합니다. 아키텍처 수준에서 webrtc를 소개할 때 많은 사람들은 rtc 실시간 오디오 및 비디오와 rte 실시간 간의 관계와 차이점을 알지 못합니다. 따라서 실시간 상호작용에 대한 포괄적인 이해와 대중화는 특히 중요합니다.
올해는 글로벌 실시간 인터랙티브 클라우드 산업의 선구자로서 shengwang 창립 10주년이 되는 해입니다.사람들이 함께 모이는 등 거리에 관계없이 실시간으로 상호 작용할 수 있도록 지원우리는 고품질 실시간 오디오 및 비디오 기술 서비스를 통해 사람들의 실시간 상호 작용 경험을 종합적으로 개선하고 사회, 교육, 금융, 의료 및 기타 산업에 힘을 실어주고 경제 및 사회 발전을 촉진하는 것을 사명으로 삼고 있습니다. shengwang은 실시간 상호작용의 대중화를 촉진할 책임과 의무가 있습니다.
이에 대해 shengwang은 창립 10주년을 맞아 '실시간 상호작용의 이해: 오디오 및 비디오 기술, 시나리오 및 데이터의 심층 해석'이라는 책을 출간했습니다. 이 책은 다음부터 시작한다.개발 이력, 기술 원리, 응용 시나리오, 빅 데이터 관찰 및 기타 차원실시간 상호작용에 대한 포괄적이고 체계적인 설명입니다. 우리는 이 책을 읽음으로써 독자들이 실시간 상호작용에 대한 심층적인 이해를 갖고 실시간 상호작용과 관련된 지식을 숙지하며, 더 많은 사람들이 이 산업에 참여하도록 독려하고 업계의 발전을 공동으로 추진할 수 있기를 바랍니다.
현재,『실시간 상호작용의 이해』는 jd.com, dangdang 등 주요 전자상거래 플랫폼과 오프라인 서점에 론칭되었으니 많은 관심 부탁드립니다.
보고/피드백