nachricht

soundnet veröffentlicht neues buch „understanding real-time interaction“, um die vergangenheit, gegenwart und zukunft von rte aufzuzeichnen

2024-09-06

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

als infrastruktur für das zukünftige digitale leben hat die rte-echtzeitinteraktion alle aspekte der sozialen interaktion, der unterhaltung, der arbeit, des einkaufens usw. der menschen vollständig durchdrungen und die wertsteigerung aller lebensbereiche gefördert. selbst im aktuellen aigc-trend spielt die echtzeitinteraktion eine wichtige rolle und fördert die weiterentwicklung der interaktion zwischen mensch und ki von text zu multimodalem audio und video.
doch was genau ist echtzeit-interaktion? wie ist das technische prinzip dahinter? zeit sprachdialog in großen modellen in der zukunft?
veröffentlicht von machinery industry press am 27. augustshengwang-forschungsinstitutdas von der gruppe zusammengestellte interaktive echtzeit-branchenbuch „understanding real-time interaction“ ist offiziell erhältlich. dies ist auch das erste technische populärwissenschaftliche buch der branche, das die echtzeit-interaktion systematisch einführt.
jixun foo, geschäftsführender gesellschafter von granite asia, jiang tao, gründer und vorsitzender von csdn, liu qin, gründungspartner von wuyuan capital, liu chengcheng, gründer und vorsitzender von 36kr, li donghong, professor an der tsinghua-universität, ma siwei, professor an der peking-universität, xie lei, professor an der northwestern polytechnical university, idc china vizepräsident und chefanalyst wu lianfeng und andere empfahlen es gemeinsam.
um die echtzeitinteraktion zu verstehen, reicht dieses buch aus
das buch „understanding real-time interaction“ stellt detailliert die vergangenheit, gegenwart und zukunft der entwicklung der echtzeitinteraktion vor.behandelt die entwicklungsgeschichte, konzeptanalyse, technische prinzipien, anwendungsszenarien und big-data-beobachtung der echtzeitinteraktionusw., ist hauptsächlich in fünf teile gegliedert.
·   kapitel 1: rückblick und einblick in die vergangenheit, gegenwart und zukunft der echtzeitinteraktion
welche entwicklungen von szenarien, technologie-upgrades und unternehmensinnovationen gab es in dieser zeit seit der geburt des weltweit ersten voip-telefons, das anrufe tätigen kann, bis hin zu der zeit, in der menschen mit ki echtzeit-sprachgespräche führen können? und live-übertragungsverbindung von mai über online-bildung, interaktive podcasts, yuanverse bis hin zum beliebten aigc in diesem jahr wird shengwang die technologie-upgrades und branchenveränderungen der echtzeit-interaktion aus der perspektive eines audio- und videodienstleisters auf unterster ebene analysieren.
wie ist beispielsweise die echtzeitinteraktion zu einem standardmerkmal von pan-entertainment-anwendungen geworden? wie können iot-geräte mit der unterstützung von rtc-funktionen alles interaktiv machen? seit dem ersten aufkommen des videokonferenzkonzepts im jahr 1964 können entwickler videokonferenzfunktionen in jede app einbetten. wie wurden videokonferenzen von einem einzelnen kommunikationstool zu einer universellen funktion aufgewertet?
·   kapitel 2: echtzeitinteraktion und analyse verwandter konzepte
wir reden immer von rtc und rte, aber verstehen sie wirklich den unterschied zwischen den beiden? moment, es gibt auch paas, saas, iaas und apaas. zerbrechen sie sich immer noch den kopf, weil sie diese konzepte nicht unterscheiden können?
ich glaube, dass sie nach der lektüre dieses kapitels ein immer klareres verständnis dieser konzepte haben werden.
·   kapitel 3: analyse des echtzeit-audio- und videotechnologieprozesses
das hauptereignis ist hier. als anfänger in der branche ist dieses kapitel die beste wahl, um die echtzeit-audio- und videotechnologie zu verstehen. von der audio- und videosammlung über die vorverarbeitung, kodierung, übertragung bis hin zur audio- und video-nachbearbeitung haben wir uns mit vielen technischen experten von agora zusammengetan, um sie einzeln, in einem längeren raum und mit mehr worten abzudecken.
in diesem kapitel erfahren sie, wie sie in szenarien wie live-übertragungen und videoanrufen eine verschönerung erzielen. 264, h.265 und av1 usw. welche unterschiede gibt es bei der anwendung von video-codec-standards in rtc?
·   kapitel 4: tiefer gehenanalysieren sie die jüngsten200 interaktive echtzeit-anwendungsszenarien
derzeit entwickelt sich die aigc-branche auf hochtouren. mit dem segen der echtzeitinteraktion hat sich auch die interaktion zwischen mensch und ki von text zu multimodalem audio und video entwickelt, beispielsweise zu ki-sprache assistenten, gesprochene ki-lehrer, ki-spiel-npcs, virtuelle ki-liebhaber usw. am beispiel des ki-sprachassistenten können benutzer über ein multimodales großes modell + rtc einen 1v1-echtzeit-sprachdialog mit dem ki-assistenten führen. legen sie über prompt (ki-befehl oder ki-eingabewort) umfassende persönliche einstellungen für den assistenten fest und arbeiten sie mit der rtc-übertragung mit extrem geringer latenz zusammen, damit die ki wie ein echter assistent interagieren und hilfe leisten kann.
in dieser art von konversations-ki-szenario gibt es viele technische schwierigkeiten. beispielsweise weist der ki-sprachdialog normalerweise eine hohe verzögerung auf, was sich stark auf das dialogerlebnis auswirkt. außerdem muss die verzögerung innerhalb von 1 liegen -2s. das telefongespräch wird natürlich und reibungslos sein. gleichzeitig können bei streaming-gesprächen menschliche stimmen und geräusche in der umgebung leicht die gespräche zwischen mensch und maschine beeinträchtigen. audiofunktionen wie aivad, agc und ains sind erforderlich, um die störungen durch umgebungsgeräusche wirksam zu unterdrücken und die sprache des benutzers besser zu identifizieren. durch die vollständige semantik wird die spracherkennung vollständiger und genauer.
neben den neu aufkommenden konversations-ki-szenarien und den bekannten szenarien wie live-shows, chatrooms und online-karaoke stellt das buch auch viele iot-szenarien vor, von denen sie noch nie etwas gewusst haben, wie zum beispiel cloud racing im bereich der parallelsteuerung, cloud racing basiert auf cloud computing und künstlicher intelligenz und wird hauptsächlich für fernfahr-rennwettbewerbe zwischen enthusiasten und professionellen rennfahrern verwendet. durch die steuerung der cloud-plattform können fahrer zu hause an remote-rennwettbewerben teilnehmen.
in einem solchen szenario konzentrieren sich die technischen schwierigkeiten hauptsächlich auf verzögerung und übertragung. rennwagen sind beispielsweise schnell und haben hohe latenzanforderungen. sie müssen die niedrige latenz und übertragungsstabilität von echtzeitbildern erfüllen mehrere high-definition-backhauls.
·   kapitel 5: interaktive big-data-beobachtung in echtzeit
interagieren benutzer auf der ganzen welt in echtzeit? als app-betreiber oder als kollege, der sich mit echtzeit-audio- und video-big-data befasst, glaube ich, dass die liste der rtc-nutzungsmodelle beliebt ist bereiche auf der ganzen welt, der anteil häufig verwendeter netzwerke für modelle und die auswirkungen verschiedener modelle auf daten, wie z. b. der anteil der audio- und videonutzung, rtc-nutzung in beliebten bereichen usw., sind allesamt betroffen. welchen einfluss hat außerdem die einfrierrate von audio und video auf die nutzungsdauer und -erhaltung durch den benutzer? wie kann man diese inhalte optimieren?
dieses buch stellt außerdem umfangreiche und praktische unterstützende ressourcen bereit, einschließlich elektronischer dokumente wie diagramme, karten, branchenentwicklungsberichte und whitepapers im zusammenhang mit echtzeit-interaktion, ist es voller nützlicher informationen und bietet ein hervorragendes preis-leistungs-verhältnis. der spezifische weg, es zu erhalten, besteht darin, den qr-code auf dem zu scannen rückseite, um die exklusive cloud-disk dieses buches aufzurufen und herunterzuladen.
woher kommt „echtzeitinteraktion verstehen“?
im kontext der rasanten entwicklung der interaktiven echtzeit-industrieumgebung und der diversifizierung der nutzungsszenarien stellte shengwang fest, dass es in der branche kein buch gibt, das die echtzeitinteraktion aus den perspektiven entwicklungsgeschichte, anwendungsszenarien und technik systematisch einführt architektur usw. und nur wenige bücher behandeln die technischen aspekte der echtzeitinteraktion. bei der einführung von webrtc auf architekturebene kennen viele menschen die beziehung und den unterschied zwischen rtc-echtzeit-audio und -video und rte-echtzeit nicht daher ist ein umfassendes verständnis und die popularisierung der echtzeitinteraktion jetzt besonders wichtig.
in diesem jahr jährt sich die gründung von shengwang zum 10. mal. shengwang war schon immer der pionier der globalen interaktiven echtzeit-cloud-branchehelfen sie menschen, über entfernungen hinweg in echtzeit zu interagieren, beispielsweise bei zusammenkünftenals mission setzen wir uns dafür ein, das interaktive echtzeiterlebnis der menschen durch hochwertige audio- und videotechnologiedienste in echtzeit umfassend zu verbessern, die sozial-, bildungs-, finanz-, medizin- und andere branchen zu stärken und die wirtschaftliche und soziale entwicklung zu fördern. shengwang hat die verantwortung und verpflichtung, die popularisierung der echtzeitinteraktion voranzutreiben.
in diesem zusammenhang veröffentlichte shengwang anlässlich seines 10-jährigen jubiläums das buch „understanding real-time interaction: in- depth interpretation of audio and video technology, scenarios and data“. dieses buch beginnt mitentwicklungsgeschichte, technische prinzipien, anwendungsszenarien, big-data-beobachtung und andere dimensioneneine umfassende und systematische erklärung der echtzeitinteraktion. wir hoffen, dass die leser durch die lektüre dieses buches ein tiefgreifendes verständnis der echtzeitinteraktion erlangen und sich das wissen im zusammenhang mit der echtzeitinteraktion aneignen und mehr menschen dazu ermutigen können, sich dieser branche anzuschließen und gemeinsam den fortschritt der branche voranzutreiben.
derzeit,„understanding real-time interaction“ wurde auf großen e-commerce-plattformen und physischen buchhandlungen wie jd.com und dangdang eingeführt. bleiben sie also auf dem laufenden.
bericht/feedback