großes audiomodell auf der yunqi conference

großes audiomodell auf der yunqi-konferenz 2024 vorgestellt

2024-09-22

am 19. september wurde die yunqi-konferenz 2024 in der stadt yunqi in hangzhou mit dem thema „yunqi intelligent leap, industrial butterfly transformation“ eröffnet. das multimodale audio-großmodell „himalayan everest ai“ wurde im themenpavillon „künstliche intelligenz +“ vorgestellt und zog viele bürger an.

bis ende letzten jahres hatte ximalaya 488 millionen audiostücke in 459 kategorien mit einer gesamtinhaltsdauer von mehr als 3,6 milliarden minuten gesammelt. der umfangreiche und vielfältige online-audioinhalt ermöglicht es dem unternehmen, seine ki-fähigkeiten kontinuierlich weiterzuentwickeln. zu beginn ihrer gründung legte die plattform stets großen wert auf den einsatz von ki. das dieses mal vorgestellte „everest ai audio multi-modal large model“ ist ein unabhängig entwickeltes großes modell zur ki-audioerzeugung. es basiert auf mehr als einer million stunden eigener urheberrechtlich geschützter audiodaten für tiefgreifendes lernen und training und verfügt über emotionale fähigkeiten ausgabe, natürlicher ausdruck, es verfügt über technische fähigkeiten wie sprachübersetzung und extrem schnelles klonen und hat mehrdimensionale durchbrüche auf dem gebiet der audioerzeugung erzielt, die in hörbüchern und anderen bereichen weit verbreitet ist.

in der „everest ai digital intelligence platform interactive experience zone“ können teilnehmer die veränderungen erleben, die ki bei der klangerzeugung mit sich bringt, wie zum beispiel: extrem schnelles erleben von 535 ki-klangbibliotheken in allen bereichen und mehreren kategorien zur generierung von aigc-audioinhalten in allen kategorien , 15 sekunden passen sie schnell bilder von echten homo sapiens an, klonen sie stimmen in 10 sekunden usw. und erleben sie, wie ki content-ersteller effizient und bequem unterstützt.

daten zeigen, dass im jahr 2023 die durchschnittlichen monatlichen aktiven nutzer von ximalaya in allen szenarien 303 millionen erreichen werden. im dezember letzten jahres erreichte der aigc-inhalt der plattform 240 millionen minuten, was 6,6 % des audioinhalts ausmacht. gleichzeitig hat die aigc-penetrationsrate der durchschnittlichen monatlich aktiven nutzer auf dem mobilen endgerät 14,8 % erreicht. das ximalaya-audio-großmodell verfügt über die modellvorteile eines „integrierten produktionsmodell-ökosystems und eines sich ständig weiterentwickelnden ökologischen schwungrads“. es wird häufig in der inhaltserstellung, in digitalen intelligenz-avataren, in der sprachinteraktion und in anderen szenarien eingesetzt und kommerzialisiert. in zukunft werden wir die vorstellungskraft von klang noch weiter öffnen und klang weiterhin für ein besseres leben nutzen.

autor: fu xinxin

text: fu xinxin bilder: zur verfügung gestellt vom interviewpartner herausgeber: shen zhushi herausgeber: fan bing

bitte geben sie beim nachdruck dieses artikels die quelle an.

bericht/feedback

nachricht

großes audiomodell auf der yunqi-konferenz 2024 vorgestellt

einführung

meine kontaktdaten