소식

Communication Brain CTO Zhang Jian: 미디어를 위한 대규모 모델 구현의 마지막 마일을 가속화하세요

2024-08-24

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

차오뉴스 고객기자 황윤링

미디어 융합이 전반적인 국가 전략으로 추진된 이후 지난 10년 동안 신흥 기술은 미디어 융합, 특히 생성적 인공지능(Generative Artificial Intelligence)의 발전을 지속적으로 뒷받침해 미디어 분야에서 점점 더 중요한 역할을 하고 있습니다. 8월 23일, "BIRTV2024AIGC 생성적 인공 지능 혁신 및 응용 기술 교류 컨퍼런스"가 베이징에서 개최되었습니다. Communication Brain의 부사장 겸 최고 기술 책임자인 Zhang Jian이 "대규모 응용 프로그램 가속화"에 대한 기조 연설을 하도록 초대되었습니다. 미디어 모델".

생성 인공 지능의 기능은 당연히 미디어 산업의 요구 사항과 일치합니다. 미디어 조직은 대형 모델의 적용을 가속화해야 하며 구현의 마지막 단계는 미디어의 수많은 복잡한 다중 작업 요구 사항을 직렬 또는 병렬 단일로 변환하는 것입니다. 간단한 지침과 시나리오 기반 대규모 모델 지침 세트를 편집 시스템에 원활하게 통합하는 기능이 있습니다.

그렇다면 Zhang Jian은 이번 회의에서 어떤 정보를 공유했습니까?

Communication Brain의 부사장 겸 CTO인 Zhang Jian이 라이브 연설을 했습니다. 사진 제공: 스프레드 더 브레인(Spread the Brain)

미디어업계 빅모델의 '독점적 존재감'

2017년 Microsoft Xiaoice AI Poetry Collection의 등장부터 GPT4, Sora 등 다중 모드 대형 모델의 지속적인 등장까지 수많은 딥러닝 방법이 제안되고 반복적으로 업데이트되면서 AIGC 개발 붐이 일었습니다. 생성적 인공 지능은 미디어의 일상적인 콘텐츠 제작 요구 사항에 완벽하게 부합하는 이미지, 텍스트, 비디오 및 기타 콘텐츠를 생산하는 데 중점을 두고 있습니다. 미디어 산업은 변화의 기회를 제공하고 있습니다.

그러나 미디어 업계에서 대형 모델이 널리 적용되면서 기본 일반 대형 모델을 직접 개발할 것인지와 같은 몇 가지 질문이 점차 표면화되었습니다. 데이터 유출을 방지하기 위해 민영화된 배포를 위한 대규모 모델을 구축하고 싶습니까? 대형 모델은 미디어 제작의 획득 및 편집 시스템과 어떻게 통합됩니까?

이러한 문제에 대해 Zhang Jian은 미디어 산업이 기본 대형 모델을 '롤'할 필요가 없으며 이를 잘 적용하는 것이 더 중요하다고 믿습니다. 그리고 데이터가 어렵습니다. 배포 후 지속적으로 기능을 향상시키는 방법이 핵심입니다.”

Zhang Jian은 회의에서 많은 대형 모델이 특정 시나리오의 요구 사항을 기반으로 애플리케이션을 완전히 개발하지 않고 다양한 사용자 그룹의 요구 사항에 맞는 맞춤형 디자인을 수행하지 않아 비실용적인 서비스를 제공한다고 말했습니다. 현재 대형 모델의 적용은 주로 하나의 간단한 작업을 해결하는 데 있는 반면, 미디어에서는 직렬 또는 병렬의 복잡한 다중 작업이 필요합니다. 프롬프트 워드 엔지니어링의 전문화는 콘텐츠, 프로세스 및 대형 모델이 분리되는 현재 상황을 해결할 수 없습니다. 체계. 미디어 대형 모델의 미래 추세는 미디어의 복잡한 다중 작업 요구 사항을 간단한 단일 작업 프로세스로 변환하고 시나리오 기반 지침 세트를 획득 및 편집 시스템에 원활하게 통합하는 것입니다.

일반 모델에서 미디어 모델로의 전환

미디어 제작 시나리오에서 범용 대형 모델은 단일 텍스트만 생성할 수 있으며, 생성된 비디오에도 저작권 위험이 있습니다. 분명히 일반적인 대형 모델 응용 프로그램에는 미디어 비즈니스 프로세스가 심층적이지 않고 장면 기반 적응이 부족하며 개인화되는 등의 문제가 여전히 남아 있습니다.

이에 대해 커뮤니케이션 브레인은 뉴스 데이터 미디어 라이브러리를 일반 대형 모델과 결합하여 미세 조정 후 미디어 수직 카테고리를 찾는 대형 커뮤니케이션 모델을 생성하여 미디어에 지능적 생성, 지능적 검토, 창의적 디자인, 다중 기능을 제공합니다. 모달 검색, 지능형 대화의 5대 주요 서비스. 보도에 따르면 2024년 2월 생성적 인공지능(대형 언어 모델)을 통해 대규모 커뮤니케이션 모델이 온라인으로 등록돼 미디어 기술 기업이 개발한 최초의 대규모 미디어 모델이 등록 절차를 통과했다. 8월에는 Spread Brain의 콘텐츠 생성 알고리즘이 중국 국가사이버공간관리국에 등록되었습니다.

사진 제공: 스프레드 더 브레인(Spread the Brain)

Zhang Jian은 대규모 커뮤니케이션 모델에는 세 가지 주요 특징이 있다고 말했습니다. “첫째, 고품질 뉴스 데이터를 훈련에 사용할 수 있어 대규모 모델 콘텐츠 생성의 무작위 제작을 효과적으로 완화하고 콘텐츠의 진위를 보장할 수 있습니다. 둘째, 개인 도메인 미디어 리소스 라이브러리를 개방할 수 있으며, 대형 모델을 사용하여 저작권이 있는 콘텐츠를 빠르고 정확하게 검색하여 콘텐츠 자료의 안정적인 저작권을 보장할 수 있습니다. 셋째, 세계에서 가장 전문적인 대형 모델 애플리케이션 슈퍼마켓을 만들 수 있습니다. 사용자 역할, 비즈니스 시나리오, 콘텐츠 양식을 기반으로 미디어 산업을 간편하고 편리하게 사용할 수 있도록 지원합니다.”

위의 세 가지 특성을 기반으로 커뮤니케이션 모델은 "전문 미디어 지식 기반", "전체 비즈니스 시나리오 적용 범위", "전체 창의적 프로세스 액세스" 및 "다중 모드 콘텐츠 지원"이라는 네 가지 고유한 이점을 형성했습니다. ". 미디어를 위한 대규모 모델 구현의 마지막 단계를 가속화합니다.

현재 대규모 통신 모델은 주로 미디어 융합 클라이언트와 콘텐츠 제작 플랫폼이라는 두 가지 주요 응용 시나리오에 중점을 두고 있습니다. 통합 미디어 클라이언트 시나리오에서 커뮤니케이션 모델은 콘텐츠 제작 시나리오에서 개인화되고 지능적인 음성 커뮤니케이션 및 댓글 서비스를 제공할 수 있습니다. 커뮤니케이션 모델은 더 풍부한 기능을 가지며 뉴스 작성, 비디오 생성, 다중 모드 검색, AI 포스터 생성을 제공할 수 있습니다. , 사진 자료 생성, 콘텐츠 지능형 검토 및 기타 기능.

미디어 산업의 대형 모델 발전 추세

장지안 대표는 대형 모델 기술의 지속적인 발전과 미디어 산업의 융합에 따라 미디어 산업의 대형 모델의 미래 동향을 분석했다. 미래 미디어 산업. 미디어 산업의 경우 비즈니스 시나리오 요구 사항을 기반으로 사용자 중심이어야 하며 대규모 모델 기술을 사용하여 디지털 기술 서비스를 혁신해야 합니다.

커뮤니케이션 브레인의 개발 목표는 AI 애플리케이션의 마지막 마일을 여는 것입니다. Communication Brain은 사용자 역할, 비즈니스 시나리오 및 콘텐츠 양식을 기반으로 차세대 미디어를 위한 애플리케이션 슈퍼마켓을 구축하고 각 독립 애플리케이션 시나리오가 프로덕션 최종 비즈니스와 긴밀하게 통합되어 전체 미디어 워크플로우를 원활하게 통합하고 최적화하도록 보장합니다. 이를 통해 미디어 작업의 효율성과 품질을 향상시킵니다.

대형 모델 기술의 지속적인 성숙과 응용 시나리오의 확장은 미디어 산업을 위한 보다 효율적이고 지능적인 개발의 새로운 시대를 열 것입니다. Communication Brain은 이 과정에서 중요한 촉진자이자 조력자가 되기 위해 최선을 다하고 있습니다.

"재인쇄시 출처를 밝혀주세요"

보고/피드백