소식

국내 최초 '눈'을 갖춘 대형 모델이 서비스 무역박람회에서 공개됐다.

2024-09-13

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

국산 대형 모델이 '눈' 잠금 해제에 성공, zhipu ai(beijing zhipu huazhang technology co., ltd.)가 2024년 중국 국제 서비스 무역 박람회(서비스 무역 박람회라고도 함)에서 최신 클리어 버전을 시연했습니다. ), 9월 12일 오픈. yan 앱 '영상통화' 기능. 이는 세계 최초로 일반인에게 공개된 대규모 영상통화 기능인 것으로 전해졌다.
보고서에 따르면 qingyan의 화상 통화 기능은 텍스트, 오디오, 비디오의 세 가지 주요 모드에 걸쳐 있으며 실시간 추론 기능을 갖추고 있습니다. 사용자는 카메라를 켜고 화상통화 창을 통해 칭옌과 소통할 수 있다. 칭옌은 사용자의 화면을 '볼' 수 있을 뿐만 아니라, 지시 사항을 이해하고 정확하게 실행할 수 있으며, 자주 방해를 받더라도 빠르게 대응할 수 있다. 화면의 핵심 포인트를 강조함으로써 qingyan은 사용자가 무엇에 집중하고 싶어하는지 이해할 수도 있습니다.
숙제 지원을 제공하십시오.
zhipu ai는 gpt-4o가 이전에 음성 기능을 출시했지만 비디오 기능을 대중에게 공개하지 않았다고 밝혔습니다. qingyan을 사용하면 최첨단 ai/대형 모델 기술을 경험할 수 있습니다. 과거 ai와의 상호작용은 주로 텍스트 형태였다. 영상 기능을 통해 사용자는 긴 텍스트 메시지에 작별하고 ai와 원활하게 소통할 수 있다. qingyan은 사용자 주변의 비전과 이해력을 갖춘 인간 조수와 같습니다. 카메라가 사진을 찍는 한 ai는 사용자의 환경과 ai가 원하는 작업을 알 수 있습니다. 지침.
국내 대형 모델이 '눈' 잠금 해제에 성공했습니다.
qingyan 영상통화 기능은 휴대용 영어 번역기로도 변신할 수 있는데, 이는 중국어와 영어 간 즉각적인 번역을 실현하고, 사용자의 환경 정보를 바탕으로 영어 대화를 진행하며, 사용자의 발음과 문법 오류를 교정하는 데 도움을 줍니다. 이 기능의 사용 시나리오에는 여행 중 언제든지 명승지에 대한 이야기 ​​전달, 시각 장애인을 위한 환경 식별 등이 포함됩니다. 또한 과목 숙제 지도 및 면접 지도, 회의록 전체 및 요약 제공, 복잡한 데이터 분석 등을 제공할 수 있습니다. 차트를 작성하고 화면 코드를 실시간으로 해석합니다.
이번 서비스 무역 박람회에서 zhipu ai는 다양한 최신 제품을 전시할 예정입니다. qingyan app의 영상 통화 기능 외에도 ai 생성 영상 기능도 포함되어 있습니다. zhipu는 올해 초 비디오 생성 모델 cogvideox를 출시했으며 zhipu qingyan 앱에서 비디오 생성의 "qingying" 기능을 출시했습니다. qingying은 모든 사용자에게 열려 있습니다. 텍스트를 입력하거나 사진을 업로드하기만 하면 30초 이내에 6초짜리 동영상이 생성됩니다. 올해 7월 qingying은 qingyan 앱을 출시했고 사용자들은 6일 만에 100만 개 이상의 동영상을 생성했습니다.
더페이퍼 장징(zhang jing) 기자
(이 기사는 the paper에서 발췌한 것입니다. 더 많은 원본 정보를 보려면 “the paper” 앱을 다운로드하세요.)
보고/피드백