2024-08-14
한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina
Jin Lei는 Aofei Temple 출신입니다.
Qubits 공개 계정 QbitAI
롤오버, 큰 롤오버.
오늘 이른 아침, Google 버전의 Her—제미니 라이브공식적으로 출시되었습니다.
결국 기술계의 주목을 받았다고 할 수 있는 OpenAI의 GPT-4o에 대한 벤치마크인 것은 분명하다.
공식 홈페이지에 공개된 데모에서는사진Q&A함수의 효과는 다음과 같습니다.
구현되는 일반적인 기능은 휴대폰을 사용하여 콘서트 포스터 사진을 찍고 Gemini가 사용자의 캘린더를 확인하여 일정이 참여에 적합한지 확인하는 것입니다.
그리고 이를 기반으로 정해진 시간에 요금을 확인하는 등 일련의 후속 작업을 수행할 수도 있습니다.
그런데... 기자간담회 현장 시연회에 이르러서는 그림의 스타일이 완전히 바뀌었습니다.
VCR을 시청해 주세요:
영상 주소: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
흠... 남동생의 표정은 육안으로 볼 때 약간 당황한 것 같습니다.
잘 알려진 기술 미디어인 TechCrunch에도 다음과 같은 이모티콘이 포함되어 있습니다.
일부 네티즌들은 핫댓글 모드를 켜기도 했다.
10초 안에 내 캘린더를 검색할 수 있어요.
물론 오늘은 Made by Google의 작은 에피소드에 불과합니다.
Gemini Live에 대한 자세한 내용을 보려면 아래를 계속 읽어보세요.
방금 언급했듯이 Gemini Live와 GPT-4o의 기능은 매우 유사합니다.
'사진 Q&A' 외에도 실시간 대화를 진행할 수 있으며 답변 과정에서 제미니를 방해할 수도 있습니다.
Gemini Live의 기능은 현재 Android 시스템(영어로만 제공)의 고급 가입자에게 열려 있는 것으로 이해됩니다.
앞으로 몇 주 안에 이 기능은 더 많은 언어로 확장되고 iOS에서도 제공될 예정입니다.
존재하다대화 소리한편, 제미니 라이브(Gemini Live)가 론칭됐다.10종새로운 사운드를 선택할 수 있으며 효과는 다음과 같습니다.
영상 주소: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
존재하다작동하다반면 Gemini는 시스템에 완전히 통합되어 있으므로 전원 버튼을 길게 누르거나 "Hey Google"이라고 말하기만 하면 호출할 수 있습니다.
예를 들어 이메일을 작성할 때 Gemini를 사용하면 일치하는 그림을 생성할 수 있습니다. 효과는 다음과 같습니다.
하지만 외신들은 이 기능에 대해 엇갈린 평가를 내놓고 있다.
예를 들어, The Verge의 한 작가는 다음과 같이 썼습니다.개인 테스트나중에 붙여진 제목은——
Gemini Live는 Google보다 빠르지만 더 어색합니다.
구체적인 이유는 저자의 자동차 오디오 시스템이 3일간의 자동차 여행 중에 갑자기 고장이 났기 때문이다.
기존 Google 어시스턴트를 사용하여 솔루션을 찾는 데는 최소 5분이 걸렸지만 Gemini Live는 15초밖에 걸리지 않았습니다.
하지만 대화 중 제미니 라이브의 계속되는 발언과 사용자가 적극적으로 끼어들도록 요구하는 인터랙션 방식은 작성자를 당황하게 만들었다.
그는 믿는다:
목소리나 말하는 방식이 너무 인간적이라 말을 가로막는 게 불편해요.
문제 해결 도구로 사용하는 것보다 Gemini Live와 상호 작용하는 데 더 많은 감정이 투자됩니다.
공교롭게도 Gemini Live in에서는클라우드에서 실행월스트리트저널도 이 점에 대해 날카로운 평가를 내놨다——
대화의 진행, 기능의 퇴보.
기술적인 측면에서 보면 GPT-4o는 엔드투엔드 시스템이지만, 구글이 공개한 콘텐츠로 볼 때 Gemini Live는 그렇지 않습니다.
대신 STT, VAD, LLM 및 TTS 시스템이 통합되었습니다.
또한 Gemini Live는 Google이 출시하는 새로운 Pixel 시리즈 휴대폰에도 등장합니다.
Pixel 9 Pro Fold, Pixel 9, Pixel 9 Pro 및 Pixel 9 Pro XL이 포함됩니다.
AI 기능 측면에서 구글의 픽셀폰에는 '인공지능(AI)'이라는 기능이 추가됐다.“나를 추가해”기능.
증강 현실(AR)과 AI 기술을 사용하여 서로 다른 두 사진의 캐릭터를 함께 "채울" 수 있습니다.
이번 Google의 Gemini Live 출시는 OpenAI GPT-4o에 대한 대응이지만, 대형 모델 시대가 시작된 이래로 매우 분명한 추세를 볼 수 있습니다.
Google은 OpenAI를 따라잡을 수 없습니다.
첫째, OpenAI가 ChatGPT 출시의 가장 중요한 시점에서 선구자가 되었지만, Google은 이후에 이번에 Gemini Live와 매우 유사한 Bard를 출시한 뒤 전복되었습니다.
지난 1년 반 동안 OpenAI가 모든 주요 모델과 애플리케이션 출시를 주도한 것으로 보입니다.
반면, 구글에서는 여론 측면에서도 기술의 발전 속도가 느린 편일 뿐만 아니라, OpenAI가 인사 변화(일리아 사임) 소식으로 구글의 최대 연례 행사인 I/O 컨퍼런스를 무색하게 만들었다.
그렇다면 대형모델 시대에 구글은 왜 실패하는가?
이와 관련하여,전 구글 CEOEric Schmidt(2001년부터 2011년까지 봉사)는 스탠포드에서의 최근 연설에서 자신의 견해를 다음과 같이 표현했습니다.
Google은 직원들이 재택근무를 허용하는 등 일과 삶의 균형을 매우 중요하게 생각합니다.
하지만 스타트업에서는 정말 열심히 일해요.
영상 주소: https://mp.weixin.qq.com/s/90pixdMaLew4lUjzjeA6jA
일부 네티즌들은 이 소식을 전하기도 했습니다.
내 동생은 Google의 최고 AI 프로그래머입니다. 그는 3개의 정규직을 갖고 있으며 하루에 2시간만 Google에서 보냅니다.
이에 대해 어떻게 생각하시나요? 댓글 영역에 메시지를 남겨 토론해 보세요.
참조 링크:
[1]https://x.com/techcrunch/status/1823410187404743131?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[2]https://x.com/Google딥마인드/상태/1823409674739437915
[3]https://blog.google/products/gemini/made-by-google-gemini-ai-updates/
[4]https://x.com/alexkehr/상태/1823480786349383879?s=46&t=6eepxw1G6XRQ7VO0ANjJWg
[5]https://www.theverge.com/2024/8/13/24219736/제미니-라이브-핸즈-온-픽셀-이벤트
[6]https://blog.google/products/pixel/google-pixel-9-new-ai-features/#pixel9phones