구글: 안드로이드 폰, 내 말을 들어보세요. AI가 해야 할 일

구글: 안드로이드 폰, 내 말을 들어봐, AI가 이 일을 해야 해

2024-08-14

작성자 |
편집하다 징규 |

Google은 Apple보다 한 달 앞서 새로운 Pixel 휴대폰에서 AI+ 휴대폰의 모든 가능성을 시연했습니다.

구글은 현지시간 8월 13일 픽셀9, 픽셀9 프로, 2세대 폴더블폰 픽셀9 폴드, 스마트워치, 헤드폰 등 새로운 하드웨어 제품을 출시했다. 하드웨어에 비해 사람들은 AI+ 휴대폰이 인기를 끄는 상황에서 안드로이드 시스템의 관리자인 구글이 안드로이드 휴대폰에 온디바이스 AI를 어떻게 활용할 것인지에 대해 더 우려하고 있습니다.

거의 10개월 전에 Google은 1세대 AI 휴대폰을 출시했습니다. 이제 1년도 채 되지 않아 이 거대 기업은 Gemini, Android 및 Pixel의 제품 포트폴리오를 다시 한 번 업데이트했습니다. 경쟁자가 있습니다." "모델.

OpenAI가 ChatGPT 음성 모드를 출시하고 애플의 차세대 아이폰의 AI 기능이 공개된 이후, 구글은 AI 음성 대화, 스크린샷 정보 검색 등 경쟁사가 할 수 있는 일에서 뒤처지지 않을 것이다. 동시에 Google은 AI를 자체 애플리케이션 생태계에 더욱 통합하고 있습니다.

구글이 애플과 경쟁해야 할 AI 휴대폰의 선두주자는 누구인가?

OpenAI에 대응하여,

제미니 라이브가 온라인 상태입니다

Gemini는 Google의 다양한 AI 제품의 초석이자 Google Pixel 9 시리즈 휴대폰의 기본 비서입니다. Gemini가 휴대폰에 통합되었을 때 어떤 업그레이드가 이루어졌는지가 이번 컨퍼런스의 주요 초점이었습니다.

Google Pixel 휴대폰의 Gemini는 전원 버튼을 눌러 소환할 수 있습니다. Google 경영진에 따르면 오늘부터 사용자는 화면에 표시된 내용에 대해 질문하기 위해 사용하는 앱 위에 Gemini 오버레이를 불러올 수 있습니다. 예를 들어 사용자는 시청 중인 YouTube 동영상에 대해 질문할 수도 있고 Gemini의 오버레이에서 직접 이미지를 생성하여 Gmail 및 Google 메시지와 같은 앱에 끌어서 놓을 수도 있습니다.

구글은 또한 "향후 몇 주 안에" 캘린더, 킵(Keep), 유튜브 뮤직(YouTube Music) 등 더 많은 앱에 Gemini를 연결할 계획이다. 구체적인 기능으로는 Gemini에게 "90년대 후반을 생각나게 하는 노래의 재생목록을 만들어달라"고 요청하는 것, "콘서트 전단지 사진을 찍고 Gemini에게 그날 이용 가능 여부를 확인해달라고 요청하는 것, 심지어 티켓 구매 알림을 설정하도록 요청하는 것"이 있습니다. Gmail에서 레시피를 찾아 Keep의 쇼핑 목록에 재료를 추가해 달라고 요청하세요."

Gemini는 스크린샷을 사용하여 정보를 추출하고 더 많은 앱과 상호작용합니다. 이미지 출처: Google |

이러한 통합 경험 외에도 Google은 공식적으로 Gemini Live도 출시했습니다. 이 기능은 OpenAI가 출시한 GPT-4o 고급 음성 모드에 대한 Google의 대응이라고 할 수 있습니다. 이 기능은 이전에 Google의 2024 I/O 개발자 컨퍼런스에서 공개되었으며 오늘 공식적으로 출시될 예정입니다.

사용자는 휴대폰을 사용하여 Google의 생성 AI 챗봇인 Gemini와 음성 대화를 할 수 있으며, 중간에 중단하고 후속 질문을 할 수 있으며, 언제든지 대화를 일시 중지하고 재개할 수 있습니다. 구체적인 용도의 몇 가지 예에는 Gemini Live를 동행하여 취업 면접을 준비하고, 연설을 연습하고, 관심 있는 주제에 대해 자연스럽게 대화하는 것이 포함됩니다.

Gemini Live는 분명히 GPT-4o의 음성 상호 작용을 벤치마킹하는 것을 목표로 하고 있습니다. │이미지 출처: Google

그렇다면 Gemini Live는 ChatGPT의 음성 모드에 비해 장점이 있나요?

Live - Gemini 1.5 Pro 및 Gemini 1.5 Flash를 지원하는 생성 AI 모델 아키텍처는 평균보다 긴 "컨텍스트 창"을 가지고 있다고 합니다. 이는 응답을 생성하기 전에 대량의 데이터를 처리하고 추론할 수 있음을 의미합니다. 이론 대화는 몇 시간 동안 지속될 수 있습니다.

Gemini Live는 또한 핸즈프리로 작동하므로 사용자는 앱 백그라운드에서 또는 전화기가 잠겨 있을 때 음성 대화를 계속할 수 있으며 선택할 수 있는 10개의 새로운 음성이 있습니다.

하지만 제미니 라이브는 '올해 말' 출시 예정인 '멀티모달 입력' 기능을 아직 출시하지 않았다는 점에 주목할 필요가 있다.

몇 달 전 구글은 휴대폰 카메라로 촬영한 사진과 영상을 통해 제미니 라이브가 어떻게 사용자 주변을 인식하고, 고장난 자전거 부품을 지적하거나 컴퓨터 화면에서 무슨 일이 일어나고 있는지 설명하는 등 반응하는 모습을 담은 사전 녹화 영상을 공개한 바 있다. . 코드의 기능 중 어느 것도 실시간으로 시연되지 않았습니다.

또한 Gemini Live는 Android 휴대폰의 Gemini Advanced 가입자가 사용할 수 있으며 무료가 아닙니다. 현재는 영어로만 제공되지만 Google은 "향후 몇 주 내에" 더 많은 언어로 확장하고 앱을 통해 iOS로 확장할 것이라고 밝혔습니다.

구글 임원 생방송 시연 Gemini Live │이미지 출처 : Google

Google Gemini 경험 및 Google 어시스턴트 임원은 "Google은 AI 기반 어시스턴트가 유용할 수 있는 방법을 탐색하는 초기 단계에 있으며 Pixel 휴대폰과 마찬가지로 Gemini도 점점 더 좋아질 것입니다."라고 말했습니다.

또한 개인 정보 보호 문제와 관련하여 Google Android 생태계의 경영진은 Gemini가 수십 개의 기기 제조업체의 수백 가지 휴대폰 모델을 지원하며 사용자 데이터를 처리할 때 데이터가 휴대폰 외부로 유출되지 않는다고 말했습니다.

"Gemini는 개인 트레이너가 보낸 이메일을 기반으로 일일 운동 계획을 세우거나 Google 드라이브에 있는 이력서를 사용하여 직업 프로필을 작성하는 데 도움을 줄 수 있습니다. Gemini만이 이 안전한 올인원 방식으로 모든 작업을 수행할 수 있습니다. Google의 Android 생태계 사장인 Sameer Samat는 "데이터는 사용자가 모르거나 신뢰할 수 없는 제3자 AI 제공업체에 전달됩니다."라고 말했습니다.

"Android는 Gemini Nano라고 불리는 대규모 온디바이스 다중 모드 AI 모델을 갖춘 최초의 모바일 운영 체제이기 때문에 가장 민감한 사용 사례를 처리하는 동안 데이터가 휴대폰 외부로 유출되지 않습니다."

AI가 Android에 추가로 통합되었습니다.

AI 휴대폰을 홍보하는 데 있어 Google의 가장 큰 장점은 의심할 여지 없이 다양한 애플리케이션 도구와 Android 생태계입니다. Google은 현재 수십억 명의 Android 사용자를 보유하고 있으며 챗봇 애플리케이션보다 더 많은 공간이 있다는 것은 분명합니다.

지난해 구글의 픽셀 8 시리즈는 최초의 AI 중심 스마트폰으로 다양한 AI 기능을 탑재했다. 예를 들어, 사용자는 사진의 개별 요소를 제거, 이동 또는 편집하고, 사진 간에 표현을 이동하여 최상의 합성 사진을 얻고, 스크린샷이나 화면의 "원 부분"을 기반으로 검색하는 등의 작업을 수행할 수 있습니다.

이러한 모든 기능은 Pixel 8 시리즈에 처음 등장한 이후 Android 생태계 전체로 확산되었습니다.

구글의 '서클 검색' 기능은 실제로 삼성전자 갤럭시 AI폰에 처음 등장했다. 구글의 안드로이드 생태계 파트너인 삼성전자 휴대폰에도 유사한 AI 기능이 많이 추가됐다. 앞서 언급한 AI 비서 제미니는 삼성 갤럭시 Z 폴드6, 모토로라 레이저+ 등 휴대폰에도 등장한다.

동시에 다른 제조업체들도 자체 휴대폰 AI를 출시하겠다고 발표했습니다. 지난 몇 달 동안 가장 주목을 받은 것은 자체 애플리케이션 생태계를 통합하는 것입니다.

거의 1년 만에 'AI 휴대폰'은 구글 휴대폰뿐만 아니라 휴대폰을 바라보는 시장의 관점의 핵심 관점이 됐다고 할 수 있다. AI를 사용하여 사람들을 빛나게 만드는 방법은 Google의 과제입니다. 현재 구글이 1세대 AI폰 픽셀8을 출시했을 때와 마찬가지로 여전히 다양한 AI 기능 기기들이 가장 많이 생산되고 있다.

올해 Made By Google 이벤트에서 Google의 새로운 주요 AI 기능은 다음과 같습니다.

'Add Me'를 사용하면 사진을 찍는 사람도 단체 사진에 자신을 포함시킬 수 있습니다.
Apple의 곧 출시될 Image Playground 앱과 매우 유사한 AI 이미지 생성기인 "Pixel Studio"
사용자 갤러리에서 스크린샷을 검색하여 쉽게 검색할 수 있는 데이터베이스로 변환하는 "픽셀 스크린샷"
"통화 메모"는 통화 기록에 정보 요약을 저장할 수 있습니다. 이 기능을 활성화하면 통화 중인 모든 사람에게 알림이 전송됩니다.

그 중 'Add Me' 기능을 구현하려면 먼저 사진작가가 본인 없이 사진을 찍은 뒤, 다른 사람이 사진작가가 되어 또 다른 사진을 찍는다. Pixel은 두 장의 사진을 병합하여 모든 사람이 한 장의 사진에 포함되도록 하므로 낯선 사람에게 사진을 찍어달라고 요청할 필요가 없습니다.

단체 사진 기능｜이미지 출처 : Google

구글이 픽셀9 시리즈에 포지셔닝한 주요 셀링 포인트 역시 AI 카메라다. 자칭 '세계 최초의 AI 기반 카메라'다. 구글 경영진도 “픽셀은 사진과 영상에 나이트사이트(Night Sight) 기능을 사용한 최초의 휴대폰”이라며 “이제 저조도 환경에서도 멋진 파노라마 풍경과 도시 경관을 담아내는 최초의 휴대폰”이라고 밝혔다. Pixel 9 Pro XL로 촬영한 사진을 Apple의 iPhone 15 Pro Max와 비교했습니다.

구글 휴대폰 vs 애플 휴대폰 야간 사진효과│출처: 구글

초대형 화면 폴더블 픽셀9 프로 폴드에는 사용자의 시선을 끌고 카메라를 향해 미소를 짓게 만드는 '메이드 유 룩(Made You Look)' 기능도 탑재됐다. 이 기능을 사용할 때 휴대폰을 펼치면 외부 화면 한쪽에 밝은 노란색 닭이나 기타 재미있는 애니메이션 등 눈길을 끄는 시각적 애니메이션이 재생됩니다.

사용자의 관심을 끄는 화면 특징 │이미지 출처 : Google

사진을 찍은 후에는 사진 편집 도구도 있으며 Google 포토의 Magic Editor는 올해 몇 가지 새로운 기능을 출시했습니다. 예를 들어, 기울어진 사진의 각도를 보정하는 데는 "오토 프레임" 기능이 사용되며, 생성 AI를 사용하여 피사체 주변의 틈을 채워 더 넓은 시야를 만듭니다. 텍스트 상자에 원하는 효과를 설명한 후, 땅에 있는 풀을 야생화로 바꾸거나, 특정 부분에 열기구를 추가하는 등 생성 AI를 사용하여 P-그림을 만들 수 있는 '재상상' 기능도 있습니다. 하늘 등등

또한 Google은 Apple의 뒤를 이어 긴급 상황에 사용할 수 있는 '위성 SOS' 기능을 출시했습니다. 이 기능을 사용하면 휴대전화 서비스가 없을 때 긴급구조대에 연락하고 위치 정보를 공유할 수 있습니다. Google 경영진에 따르면 Pixel 9 시리즈는 "위성 SOS를 사용할 수 있는 최초의 Android 휴대폰"이 될 것입니다.

위성 SOS 기능｜이미지 출처 : Google

기능적인 관점에서 볼 때, Pixel 9+ Gemini의 조합은 AI 측면에서 현재 국내 Android 제조업체를 크게 앞서지 않습니다. 그러나 Apple과 달리 Google은 자체 시스템과 터미널은 물론 대형 모델과 클라우드 컴퓨팅을 보유하고 있으며 현재 모든 회사 중에서 "소프트, 하드 및 클라우드 컴퓨팅"에서 진정으로 폐쇄 루프를 완성한 유일한 회사라는 점에 유의해야 합니다. 코어 클라우드".

일단 터미널 AI에 획기적인 발전이 이루어지면, 모든 것에 준비가 되어 있는 구글은 경쟁사보다 "다시 위대하게 만들" 가능성이 훨씬 더 큽니다.

아마도 구글에게 부족한 것은 단지 더 큰 야망일 뿐일 것입니다.

*헤더 이미지 출처 : Google

이 기사는 Geek Park의 원본 기사입니다. 재인쇄를 원하시면 WeChat geekparkGO에서 Geek Jun에게 문의하세요.

소식

구글: 안드로이드 폰, 내 말을 들어봐, AI가 이 일을 해야 해

소개

내 연락처 정보