소식

OpenAI보다 더 성실한 이 기사는 Google 기자 회견의 11가지 주요 내용을 요약합니다.

2024-08-14

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

X에서 한 무리의 사람들이 Brother Strawberry에게 엿먹였습니다.오픈AI정신이 이상할 때 미리보기.

구글은메이드바이구글24기자회견이 왔습니다.

OpenAI는 구글을 저격하기 위해 기자회견이 끝난 후 몇 분 후에 블로그를 게시하기까지 했으며, 심지어 이틀 동안 AI Strawberry가 리들러 역할을 하도록 두었습니다.

현재의 OpenAI는 정말 늑대가 우는 것과 같습니다. 더 이상 기대나 신뢰가 없습니다. 그때마다 나온 욕은 XXX, XX 딱 두 개!

그리고 Google은 아직 아무런 기대 없이도 몇 가지 놀라움을 더하고 있습니다.

11가지 하이라이트를 정리했습니다. 이 글을 읽고 나면 기자간담회 ​​시청이 끝났습니다.

1. Google은 Gemini를 기반으로 Android를 재구성하려고 합니다.

그들은 AI OS라는 단어를 정의했습니다. Google은 AI OS를 모든 사람에게 제공하고 싶어합니다.

현재 200개 이상의 국가 및 지역에서 45개 언어를 지원하며 수십 개의 장치 제조업체의 수백 가지 휴대폰 모델에서 사용할 수 있으며 전 세계 수십억 개의 장치에서 지원됩니다.

2. 제미니의 휴대폰 이미지 인식이 뒤집어졌습니다.

그들이 가장 먼저 시연한 것은 Gemini의 이미지 인식 능력이었습니다.

멀티모달 AI로서 이미지 캡처 인식은 필수 기능으로 포함된 것 같습니다. 사진 인식 능력을 테스트하는 가장 좋은 방법은 촬영 지시, 일정 등 정보 집약적인 콘텐츠일 뿐만 아니라, 텍스트 내용을 이해하고 답변을 제공하는 능력도 필요합니다.

데모하는 분이 사진을 찍어주셨네요종이 콘서트 포스터, 위의 투어 일정. 발표자는 Gemini에게 자신의 일정을 확인하고 Sabrina Carpenter의 쇼에 갈 수 있는 시간을 선택하도록 요청했습니다.

그러나 라이브 데모에는 실수가 있을 수 있으며, 여기에 있습니다.

제미니가 처음 두 번 사진을 찍었는데, 라이브 시연이 당황스럽게 실패하여 태평양을 건너 현장에서 두 번이나 어색함을 느꼈습니다. . . = =

이번 시연에서는 삼성 갤럭시 S24 울트라 휴대폰이 사용됐다는 점도 구체적으로 언급됐다. 삼성이 힘을 쏟고 있는 게 아닐까?

장면을 다른 기기로 바꿔서 다시 시도해 보니 다행히 3번째에도 사진 내용 인식에 성공했습니다.

Gemini는 매우 구체적인 날짜를 직접 제시했습니다. Sabrina가 거기에 있을 것입니다.2024년 11월 9일발표자가 그날 다른 계획이 없으면 샌프란시스코에 도착하여 쇼를 보러 가십시오.

드디어 박수가 시작됐고, 멤버들은 눈에 띄게 안도의 한숨을 내쉬었다.

3. 소프트웨어 간 상호 작용이 매우 편리합니다.

이제 Gemini는 휴대폰에서 직접 비디오 콘텐츠를 이해하고 분석할 수 있습니다.

영상을 시청하는 동안 Gemini에게 전화를 걸어 핵심 내용을 요약하거나 영상 내용에 대한 질문에 답할 수 있습니다.

예를 들어 밤에 유튜브로 음식 영상을 본 뒤 사진을 하나씩 읽어볼 필요 없이 영상에 등장하는 음식 목록이 자동으로 생성돼 사용자의 개인 '시식' 목록에 추가된다. .

미식가들에게 좋은 소식입니다.

또한 YouTube의 일부 여행 동영상에 대한 명소 목록이나 여행 일정 제안을 만들 수 있습니다.

산책할 때도 BGM으로 나와야 하는 사람으로서,

또한 사용자가 설명하는 장면이나 분위기, 활동 유형에 따라 적절한 음악을 추천하는 '서울 산책에 적합한 K-POP 재생목록'을 생성해 달라고 제미니에게 요청할 수도 있습니다.

음악을 더욱 직관적이고 개인적으로 찾을 수 있습니다.

4. 쓰기 속도가 매우 빠르고 효과도 좋습니다.

Gemini는 또한 단 몇 초 만에 휴대폰에서 이메일을 작성하는 데 도움을 줄 수 있습니다.

남동생은 두 가지 시나리오를 보여주었습니다. 첫 번째는 집주인에게 집에서 전원 공급 장치 모듈을 수리하라고 알리는 정중한 알림 편지를 쓰는 것이었습니다.

두 번째는 질병으로 인해 결석한 것에 대해 교수님께 사과 편지를 쓰는 것입니다(이런 일을 예전에도 했던 것 같습니다).

또한 Gemini에는 사용자가 텍스트를 다듬고 이메일을 보낼 수 있는 대화형 디자인도 있습니다.

단 몇 초 만에 제미니가 사과문을 완성하는 모습에 나는 웃음을 참을 수가 없었다.

5. 제미니 라이브 실시간 대화 효과도 나쁘지 않은데, 저지연 TTS만 가능합니다.

Google은 언제든지 중단할 수 있는 GPT4o와 유사한 실시간 대화 기능을 출시했습니다. 이를 Gemini Live라고 합니다.

선택할 수 있는 톤은 10개입니다.

데모걸은 Gemini Live와 오랫동안 대화를 나눴습니다. 음질도 좋고 지연도 충분히 낮지만 실제로는 GPT4o의 기본 다중 모드 대형 모델이 아닌 지연 시간이 짧은 TTS처럼 보입니다.

Google의 소변에 따르면 감정적 이해와 표현이 없기 때문에 분명히 미친 듯이 보여줄 것입니다. 또한 일부 긴 답변에서는 여전히 지연이 분명하게 느껴질 수 있습니다.

따라서 이는 실제로 지연 시간이 짧은 TTS 대화입니다.

현재 Gemini Advanced 가입자에게만 제공되며 한 달에 20달러이며 즉시 이용 가능합니다.

6.Pixel 9은 다중 모드 Gemini Nano가 탑재된 최초의 휴대폰입니다.

이는 휴대폰에 출시된 가장 강력한 온디바이스 AI 모델로, 이전 Pixel 8 Pro에 사용된 AI보다 3배 더 강력합니다.

Pixel 9의 프로세서(TPU 및 Tensor G4)는 이전보다 두 배 빠른 속도로 1초에 최대 45개의 단어를 생성할 수 있습니다.

Pixel 9의 일반 버전에는 12GB의 메모리가 있고 Pro 버전에는 더 많은 메모리가 있어 16GB에 이릅니다. 그리고 가장 흥미로운 점은 마침내 위성 호출 기능이 있다는 것입니다. . .

여기서 제가 말할 수 있는 것은 우리가 훨씬 앞서 있다는 것입니다!

이번에 출시된 제품은 캔디바폰 3종과 폴더블폰 1종이다. 일반 라인업에는 6.3인치 디스플레이를 갖춘 기본 Pixel 9, 6.8인치 화면을 갖춘 Pixel 9 Pro XL, 더 작은 새로운 6.3인치 Pixel 9 Pro가 포함됩니다.

솔직히 말해서 좀 못생겼다고 생각해요. . .

새로운 병풍도 있어요픽셀 9 프로 폴드.

심지어 더 추악합니다. . .

7.통화 메모는 전화 통화 중에 주요 정보를 기록하는 데 도움이 됩니다.

이제 픽셀의 '통화 도우미'가 '통화 메모' 기능을 추가해 더욱 강력해졌습니다.

통화가 끝나면 통화에 대한 완전 비공개 요약이 제공됩니다. 이를 통해 통화 중에 펜과 종이가 없더라도 전화번호, 시간, 세부 정보 및 잊어버리고 싶지 않은 기타 정보에 쉽게 액세스할 수 있습니다.

또한 이 프로세스는 모두 로컬에서 실행되므로 기본적으로 개인 정보 보호 문제가 없습니다.

남자아이는 최근 머리 스타일을 바꿔볼까 고민 중인데 이발사가 원하는 머리 스타일을 해주지 못해서 다른 이발소를 추천해 주었습니다.

그런데 문제는 그가 그 가게의 전화번호를 적는 것을 잊어버렸다는 것이다. 통화 메모를 사용하면 쉽게 추적할 수 있습니다.

7. 리콜과 유사한 스크린샷 기능이 좀 이상합니다.

누구나 익숙하게 아는 장면이 있습니다. 휴대전화에서 기억하고 싶은 내용을 본 경우, 마음 속에 적어두거나 스크린샷을 찍어 저장할 수도 있습니다.

하지만 기억하고 싶은 내용을 잊어버리거나 필요할 때 찾지 못하는 경우가 많습니다.

그런 다음 그들은 새로운 제품을 만들었습니다.

AI를 활용해 저장된 모든 사진을 빠르게 검색할 수 있습니다. 예를 들어 휴대폰에 자전거 사진이 수십 장 있는데, 자전거를 검색하면 다 나옵니다.

티셔츠 가격 같은 좀 더 복잡한 질문도 할 수 있는데, Pixel Screenshot이 원본 이미지를 찾아줬을 뿐만 아니라, 이미지에 담긴 정보를 바탕으로 자연어로 답변을 제공해주는 걸 볼 수 있었습니다.

8. 일반 로컬 AI 드로잉 Pixel Studio.

모든 Pixel 9 휴대전화에는 휴대전화 최초의 이미지 생성기인 새로운 Pixel Studio가 함께 제공됩니다.

효과는 그냥 평범하고 쓸만한 수준인 것 같아요.

예를 들어, 해질녘의 해변 모닥불 구덩이는 매우 평범하게 느껴집니다.

9. AI 카메라는 단체 사진 촬영에 좋습니다.

픽셀 카메라는 최초의 AI 카메라라고 합니다.

대부분의 매개변수를 이해하지 못하지만 이 사진 장면은 매우 흥미롭습니다.

단체 사진을 찍지 못하는 경우가 많고, 사진을 찍고 싶어하는 친구도 늘 있습니다.

간단한 화면 인터페이스를 사용하여 사진 촬영 과정을 안내합니다. 예를 들어 카메라를 다른 사람에게 건네주어 장소를 바꿀 수 있습니다. 그런 다음 첫 번째 사진의 윤곽선을 기준으로 새 사진의 인물을 정렬하고 다른 사진을 찍을 수 있습니다. 결과 이미지는 두 사진을 결합하여 모든 사람이 동시에 같은 사진 속에 있는 것처럼 보이게 합니다.

매우 멋지고 사진 촬영 시 주요 문제점을 해결해 줍니다.

10. 새로운 시계와 헤드폰.

Pixel Watch 3를 보냈습니다.

헤드폰 Pixelbuds Pro 2 1개

헤드셋은 언제든지 Gemini를 깨우고 그와 대화할 수 있습니다.

11. GPT4o의 Project Aster를 비교하세요.

Project Aster는 몇 달 전 Google 컨퍼런스에서 공개되었으며 GPT4o의 기본 다중 모드 대형 모델을 직접 벤치마킹했습니다.

이제 Gemin Live에서는 앞으로도 사용하실 수 있습니다과.

예를 들어, 제미니와 대화하면서 카메라를 공유할 수 있어 미적분학 숙제에서 겪었던 문제를 직접 자랑할 수도 있고, 가구 조립의 다음 단계에 도움을 요청할 수도 있습니다.

그리고 가장 많이 사용하는 앱이 Gemini Live에 통합되어 있어 대화와 메시지에서 조치를 취하고 Google 캘린더와 같은 앱에서 정보를 가져오는 데 도움이 될 수 있습니다.

따라서 다른 앱을 열지 않고도 Gemini Live에서 바로 이웃에게 문자 메시지를 보내고, 비즈니스에 대한 세부 정보를 공유하고, 캘린더를 확인할 수 있습니다.

GPT4o + Apple의 조합이라니 좀 멋지네요.

안타깝지만 아직 케이크입니다.

AI 측면에서 보면 Gemini Live는 적어도 미래가 아니며 현재 사용할 수 있다는 점에서 매우 흥미롭습니다.

케이크만 그릴 수 있는 OpenAI보다 여전히 훨씬 낫습니다.

Google이 점점 더 좋아지고 OpenAI를 죽이기를 바랍니다.

이제 읽어보셨으니 괜찮다고 생각하시면 좋아요, 시청, 3번 리트윗 부탁드립니다. 빨리 알림 받고 싶으시다면 별점을 눌러주세요⭐ ~제 글을 읽어주셔서 감사합니다. 다음에 또 만나요.

>/ 저자: Kazik, Wenwen, Xiaorui, Dawn_E