16 травня 2024 14:02

Нові ШІ-продукти та оновлення Gemini від Google — головне з Google I/O 2024

Автор

Артур Гмиря

На щорічній коференції, присвяченій розвитку технологій, Google I/O, компанія представила нові інструменти на базі штучного інтелекту та продемонструвала оновлений конкурент ChatGPT – Gemini. Проте виступ техногіганта виглядав не так переконливо, як нещодавня презентація від OpenAI.

SPEKA розповідає, що вдалося компанії, а що поки залишається прототипом.

Що нового Google представила з використанням ШІ на Google I/O

Головним помічником в Android може стати Gemini, яка тепер підтримує повноцінний діалог із співрозмовником та запам’ятовує попередні фрагменти розмови. Через це Google Assistant можуть закрити як проєкт.
Google додає в пошук штучний інтелект. Gemini вже показує повністю згенеровані штучним інтелектом відповіді на більшість пошукових запитів у верхній частині сторінки для користувачів із США.
Google Photo аналізуватиме контекст фотографій. Можна буде не тільки шукати зображення за описом знятого, але й робити тематичні добірки за запитом.
Тепер Gmail надаватиме витяги з електронних листів, а також можна буде об’єднати кілька листів і створити з них зведення.

Повна трансляція Google I/O 2024

Які нові можливості оновлення Gemini до 1.5 Pro

Працює не тільки з текстом, але й кодом, зображеннями та іншими видами контенту
ШІ для освіти: система каталогізує та пояснює навчальний матеріал, у тому числі на побутових прикладах.
Аналіз PDF-файлів до 1500 сторінок або відео тривалістю до 1 години.
Можливість генерації відео за запитом. Наразі тривалість до 1 хв, а система поки недоступна для використання.

Також у компанії повідомили, що вони тестують можливість людей ставити запитання у форматі відео під час пошуку. Google показав, як хтось знімає зламаний програвач, запитуючи, чому він не працює. Пошуковик знайшов модель програвача та припустив, що він міг бути несправним через неправильне балансування.

Google Veo, Imagen 3 та Audio Overviews

Зображення створені за допомогою Imagen 3

Ще Google анонсував «найпотужнішу» модель створення відео під назвою Veo, яка, за її словами, генерує високоякісні відео з роздільною здатністю 1080p, тривалістю понад 60 секунд, у різних стилях. Процес відбувається на базі Imagen 3, іншої нейромережі, покликаної створювати зображення за текстовим запитом.

Але повноцінного доступу до цих продуктів користувачі наразі не отримають. За словами представників компанії, інструменти будуть доступні для окремих творців у понеділок і з’являться на Vertex AI, платформі машинного навчання Google. Щодо Imagen 3, то доступ лише за заявками та наявний не для всіх країн.

Компанія також продемонструвала Audio Overviews – здатність генерувати аудіообговорення на основі введення тексту. Наприклад, якщо користувач завантажує план уроку, чат-бот може озвучити його короткий зміст.

Що таке один із найамбітніших проєктів Google наразі Astra, читайте в матеріалі Speka.