Що таке Google DeepMind?

DeepMind може відноситися до двох речей: технологія, що лежить в основі проекту Google зі штучного інтелекту (ШІ), і компанія, яка за це відповідає. Компанія DeepMind є дочірньою компанією Alphabet, материнської компанії Google.


Технологія штучного інтелекту DeepMind знайшла своє застосування в безлічі проектів і пристроїв Google. Якщо ви використовуєте Google Home або Google Assistant, то ваше життя якимось чином вже перетиналося з DeepMind.

Як і чому Google придбав DeepMind?

DeepMind був заснований в 2011 році з метою «вирішення проблеми інтелекту, а потім використовувати його для вирішення всього іншого». Засновники вирішили проблему машинного навчання, використовуючи ідеї з області нейробіології. Їхня мета полягала в тому, щоб створити потужні універсальні алгоритми, які могли б вчитися і перепрограмувати себе, а не програмувати вручну людьми.

Кілька гравців в області ШІ були вражені талантом команди DeepMind. У 2012 році Facebook зробив п'єсу, щоб придбати компанію. Ця угода зазнала краху, але Google у 2014 році придбав DeepMind приблизно за 500 мільйонів доларів. Потім DeepMind став дочірньою компанією Alphabet під час корпоративної реструктуризації Google в 2015 році.

Основною причиною покупки DeepMind компанії Google став початок програми штучного інтелекту. Поки головний кампус DeepMind залишався в Лондоні, Англія, прикладна команда була відправлена в штаб-квартиру Google в Маунтін-В'ю, штат Каліфорнія. Ця команда повинна була працювати над інтеграцією DeepMind AI з продуктами Google.

Що Google робить з DeepMind?

Мета DeepMind щодо вирішення проблеми не змінилася, коли він передав ключі Google. Тривала робота з глибокого навчання, яка є типом загальної програми машинного навчання. Це можна порівняти з більш ранніми ШІ, такими як комп'ютер Deep Blue, який у 1996 році класно переміг гросмейстера з шахів Гарі Каспарова. Такі комп'ютери досягли успіху в завданнях, специфічних для домену, але були мінімально корисні за межами цих доменів. DeepMind, з іншого боку, був розроблений, щоб вчитися на власному досвіді.

Штучний інтелект DeepMind навчився грати у відеоігри типу Breakout краще, ніж кращі люди. У 2016 році програма на основі DeepMind під назвою AlphaGo перемогла гравця Go, який став чемпіоном світу, і стала важливою віхою в тому, що го набагато складніше, ніж шахи. На додаток до чистих досліджень Google інтегрував DeepMind AI в свої провідні пошукові і мобільні пристрої, включаючи Google Home і Android.

Як Google DeepMind впливає на ваше повсякденне життя?

Інструменти глибокого навчання DeepMind були реалізовані у всьому спектрі продуктів і послуг Google. Якщо ви використовуєте Google, є велика ймовірність, що ви якимось чином взаємодіяли з DeepMind.

Деякі з найбільш відомих застосувань DeepMind AI включають розпізнавання мови, розпізнавання зображень, виявлення шахрайства, ідентифікацію спаму, розпізнавання рукописного введення, переклад, перегляд вулиць Google Maps і локальний пошук.

Надточне розпізнавання мови від Google

Розпізнавання мови, або здатність комп'ютера інтерпретувати усні команди, існує вже давно. Віртуальні помічники, такі як Siri, Cortana, Alexa і Google Assistant, наблизили функціональність до нашого повсякденного життя.

У разі технології розпізнавання голосу Google, глибоке навчання було розгорнуто з великим ефектом. Машинне навчання дозволило технології розпізнавання голосу Google досягти вражаючого рівня точності для англійської мови до такої міри, що він так само точний, як і слухач.

Якщо у вас є якісь пристрої Google, такі як Android Phone або Google Home, це безпосередньо впливає на ваше життя. Кожен раз, коли ви говорите «Добре, Google», після чого виникає питання, DeepMind напружує свої сили, щоб допомогти помічнику Google зрозуміти, що ви говорите. На відміну від Alexa Amazon, який використовує вісім мікрофонів для розуміння голосових команд, для системи розпізнавання голосу Deep Home від Google Home потрібно тільки два.

Google Home і помічник з генерації голосу

Традиційний мовний синтез використовує те, що називається конкатенацією перетворення тексту на мовлення (TTS). Коли ви взаємодієте з пристроєм, який використовує цей метод синтезу мовлення, він звертається до бази даних, повної фрагментів мовлення, і збирає їх у слова та речення. Це призводить до дивно спотвореної мовленнєвої структури, і зазвичай ясно, що говорить не людина.

DeepMind зайнявся створенням голосу за допомогою проекту під назвою WaveNet, який повинен був зробити штучно створені голоси більш природними. WaveNet використовує зразки реальної людської мови, але не використовує зразки для синтезу нових голосів. Замість цього він аналізує зразки людської мови, щоб дізнатися, як працюють необроблені звукові сигнали. Це дозволяє програмі говорити різними мовами, використовувати акценти або навіть навчатися звучати як конкретна людина. На відміну від інших систем TTS, WaveNet генерує неречеві звуки, такі як дихання і чмокання доль, щоб створити ще більш реалістичний вокальний профіль.

Якщо ви хочете почути різницю між голосом, створеним за допомогою конкатенуючого перетворення тексту на промову, і голосом, згенерованим WaveNet, у DeepMind є кілька цікавих зразків голосу, які ви можете прослухати.

Глибоке навчання і пошук картинок Google

Без штучного інтелекту пошук зображень залежить від контекстних підказок, таких як теги, сусідній текст та імена файлів. За допомогою інструментів глибокого навчання DeepMind Google Image Search зміг дізнатися, як виглядають різні люди і об'єкти, дозволяючи вам шукати свої власні зображення і отримувати релевантні результати без необхідності позначати що-небудь.

Наприклад, якщо ви шукаєте «собака», Google буде відображати зображення вашої собаки, яку ви взяли, навіть якщо ви ніколи не відзначали їх. Це тому, що він зміг дізнатися, як виглядають собаки, майже так само, як люди дізнаються, як виглядають речі. І, на відміну від одержимого собаками Google Deep Dream, він більш ніж на 90 відсотків точніше ідентифікує всі види різних зображень.

DeepMind в Google Lens і візуальному пошуку

Одним з найбільш приголомшливих досягнень DeepMind є Google Lens, система візуального пошуку, яка дозволяє вам сфотографувати об'єкт в реальному світі і миттєво отримати інформацію про нього.

Хоча реалізація відрізняється, це схоже на те, як глибоке навчання використовується в пошуку картинок Google. Коли ви робите знімок, Google Lens може подивитися на нього і з'ясувати, що це таке. На підставі цих даних він може виконувати різні більш складні дії.

Наприклад, якщо ви зробите знімок відомого орієнтира, він надасть вам інформацію про орієнтир. Якщо ви сфотографуєте місцевий магазин, він може отримати інформацію про цей магазин. Якщо на зображенні вказано номер телефону, Google Lens може розпізнати інформацію і дати вам можливість зателефонувати за цим номером.

logo

Follow us