Детально про перший прикладний голосовий інтерфейсі Siri
Голосові інтерфейси перетворюються з технологічної іграшки на прикладний інструмент взаємодії з електронікою.
В 1987 році Apple Computers випустила короткометражний рекламно-фантастичний фільм, у якому відобразила своє бачення найближчого майбутнього. Короткий його сюжет: зайшовши у свій кабінет, парубок розкриває на столі комп’ютер із сенсорним екраном, який більше нагадує книгу (а за розміром — MacBook Air 11), і починає спілкуватися з ним, даючи голосові команди. Комп’ютер негайно їх виконує.
За сюжетом надворі вересень 2011 року. Пророцтво здійснилося із запізненням на місяць: у жовтні було представлено iPhone 4S, а головна його цікавинка — технологія Siri. На перший погляд може здатися, що це просто ще одна система керування голосом, яких уже створено чимало. Насправді ж це саме ваш персональний асистент (або, як його назвала компанія Apple, Personal Intelligent Assistant), що дає можливість не просто керувати смартфоном, а фактично спілкуватися з ним.
Siri дуже глибоко інтегрована в iOS. Вона взаємодіє з усіма системними додатками. З її допомогою можна подорожувати Інтернетом, створювати текстові нотатки та електронні листи, управляти музикою й контактами, з’ясовувати стан справ на біржі й поточний прогноз погоди, працювати з картами місцевості й багато чого іншого.
Робота з телефоном більш схожа на діалог. Зовсім не треба запам’ятовувати команди, зрозумілі системі. Можна запитувати так, наче перед вами людина. Хочете знати погоду на завтра? Просто запитайте: надворі холодно? або: мені надягати плащ? Хочете залишити нагадування на завтра? Скажіть про це Siri.
Навіть якщо ви забудете повідомити систему, про що саме треба нагадати, вона сама перепитає вас про це. Запитаєте: «де я?» — і знатимете ваші координати. Потрібно таксі? Просто повідомте про це Siri, і вона зробить все інше сама (на жаль, таке можливе тільки в країнах, де є відповідні сервіси, тобто як завжди — не в нас). І звичайно ж, Siri можна використовувати для такого типового завдання, як набір тексту. Ось воно — майбутнє, прогнозоване чверть століття тому.
Не розгубиться Siri й через цілком несподівані запити, на зразок прохання розповісти анекдот або освідчитись. Правда, відповіді її в таких випадках більш схожі на відмовку (часом жартівливу), проте система розуміє запитання й реагує на нього, як може.
На YouTube можна знайти цікавий відеоролик, у якому два iPhone 4S «розмовляють» між собою. Звичайно, через якийсь час діалог перетворюється на цілковиту дурню, але це саме діалог між двома комп’ютерами, без участі людини. А там, диви, і до проходження тесту Тьюрінга недалеко (суть його в тому, що, розмовляючи з невидимими співрозмовниками, ви маєте визначити, хто з них людина, а хто комп’ютер, але поки ще жоден комп’ютер цей тест не пройшов). До речі, Siri — самонавчальна система, дайте їй трохи часу, і вона розумітиме вас набагато краще.
Не думайте, що всі запити виконує сам телефон. На жаль, його можливостей поки для цього недостатньо. Принцип роботи Siri у тому, що запит надсилається на віддалені сервери (в «хмару» Apple) і обробляється вже там. Це вимагає постійного підключення до Інтернету. Допитливі користувачі вже підрахували, що навіть за дуже активного використання витрата трафіку не перевищить 30—40 Мб на місяць, тобто буде зовсім невеликою.
У ті країни, де Siri планують задіяти по-справжньому, iPhone 4S поставляється разом із пакетами зв’язку, що сприяють постійному перебуванню в Мережі. Запускаючи Siri, Apple уклала договори з багатьма різними системами, такими, як пошук відповідей на запитання Wolfram Alfa, резервація вільних столиків у ресторанах і кафе Open Table, а також сервіс MovieTickets.com для одержання інформації про фільми, LiveKick для з’ясування деталей про всілякі заходи та ін.
Для звичайного ж веб-пошуку використовуються пошуковики Google, Bing і Yahoo. Тільки завдяки такій потужній підтримці й забезпечується витончена робота Siri. Утім, із деякими запитами справляється й сам iPhone. Наприклад, для набору тексту не треба кудись звертатися. Для розпізнавання мовлення застосовуються технології, розроблені компанією Nuance Communications.
Усупереч поширеній в Інтернеті думці, iPhone 4S зовсім не є лише трохи доробленою версією попередньої моделі. Можна сказати, що це принципово новий смартфон, виконаний у старій оболонці. Це ще один серйозний крок до ери Post-PC. Як бачимо, Apple знову пішла своєю дорогою, спантеличивши конкурентів.
Не обійшлося й без курйозів: так, Ерік Шмідт, голова ради директорів Google, щоб відвести від своєї компанії обвинувачення антимонопольного комітету, представив Siri як дуже молодого, але при цьому дуже небезпечного конкурента в галузі інтернет-пошуку з величезними можливостями. Шмідт вочевидь хитрував: перебуваючи в стадії бета-тестування, Siri ще не готова до глобальних завоювань. Однак зовсім неважко уявити собі її майбутнє. Насамперед цією технологією, швидше за все, оснастять усі iOS-пристрої, і настане той день, коли вона прийде й на Mac.
Але поки що Siri доступна тільки на iPhone 4S. Потужностей попередніх моделей цілком достатньо для забезпечення роботи новинки, однак Apple відмовилася від підтримки застарілого обладнання. Почасти для того, щоб ще раз простимулювати продажі iPhone 4S, а почасти — через певні технічні особливості апарата. Річ у тім, що в останнього iPhone інфрачервоний датчик наближення ввімкнений весь час (якщо екран розблоковано). На витраті заряду батареї це майже не позначається, зате смартфон завжди готовий до діалогу, відслідковуючи момент, коли власник піднесе пристрій до обличчя, щоб дати чергову команду (інший спосіб активації Siri — натиснути й кілька секунд утримувати кнопку «Додому»).
Власне кажучи, сама компанія Apple не є розробником технології. НДДКР провела фірма Siri — стартап, заснований чотирма молодими й дуже амбіційними людьми 2007 року. Вихідці із Центру штучного інтелекту компанії SRI International, коріння якої — у Стенфордському університеті, Том Грубер, Даг Кітлаус, Адам Чейєр і Норман Вінарскі вирішили перетворити свої суто лабораторні дослідження на прибуткове підприємство.
Розуміючи, що подальші роботи потребують величезних вкладень, молоді підприємці почали обходити Кремнієву долину в пошуках меценатів. Представлені ними розробки справляли належне враження, і гроші, нехай і не текли рікою, але все-таки справно надходили. І от з’явилися перші результати, які не соромно було представити публіці. В Apple App Store вийшов додаток для iOS, який, хоч і здавався не більш як цікавою іграшкою, продемонстрував можливості Siri. І це не залишилося без уваги керівництва Apple.
2010 року стартап було поглинено, а додаток зник з онлайн-магазина — йому підготували набагато цікавішу долю, ніж бути ще однією програмою, виставленою на продаж. Він став однією з ключових функцій iOS 5. До речі, спочатку розробники планували створити версії Siri також і для таких популярних систем, як Android і BlackBerry OS. Зі зрозумілих причин ці проекти були згорнуті.
В основі Siri — безліч надзвичайно складних розробок, які датовані ще тими часами, «коли комп’ютери були великими, а програми маленькими». Вона об’єднала в собі кілька різних систем — розпізнавання голосу, розуміння сказаного, пошуку найкращої відповіді, складання зв’язної відповіді й проголошення цього тексту зрозумілим (нехай навіть і механічним) голосом.
Усіма цими питаннями вчені й програмісти займалися багато років, але більш-менш прийнятні результати з’явилися лише на початку 90-х років минулого століття. Ближче до кінця століття на ринок вийшли рішення, уже придатні для застосування домашніми користувачами (утім, особливого успіху вони не мали).
Незважаючи на те, що особистої участі Apple у розробці самої системи не брала, вона виконала величезну роботу зі спрямування безлічі розрізнених розробок в один потік, злиття їхніх можливостей в одній системі. Власне кажучи, компанія історично саме цим і займається — бере за основу вже наявні рішення й доводить їх до пуття, роблячи більш дружніми користувачеві, зручними в повсякденному використанні. А потім долучаються конкуренти, які пропонують свої альтернативи. Так само буде й цього разу.
На жаль, список мов, підтримуваних Siri, невеликий — англійська, німецька і французька. Коли з’явиться російська або українська, невідомо. Зрозуміло одне — не скоро. Та й узагалі система погано адаптована для наших умов. Тож усі свої можливості Siri розкриє тільки перед тим, хто не просто знає англійську, а й володіє більш-менш стерпною вимовою.
До речі, про вимову: випущене недавно перше відновлення iOS 5 включило в себе не тільки виправлення деяких системних помилок, а й модуль, що допомагає Siri розуміти мову австралійців, акцент яких виявився для неї занадто складним.