Помахай комп’ютеру рукою
Природні інтерфейси змінюють способи взаємодії з технікою.
За останній рік у світі IT сталося кілька знакових подій, які, на перший погляд, не пов’язані між собою, але чітко визначили новий шлях у розвитку як персональних комп’ютерів, так і способів взаємодії з ними. Йдеться про появу лінійки планшетів iPad, випущену Apple, з одного боку, і створення її головним конкурентом Microsoft контролера Kinect для гральних приставок Xbox 360 — з іншого.
Високі продажі комп’ютерної техніки донедавна пояснювалися технічними характеристиками — потужністю процесора, кількістю оперативної та постійної пам’яті, розрізненням екрана або ще чимсь із тієї ж серії. Тобто для опису продукту використовували цифри, цифри й ще раз цифри, які характеризують його технічну начинку. З огляду на ці цифри планшет iPad майже ні в чому не перевершує своїх конкурентів (приміром, Samsung Galaxy Tab).
То чому ж мільйони користувачів купували й досі купують iPad? Відповіддю можуть бути слова самого Стіва Джобса, засновника Apple і автора цього проекту. На початку місяця на презентації iPad 2 він заявив про початок посткомп’ютерної ери, коли потужність комп’ютера вже не відіграє ключової ролі, а визначальними стають концепції гуманітарного характеру — дизайн, способи спілкування із системою, своєрідний «психологічний портрет» продукту. На думку Джобса, сучасний мобільний комп’ютер — продукт поєднання гуманітарного й технічного підходу з акцентом на перший.
Треба визнати, що IT-спільнота досить стримано відреагувала на таку заяву. Приміром, засновник Microsoft Білл Гейтс заявив на шоу Ларі Кінга: «Ми намагаємося створити продукт, який ви хотіли б взяти на ділову зустріч, щоб робити записи й редагувати… iPad не є таким…». Але популярність «яблучного» планшета можна розглядати як підтвердження правоти його створювача. Користувачі платять гроші не за процесор, сенсорний екран або відеокамеру. Вони купують «домашнього улюбленця» з дуже характерним інтерфейсом, який відображає прагнення розробників справити приємність користувачу від роботи з ним.
Для кращого розуміння важливості способу спілкування користувача з комп’ютером повернімося на декілька десятиліть назад. Перші «персоналки» оснащувалися тільки клавіатурою — це був єдиний спосіб управляти машиною. Що дуже обмежувало коло користувачів, адже для роботи було необхідно прочитати велику документацію й пам’ятати десятки команд та ключів для управління системою. Створення комп’ютерної миші (винахідник Douglas Engelbart, 1964 р.) і її масовий випуск у комплекті із ПК (фірма Xerox 8010 Star Information System, 1981 р.) значно полегшили цей процес. Використання миші в поєднанні із графічними інтерфейсами для операційних систем безпрецедентно розширило коло користувачів ПК. Робота з керування операційною системою, файловою структурою та застосунками могла тепер виконуватися за рахунок інтуїтивно-зрозумілих прийомів — виставлянням галочок в опціях і перетаскуванням на робочому столі папок і файлів, словом так, як це робилося з документами в реальному світі. Відтоді для ПК клавіатура й миша майже на три десятиліття стали фактично безальтернативним інтерфейсом взаємодії користувача й машини.
Одним із головних винаходів, які відкрили нові можливості для наближення способу взаємодії між ПК і користувачем до звичайного, «людського» (так званого природного користувальницького інтерфейсу, англ. NUI — natural user interface), було створення дисплеїв, здатних реагувати на дотики. Вони з’явилися в 70-х роках. Піонерною роботою можна вважати випуск фірмою Control Data Corporation сенсорного екрана в 1972-му. Навколо екрана розташовувалися інфрачервоні датчики, які реєстрували наближення до нього. Екрани, які дозволяли реєструвати дотики не тільки в одній точці (multi-touch), з’явилися на початку 1980-х років, першою була розробка Університету Торонто (Input Research Group).
Минуло більше чверті століття, перш ніж multi-touch-технологія стала поширеною — випуск перших iPhone (фірма Apple, 2007 р.) супроводжувався рекламними заявами про пріоритет Apple у галузі розвитку технології multi-touch.
Така заява не дуже відповідала дійсності, бо ще в 2006 році співробітник Університету Нью-Йорка продемонстрував, яким чином можна обробляти множинні дотики до екрана. Це було заворожливе видовище — від імітації скульптурного ліплення із в’язкого матеріалу, який реагував на дотик пальців так само, як поводила б себе глина в руках скульптора, до створення художнього векторного малюнка. Крім таких вражаючих образів, був продемонстрований цілком новий підхід до організації інтерфейсу користувача.
Робочу область тепер було легко масштабувати. Приміром, користувач міг «зрушувати» робочий стіл у всіх вимірах — як на площині, так і в просторі (збільшенням або зменшенням масштабу видимої області). Точка на екрані після наближення ставала сторінкою документа, на якій можна прочитати текст. Зрушення в площині здійснювалося цілком природним рухом — дотиком пальців до екрана й «протаскуванням» його вліво/вправо або вгору/вниз, як і масштабування. Після того, як пальці рук торкалися екрана й ковзали назустріч один одному («стискаючи» простір), робоча область «віддалялася», відкриваючи більший простір, рух у протилежному напрямку наближав область видимості, збільшуючи об’єкти на ній.
Як відомо, сучасні планшети підтримують акселерометри (у тому числі й просторові), гіроскопи, барометри, датчики освітлення й навіть геомагнітні датчики. Ці пристрої, таким чином, реєструють струшування, прискорення, орієнтацію в просторі — словом, реагують на фізичні подразники, наче живі істоти! Навіч перенесення акценту із цифрової оцінки продукту на його «людяність», коли швидкодія відступає на другий план на користь дизайну та інтерфейсу взаємодії з користувачем.
Розглянемо й інший підхід до реалізації природного користувальницького інтерфейсу. У 2009 році в цій галузі сказала своє слово й Microsoft. Компанія з реклами та просування технологій Razorfish тоді використовувала додаток DaVinci для демонстрації можливостей Microsoft Surface (сенсорного екрана з підтримкою довільної кількості доторкань). Доторканнями пальців за кілька секунд створювалася примітивна іграшка, демонструвалася взаємодія між віртуальними предметами (намальованими руками демонстраторів) і фізичними об’єктами (розташованими на екрані фішками).
Наступний крок напрошувався сам собою — створення безконтактного інтерфейсу взаємодії з комп’ютером. Він був реалізований Microsoft у технології Kinect. Попередній експеримент повторений майже точно, за винятком одного: демонстратор не доторкався до екрана, його рухи фіксував Kinect — і як у фантастичному фільмі, у відповідь на жести людини з’являлися фігури, які поводилися то як предмети в гравітаційному полі Землі, то як заряджені частинки в невагомості, зіштовхуючись, притягуючись або пересуваючись за рухом рук їхнього створювача.
Поява технології Kinect стала початком лавиноподібного процесу розробки сторонніми організаціями (і окремими ентузіастами) нових шляхів «навчання» машини вміння реагувати на рухи людини, її жести, розпізнавати образи тощо. Уже є пілотна версія програмного забезпечення для управління стандартним інтерфейсом програм за допомогою жестів рук. Такий підхід до взаємодії із системою називають жестовим інтерфейсом (розробка Массачусетського технологічного інституту).
Принцип роботи контролера Kinect досить простий: «база» випромінює інфрачервоні промені, які, відбиваючись від об’єкта, реєструються приймачем, і потім за відбитим сигналом будується тривимірна модель сцени. Озброївшись камерою для нічної зйомки, можна побачити тисячі точок, проектованих джерелом, серед яких яскравішим світінням вирізняються контрольні точки. Головний конкурент Kinect — пристрій Sony Move — технічно менш досконалий і вимушено використовує спеціальний контролер, який необхідно тримати в руці, щоб система могла розпізнати рух гравця.
Настає нова епоха в розробленні додатків. Якщо раніше всі події, пов’язані, наприклад, із мишкою, були чітко фіксовані (клік, подвійний клік, переміщення), то тепер перед розробниками постає фактично необмежена область подій — від дотику в одній точці до руху довільної кількості об’єктів. Можна в чотири руки «ліпити» на площині скульптуру, малювати сюрреалістичні пейзажі або клацанням пальців видаляти каталоги.
Більш того, сполучення технології multi-touch із технологією безконтактної взаємодії, представлене Kinect, відкриває можливість програмувати реакцію ПК на жести й міміку користувача. Днями Microsoft планує випустити сервіс Avatar Kinect — систему, здатну не тільки відображати рухи користувача в його віртуального двійника, а й розпізнавати обличчя, більш того — емоції!
Підсумовуючи факти, можна констатувати стрімке наближення способу спілкування користувача й машини до людських стандартів, що дозволить інтуїтивно виконувати операції, для яких раніше була потрібна професійна комп’ютерна підготовка й глибоке знання спеціалізованих продуктів.
Важко взяти на себе сміливість припустити, до чого призведе подальший розвиток технології. Цілком можливо, що у найближчому майбутньому планшети зможуть скаржитися власникові на мігрень перед грозою, муркотіти у відповідь на погладжування, а ввечері вимагати колискову. У будь-якому разі неспростовний факт початку принципово іншої епохи — епохи панівного становища людини в побудові інтерфейсу взаємодії з комп’ютером.