Комп'ютер розпізнає ескізи краще, ніж люди

Нейронна мережа може допомогти покращити розпізнавання зображень сенсорних екранів

Типові естрадні ескізи різних птахів © Лондонський університет королеви Мері
читати вголос

Нова комп'ютерна програма виявляється розумним читачем ескізів: вона розпізнає навіть моторошні малюнки краще, ніж звичайна людина - і набагато краще, ніж звичайне програмне забезпечення для розпізнавання зображень. Причина цього: Нейронна мережа здатна вчитися і навіть бере цінну інформацію з порядку ударів. Це може скористатися майбутніми програмами сенсорного екрану.

Ми, люди, використовували ескізи тисячі років - не тільки в мистецтві, а й для того, щоб запам'ятати речі або дати іншу інформацію. Однак те, що представляє ескіз, не завжди легко розпізнати. Бо залежно від здібностей чертовця вони більш-менш охайні та абстрактні. Крім того, у простих малюнках олівцем відсутні кольори, які б полегшили розпізнавання зображеного.

Ми визнаємо лише приблизно три чверті

Недарма, що ми не завжди можемо правильно визначити ескізи інших. "Велике дослідження з 20 000 ескізами від руки з 250 категорій виявило вражаючий показник у розмірі близько 73, 1 відсотка - показавши, що це завдання є складним навіть для людей", - сказали Цянь Ю з Лондонського університету королеви Мері та його колеги. Для багатьох комп’ютерних програм це ще складніше, частота їх потрапляння зазвичай набагато нижче рівня людської тематики.

Але Ю та його колеги зараз розробили комп’ютерну програму, яка може вперше краще розпізнати ескізи, ніж люди. Sketch-a-Net - це так звана Deep Neural Network - багатошарова мережа, в якій окремі кроки моделюються на мозку. Нова програма не тільки вивчає та розпізнає обриси та форми на ескізах, але й черпає цінну інформацію з порядку, в якому здійснювались окремі штрихи.

Комп'ютери навіть вдвічі частіше розпізнавали птахів, оскільки вони були людьми. © Лондонський університет королеви Мері

Краще за людину

Як показали перші тести, Sketch-a-Net розпізнає правильно 74, 9%, що показано на ескізі від руки. Щонайменше на 1, 8 відсотка вище, ніж у людей, що піддаються, - це рекорд для машинного мозку. Штучні нейронні мережі, які були розроблені спеціально для виявлення фотографій, проте діяли набагато гірше: вони розпізнали лише добрі 20 відсотків ескізів. дисплей

Якщо говорити про більш точні деталі, Sketch-a-Net був ще більш досконалим, ніж людські компаратори, вважають дослідники. Наприклад, програма використовувала ескізи птахів, щоб краще визначити, яка це птах. "Sketch-a-Net набрав 42, 5 відсотка за фотографії птахів, літаючих або стоячих птахів і голубів, тоді як людям вдалося лише 14, 8 відсотка", - сказав він Ю. та його колеги.

Корисно для сенсорних екранів

На думку дослідників, програми, засновані на прикладі Sketch-a-Net, можуть бути особливо корисними для додатків із сенсорним екраном. "З розповсюдженням сенсорних екранів замальовки стали простішими та більш поширеними - ми можемо щось намалювати на смартфоні, планшеті чи навіть дивитися", - кажуть вчені.

Для розпізнавання та призначення цих ескізів необхідно мати відповідні програми. "Вони можуть мати велике значення для таких областей, як поліцейська робота, використання сенсорного екрана та обробка зображень", - сказав співавтор Тімоті Хоспедалес з університету королеви Марії. "Зрештою, вони можуть навіть допомогти нам краще зрозуміти візуальне сприйняття" (Британська конференція машинного бачення, 2015, arXiv: 1501.07873)

(Лондонський університет королеви Мері, 22.07.2015 - НКО)