195176, г. Санкт-Петербург,
Пискаревский пр. д.25,
литер А пом. 8Н.
info@armkllc.ru
   +7 (812) 748-51-31

Каждому – по ИИ!

Дата публикации: 2019-07-01 09:49:00

Помните задорновскую шутку о ценнике в магазине перестроечных времён: «Ум. Рубль-сорок за килограмм»? Так вот, это случилось: создана система AI общего пользования.

В течение более четырёх лет исследователи из MIT и Университета Брауна разрабатывали интерактивную систему обработки данных Northstar, которая работает в облаке и поддерживает любое устройство с сенсорным экраном, включая смартфоны и большие интерактивные доски. Изобретение оценено по достоинству и обрело своих пользователей. Ещё бы, ведь оно позволяет компилировать, комбинировать и манипулировать вашими данными и целыми наборами их характеристик (вами же заданными) ориентируясь на какие угодно признаки, чтобы выявлять тенденции и закономерности. Интерфейс представляет собой чистый холст, совместимый с несколькими платформами, куда пользователь загружает собственные наборы данных, которые отобразятся в виде блоков на «холсте» интерфейса. Затем можно перемещать блоки – скажем, перетащить в центральную область холста – и соединить их линиями, чтобы пометить, что они должны обрабатываться в сочетании друг с другом.

Теперь система вышла на принципиально иной уровень.

Новый компонент VDS (виртуальное исследование данных) мгновенно генерирует модели машинного обучения для анализа наборов пользовательских данных. Да, это тот самый искусственный интеллект. Но теперь не нужно быть супер-героем, баловнем судьбы или гением, чтобы создать его или получить к нему доступ. Как пишет TechCrunch, «вскоре вам не понадобится ничего более специализированного, чем обычное устройство с сенсорным экраном».

Ну, проанализировать и раскидать по полочкам человек может и сам, хоть и значительно медленнее машины. Только вот сейчас из инструмента «для наглядности» Northstar превращается в подобие оракула: система проводит аналитику и выдаёт прогнозы на основе того, чему вы её научите.

Похоже, что VDS может фактически считаться человеческим эквивалентом, особенно там, где живого специалиста не легко было бы получить. Например, в провинциальных деревенских больницах многие врачебные профессии просто не представлены ­– таких докторов нет в штате. Так же, как и в большинстве малых и средних предприятий нет реальных аналитиков. Но в любом деле необходим доступ к тому беспристрастному виду понимания ситуации, который выдаёт чёткая машинная логика.

«Даже владелец кофейни, который не знает данных, должен быть в состоянии предсказать свои продажи в течение следующих нескольких недель, чтобы выяснить, сколько кофе купить», – говорит соавтор и давний руководитель проекта Тим Краска, доцент кафедры электротехники и компьютерных наук в Лаборатории компьютерных наук и искусственного интеллекта Массачусетского технологического института (CSAIL) и соучредитель-учредитель новой системы данных и AI Lab (DSAIL). Кроме того, никто не запрещает совмещать живых аналитиков с машинным интеллектом для более детальных исследований и прогнозов.

Алгоритм VDS основан на все более популярном методе автоматического машинного обучения (AutoML), который позволяет людям с ограниченными познаниями в программировании и науке о данных обучать модели искусственного интеллекта прогнозированию на основе своих наборов данных.

В настоящее время этот инструмент возглавляет конкурс DARPA D3M Automatic Machine Learning, в котором каждые шесть месяцев выбирается наиболее эффективный инструмент AutoML.

«Это как большой, неограниченный холст, на котором вы можете планировать все, что хотите», – говорит постдок Эммануэль Зграгген, основной изобретатель интерактивного интерфейса Northstar. «Затем вы можете связать вещи вместе, чтобы создать более сложные вопросы о ваших данных». С помощью VDS пользователи могут запускать классификацию изображений, анализ сложных структур графиков и прогностическую аналитику, настраивая ИИ в соответствии со своими задачами. В случае необходимости – скажем, при добавлении данных или уточнении критериев – в любое время можно остановить процесс и изучить частоту ошибок каждой модели, структуру, вычисления и прочие параметры. Система автоматически находит наиболее эффективные конвейеры обучения. Они наглядно представлены и постоянно обновляют процент точности.

По словам исследователей, успех VDS (в том числе на вышеупомянутом конкурсе DARPA D3M) во многом объясняется высочайшей на сегодня скоростью работы среди AutoML-инструментов. Этого удалось добиться отчасти благодаря пользовательскому «механизму оценки», работающему между интерфейсом и облачным хранилищем. Автомат создаёт несколько репрезентативных выборок из набора данных и, благодаря пошаговой их обработке, выдаёт высокие результаты буквально в считанные секунды.

Аспирант Зейуан Шан, которого в статье назвали ни много ни мало первым автором проекта, говорит, что команда потратила«два года на разработку VDS, чтобы имитировать то, что думает учёный». Основываясь на различных наработках, полученных в процессе обучения, алгоритм мгновенно определяет модели и шаги предварительной обработки, необходимые или не подходящие для поставленных задач. Таким образом создаются новые шаблоны-модели решений: сначала выбираются возможные пути из базы машинного обучения и запускается само моделирование с запоминанием результатов и уточнением выбора решения по его соответствию цели или критериям. После этих примерных прикидок система уточняет расчёты в серверной части. Но обычно конечные числа очень близки к первым приблизительным результатам.

Инструмент протестирован на 300 реальных наборах данных. Выводы VDS были такими же точными, как и у остальных AutoML-систем, но генерировались в течение нескольких секунд (в отличие от минут и даже часов, требующихся конкурентам на те же задачи). К тому же есть исследование, как замечает Тим Краска, показывающее, что пользователи «начинают терять связь с системой» при долгом ожидании результатов. И это хорошо на самом деле, поскольку «вы уже хотите увидеть что происходит, и, если обнаружится ошибка, вы можете сразу же исправить её», – заключает он. А система, кстати, сама может указать вам на возможные противоречия. Сейчас исследователи как раз ищут возможность добавить функцию, которая предупредит неопытного пользователя о возможном смещении данных или ошибках.


 

По материалам MIT News