19 февраля 2020
Сотрудники научно-образовательного центра «Машинное обучение и анализ больших данных» Новосибирского государственного университета совместно с Институтом катализа им. Г. К. Борескова СО РАН занимаются изучением и развитием технологий, связанных с глубоким машинным обучением. Одной из разработок стало приложение, которое в режиме online может сканировать и анализировать определенные виды микроскопических изображений.
— Наша программа самостоятельно находит однотипные объекты, измеряет их параметры, собирает и обрабатывает статистику. Результаты такого анализа необходимы для развития полупроводниковых технологий, катализа, материаловедения, медицины и т. д. Очень важно, что в короткие сроки удалось перейти от исследовательских экспериментов к продукту, который сейчас находится в открытом доступе для всех, кто нуждается в автоматизации рутинных анализов. Стоит заметить, что до практического приложения в этой области пока никто, кроме нас, еще не дошел, — подчеркнул директор ВКИ НГУ Алексей Окунев.
Сотрудники НГУ отмечают, что появление такого инструмента для научных исследований — это новый этап в развитии физических методов исследования, который поможет сэкономить время ученым.
— Самое главное, применение подобного продукта позволяет снизить влияние человеческого фактора при анализе данных, прежде всего, за счет увеличения объема обрабатываемой информации (сейчас современные приборы позволяют получать очень большие объемы данных, и на практике временные возможности человека лимитируют количество проанализированного материала). Также разработка позволит сократить риски, возникающие из-за возможной некомпетентности анализирующего, например, из-за недостатка опыта, — объяснила доцент кафедры химии твердого тела Факультета естественных наук НГУ Анна Нартова.
Обученная исследователями на наночастицах нейросеть может распознавать клетки крови, разные однотипные объекты, людей и животных на фотографиях с квадрокоптеров и другое. Это полностью подтверждает гипотезу о высокой склонности глубоких нейронных сетей к генерализации: другими словами, обученная на одних объектах нейросеть может находить другие, совершенно отличные объекты от тех, на которых она обучалась. Сейчас исследователи Академгородка работают над внедрением приложения в различные области науки.
— В мире в области машинного обучения все сразу перешли на частности — кошек, собак и т. д. Но никто не задумывался над задачей обучить нейронную сеть искать прежде всего «объекты», пусть они даже неизвестной природы. Мы это сделали первые. Удивительно, но, обучив нейронную сеть на «шумных», плохих изображениях частиц сканирующего туннельного микроскопа, мы привили ей универсальность, она ищет любые объекты. Например, беспилотный автомобиль едет в сильный снег или дождь и четко не может определить, какой объект перед ним возникает — не хватает четкости изображения. Нашей сети не важно, что перед ним возникло — это «что-то» определяется четко и быстро, поэтому нейросеть понимает, что нужно остановиться, — объяснил уникальный принцип обучения нейронной сети руководитель Проектного офиса НГУ Андрей Матвеев.
По словам сотрудника Института систем информатики СО РАН Михаила Машукова, в области глубокого машинного обучения сейчас много интересных нерешенных задач — сфера активно расширяется, однако компетентных специалистов в ней мало. Также он отметил, что работа группы новосибирских исследователей ускорилась благодаря графическому кластеру HPE Apollo 6500 Gen10, который находится на базе Высшего колледжа информатики.
— Нам для нашей работы важны были данные, а также широкий набор навыков, чтобы получить результат: знать, как обучают нейронную сеть, как сделать приложение, как разметить картинки, как организовать всю работу, чтобы это не растянулось на годы, — рассказал программист.
— Очень скоро мы будем готовы представить наш продукт всему остальному миру. У нас запланированы поездки по России и за рубеж для представления нашего продукта специалистам в разных областях науки и технологии. Планируем также выйти на производителей приборов, чтобы наш сервис был включен в программное обеспечение, которое идет вместе с приборами, — добавил Алексей Окунев.
Исходное изображение наночастиц платины (нанесенных на высоко-ориентированный пиролитический графит, 50×50 нанометров), полученное на сканирующем туннельном микроскопе; контуры наночастиц, распознанные нейронной сетью; рассчитанное распределение частиц по размерам, средний размер частиц – 4,25 нм.
Источник: сайт НГУ