Ученые из Tinkoff Research создали новый метод обучения и адаптации искусственного интеллекта (ИИ) под названием ReBRAC.
Этот метод обучает ИИ в четыре раза быстрее и на 40% качественнее мировых аналогов в области обучения с подкреплением. Сегодня в мире идет гонка систем искусственного интеллекта, которая сталкивается с серьезными ограничениями из-за требовательности «железа» для ИИ, особенно к видеокартам.
Разработка российских ученых в области повышения эффективности алгоритмов обучения ИИ может способствовать преодолению технологического и цифрового разрыва между разными странами. Результаты последней работы исследователи представили на международной конференции по машинному обучению и нейровычислениям NeurIPS. Алгоритм ReBRAC ранее описали в препринте соответствующей работы.
В типичных ИИ-агентах есть два компонента: «актор», действующее лицо, генерирующее выдачу программы, и «критик», который оценивает действия актора по определенной шкале. В новой работе ученые применили совместную регуляризацию обоих компонентов, чтобы актор избегал нежелательных действий, а критик, со своей стороны, точнее оценивал их.
Помимо этого, авторы нового алгоритма увеличили глубину нейронных сетей, используемых в ИИ, что облегчило ей работу с данными и поиск сложных закономерностей в них.
Понравилась новость? Добавьте в избранное Дзен Новости
Источник изображений
- программист: Автор: pressfoto
Понравилась новость? Добавьте в избранное Дзен Новости, присоединяйтесь к нашим сообществам Вконтакте и Одноклассники и нашему Telegram-каналу.