Литвек - электронная библиотека >> Адреа Лонца >> Python и др. >> Алгоритмы обучения с подкреплением на Python

Переводчик: А А Слинкин

Жанр: Python, Искусственный интеллект

Серия:

Год издания:

Язык книги: русский

Страниц: 287

Издано в серии:

Издательство: ДМК Пресс

Город печати: Москва

ISBN: 978-5-97060-855-5

Книга закончена

   просмотрело человек за:

день: 1  месяц: 15   год: 66   всего: 66

QR-код
X

QR-код ссылки на скачивание книги

QR-код
Размер: 8.4 Мбайт
Читать онлайн

Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов. В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и метаалгоритмом ESBAS. Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне.


  : 0 : 0 : 0 : 0 : 0 : 0 : 0  

Оставить комментарий: