机器学习的数学和工具方法

Математические и инструментальные методы машинного обучения

Курс посвящён изучению основных методов машинного обучения, используемых для факторного, кластерного и классификационного анализов. В ходе обучения, слушатели смогут освоить основные подходы и получить навыки решения практических задач поиска закономерностей в сырых данных.

512 次查看
俄罗斯国立核能研究大学
edX
  • 完成时间大约为 10
  • 初级
  • 俄语
注:因开课平台的各种因素变化,以上开课日期仅供参考

你将学到什么

математические и инструментальные методы машинного обучения;

использование современных информационно-коммуникационных технологий в профессиональной деятельности;

закрепление профессиональных навыков в области прогнозирования основных социально-экономических показателей деятельности предприятия, отрасли, региона и экономики в целом.

课程概况

Обработка и анализ больших данных представляет собой новую практическую задачу, требующую навыков работы с современным инструментарием. В настоящее время данные называют «нефтью 21 века», они накапливаются в корпоративных и государственных информационных системах, социальных сетях, веб-блогах и сайтах и потенциально являются ценным ресурсом для извлечения новых знаний, инсайтов для научных исследований, повышения эффективности и конкурентоспособности предприятий. Методы интеллектуального анализа больших данных, таким образом, представляют собой тот необходимый инструмент для высвобождения этого потенциала.
Курс «Математические и инструментальные методы машинного обучения» входит в число базовых при подготовке современных экономистов-математиков на уровне магистров. Изучение дисциплины позволит студентам получить и развивать навыки анализа и диагностики проблем экономики, современных методов их решения, а также ознакомиться с современной спецификой исследования операций в зарубежных и отечественных организациях.
Целями и задачами курса являются: формирование у будущих магистров фундаментальных общеэкономических и естественнонаучных знаний; освоение магистрантами математических и инструментальных методов машинного обучения; использование современных информационно-коммуникационных технологий в профессиональной деятельности; закрепление профессиональных навыков в области прогнозирования основных социально-экономических показателей деятельности предприятия, отрасли, региона и экономики в целом.
В курсе использованы инновационные подходы: включение в факультетскую систему «ИНФОМИФИСТ» 18 уроков (лекций) курса с тренингами и контрольными вопросами, проведения зачета в электронном формате с индивидуальной идентификацией студентов (логин, пароль) и троекратной возможностью пересдачи.
Компетенции по решению задач в анализе данных с помощью методов машинного обучения, будут получены студентами после прохождения курса «Математические и инструментальные методы машинного обучения». Изучение дисциплины позволит выработать навыки постановки и решения проблем развития организации, развить творческое мышление специалистов в области системного анализа и бизнес-моделирования, выработать умение решать управленческие проблемы в конкретной экономической ситуации.

课程大纲

Неделя 1. Задачи и методологии анализа данных
Урок 1. Введение в задачи анализа данных. Описание стандартов CRISP-DM, KDD, SEMMA. Основные понятия и методы анализа данных.
Урок 2. Среда интеллектуального анализа данных RapidMiner.
Неделя 2. Подготовка данных
Урок 3. Очистка, и обогащение данных.
Урок 4. Метод главных компонент. Матрица нагрузок и матрица счетов. График собственных значений. Критерий Кайзера. Вращение методом Варимакс. Интерпретация результатов факторного анализа.
Неделя 3. Визуализация данных
Урок 5. Визуализация данных. Понятие и основные задачи визуализации.
Урок 6. Подходы к визуализации: геометрический, древовидный.
Неделя 4. Понятие описательных статистик
Урок 7. Подходы к визуализации: геометрический, древовидный.
Понятие описательных статистик. Вычисление основных показателей положения и вариации. Построение частотных полигонов и гистограмм.
Неделя 5. Анализ связей
Урок 8. Корреляционный анализ/Понятие корреляционной связи. Коэффициент корреляции Пирсона. Ранговые коэффициенты. Коэффициенты корреляции для дихотомических и номинальных переменных.
Урок 9. Регрессионный анализ/Простая линейная регрессия. Проверка значимости уравнения линейной регрессии. Оценка качества уравнения линейной регрессии. Коэффициент детерминации. Доверительный интервал линейной регрессии.
Неделя 6. Кластеризация
Урок 10. Постановка задачи кластеризации/Понятие кластера. Обзор прикладных задач с использованием методов кластеризации. Обзор основных понятий и методов кластерного анализа.
Урок 11. Иерархические и итеративные методы кластеризации/Иерархическая агломеративная кластеризация. Дендрограммы. Дивизимные методы кластеризации. Метод МакКуина (к-средних).
Неделя 7. Мягкая и жёсткая кластеризация
Урок 12. Критерии качества кластеризации.
Неделя 8. Классификация
Урок 13. Постановка задачи классификации/Задача классификации с учителем. Понятие и свойства класса. Обзор основных методов классификации. Байесовская наивная классификация/Понятие байесовского классификатора.
Урок 14. Деревья решений в задачах классификации/Понятие деревьев решений. Примеры.
Неделя 9. Методы поиска ассоциативных правил
Урок 15. Понятие правил ассоциации. Метод Apriori. Метод FP-Growth. Примеры.
Урок 16. Понятие шаблона последовательных событий. Метод Apriori. Метод GSP.
Неделя 10. Интеллектуальный анализ текста
Урок 17. Токенизация. Векторизация. Регулярные выражения.
Урок 18. Стемминг. Лемматизация. Удаление стоп-слов. Анализ тональности.

千万首歌曲。全无广告干扰。
此外,您还能在所有设备上欣赏您的整个音乐资料库。免费畅听 3 个月,之后每月只需 ¥10.00。
Apple 广告
声明:MOOC中国十分重视知识产权问题,我们发布之课程均源自下列机构,版权均归其所有,本站仅作报道收录并尊重其著作权益。感谢他们对MOOC事业做出的贡献!
  • Coursera
  • edX
  • OpenLearning
  • FutureLearn
  • iversity
  • Udacity
  • NovoEd
  • Canvas
  • Open2Study
  • Google
  • ewant
  • FUN
  • IOC-Athlete-MOOC
  • World-Science-U
  • Codecademy
  • CourseSites
  • opencourseworld
  • ShareCourse
  • gacco
  • MiriadaX
  • JANUX
  • openhpi
  • Stanford-Open-Edx
  • 网易云课堂
  • 中国大学MOOC
  • 学堂在线
  • 顶你学堂
  • 华文慕课
  • 好大学在线CnMooc
  • (部分课程由Coursera、Udemy、Linkshare共同提供)

© 2008-2020 MOOC.CN 慕课改变你,你改变世界