Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2017

Факультатив по машинному обучению

Рекомендованная литература:

  1. Deep Learning by Ian Goodfellow, Yoshua Bengio, Aaron Courville - книга про глубокое машинное обучение, разобраны почти все идеи из области нейросетей

  2. The Elements of Statistical Learning by Trevor Hastie, Robert Tibshirani, and Jerome Friedman - книга в основном по классическому машинному обучению, одна из лучших

  3. Hands-on Machine Learning with Scikit-Learn, Keras and TensorFlow, Aurélien Géron - хорошая книга с отдельным github под нее (https://github.com/ageron/handson-ml2)

  4. Machine Learning: a Probabilistic Perspective by Kevin Patrick Murphy
  5. Pattern Recognition and Machine Learning by Christopher M. Bishop - классическое машинное обучение, местами сложновато

Также вам могут понравиться видео с канала StatQuest

Программа курса

  1. Лекция Машинное обучение. Виды задач, примеры. Машинное обучение в биологии.

  2. Лекция Переобучение, недообучение. Метод k-ближайших соседей. Регрессии. Классификации. Оценка качества модели. Популярные метрики (Accuracy, AUC ROC, AUC PR, MSE, MAE). Разбиение на обучение и тест. Bias-variance tradeoff. Домашняя работа 1 Дедлайн: 23.03.2021, 23:59

  3. Лекция Линейная регрессия. Метод максимального правдоподобия. Градиентный спуск. Стохастический градиентный спуск. Регуляризация. L1, L2. Elastic net. Логистическая. Softmax. Домашняя работа 2 Дедлайн: 30.03.2021, 23:59

  4. Лекция Гиперпараметры. Кросс-валидация. Отбор признаков. Домашняя работа 3 Дедлайн: 06.04.2021, 23:59

  5. Лекция. Метод опорных векторов. SVM. Kernel trick. Домашняя работа 4. Дедлайн: 27.04.2021

  6. Лекция. Снижение размерности, линейный и нелинейные методы. Кластеризация. Домашняя работа 5 Дедлайн: 20.04.2021, 23:59

  7. Лекция. Решающие деревья. Категориальные признаки и работа с ними. Пропущенные значения и работа с ними. Понятие ансамбля и виды ансамблей. Бэггинг и метод случайных подпространств. Случайный лес. Домашняя работа 6 Дедлайн: 30.04.2021, 23:59

  8. Лекция. AdaBoost. Градиентный бустинг. Модификации градиентного бустинга (xgboost, lightgbm, catboost). Блендинг и стекинг. Домашняя работа 7 Дедлайн: до зачета, это дополнительное дз

  9. Лекция Оценка важности признаков в модели. Перестановочный метод. Boruta. SHAP. Домашняя работа 8 Дедлайн: до зачета, это дополнительное дз

  10. Лекция Нейронные сети, PyTorch. Домашняя работа 9

  11. Лекция Сверточные нейронные сети. Применение в биологии

  12. Лекция Улучшение сходимости нейросетей и борьба с переобучением

  13. Лекция. Автоенкодеры. VAE. CVAE

  14. Лекция Рекуррентные нейронные сети. Механизм attention.