Привет, Олимпийский! Это репозиторий для линейки онлайн-курсов по статистике.
- Сбор и анализ данных в python
- Основы машинного обучения
- Математическая статистика и AB-тестирование
- Продвинутые методы машинного обучения
- Статистические методы анализа данных
Вам этого мало и хотите больше? Добро пожаловать в специализацию Промышленное машинное обучение. Подзабыли математику, но хотите пройти наши курсы? Тогда смотрите специализацию Математика для анализа данных
- Материалы лекций лежат в папках
./week*
, недели 1-5 относятся к курсу Сбор и анализ данных в python, недели 6-11 к курсу Математическая статистика и AB-тестирование, недели 12-16 к курсу Статистические методы анализа данных. Сквозная нумерация используется для удобства :) - Они же продублированны на coursera, можно скачивать их прямо с неё
- Чтобы скачать репозиторий полностью, нажмите зелёную кнопку
Code
, а дальшеDownload ZIP
, конечно же можно просто склонировть репозиторий, если вы умеете пользоваться git - Если вы хотите скачать из репозитория конкретную папку, просто вставьте ссылку на неё в сервис для скачки
- Для прохождения курса вам понадобятся: стандартный дистрибутив python 3, ручка синяя, ручка чёрная, ручка цветная и тетрадка
- Учим статистику, смотрим какое место она занимает среди наук о данных
- Всегда сначала понимаем, как работает концепт, а потом смотрим на код, никаких блэкбоксов
- Много идей, попытка разобраться в том как устроен мир и что будет дальше
Обратите внимание, что к каждой неделе курса есть README со списком полезных материалов.
На русском:
- Учебник Черновой по терверу, довольно короткий, несложный и ёмкий
- Учебник Черновой по матстату, так же хорош, как и книга по терверу, но некоторых тем не хватает
У Черновой менее популярное определение функции распределения,
$F(t)=P(X<t)$ , в нашем курсе мы используем$F(t)=P(X\leq t)$ , будьте аккуратны.
- Наглядная математическая статистика Лагутина, книга глубже, чем Чернова и немного сложнее
- Культурный код, сборник красивых нетривиальных задач по терверу и матстату
На английском:
- Coock boock по терверу и матстату в 10 страницах
- Pilon C.D. Probabilistic programming and Bayesian methods for hackers, можно найти перевод на русский язык, если искать <<Вероятностное программирование на Python>> (русские локализаторы косячат не только в названиях фильмов)
- Hyndman, R.J., Athanasopoulos G. Forecasting: principles and practice, отличный вводный учебник по временным рядам
- Blitzstein, Hwang, курс Statistics 110: книга, видеолекции, листки с упражнениями, теория вероятностей до статистики, но с MCMC и упражнениями в R.
Другие очень крутые источники:
- Визуализации по терверу и матстату. Можно посмотреть на условную вероятность и многое другое своими глазами.
- Репозиторий по теории вероятностей и статистике от Бориса Демешева с кучей полезных штук
- Набор лекций по рискам от Ильи Езепова
Спасибо всем всем всем, кто принял участие в разработке этих курсов, а именно:
Вычитка материалов и мудрые советы:
- Лобачёва Екатерина
Помощь с материалами:
- Сергеев Дмитрий
- Демешев Борис
- Лобачёва Екатерина
Ассистенство:
- Романенко Александра
- Айрапетян Жирайр
Съёмки, их организация, монтаж и отсмотр материала:
- Капчинский Анатолий
- Савилова Ксения
Организация всех процессов:
- Застрогина Екатерина
- Сапунова Алёна
Первым прошёл все курсы со всеми тестами от начала до конца:
- Зарманбетов Ахмед
Армия бета-тестеров, а в особенности:
- Алиев Самир,
- Евстафьев Сергей
- Хмелевской Егор