Для начинающих в 2024 году.
- «Data Science: будущее для каждого» — «Нетология».
- «Введение в Data Science и машинное обучение» — Институт биоинформатики.
- «Нейронные сети» — Институт биоинформатики.
- «Машинное обучение» — ОмГТУ.
- «Анализ данных в R» — Институт биоинформатики.
- «Анализ данных просто и доступно» — Игорь Клейнер.
- «Квантовые вычисления» — СПбГУ.
- «Анализ данных» — РЭУ им. Г.В. Плеханова.
- «Исследование статистических взаимосвязей» — НГУ совместно с «2ГИС».
- «Основы статистики» — Институт биоинформатики.
- «Знакомство с R и базовая статистика» — СПбГУ.
- «Статистика для гуманитариев» — ТГУ.
- «Эконометрика» — НИУ ВШЭ.
- «Быстрый старт в искусственный интеллект» — МФТИ.
- «Основы Python и анализа данных» — «Яндекс.Практикум».
- «Математическая статистика» — Computer Science Center.
- «BI-разработчик. Основы работы в Tableau» — Артём Прытков.
- «Hadoop. Система для обработки больших объёмов данных» — VK Team.
- «Теория игр» — МФТИ.
- «A Crash Course in Data Science» — Университет Джонса Хопкинса.
- «Introduction to Data Science» — Alison.
- «Learn Data Science» — Dataquest.
- «Data Science» — Гарвардский университет.
- «Introduction to Data Science in Python» — Мичиганский университет.
«Data Science: будущее для каждого» от «Нетологии»
Язык: русский.
Длительность: 3 урока.
Формат обучения: записи вебинаров + текстовые материалы + тесты + практические задания.
Уровень сложности: для начинающих.
Обратная связь: нет.
Без сертификата
Программа обучения:
- Какие направления и профессии есть в сфере Data Science, чем они отличаются и как выбрать направление для себя.
- Обязательные навыки каждого аналитика и его инструментарий. Написание первого кода с помощью языка запросов SQL.
- Кого ищут работодатели. Пошаговый план для старта карьеры в сфере Data Science. Как составить карту ваших компетенций.
Что узнаете и чему научитесь:
- Разберётесь в направлениях сферы работы с данными.
- Узнаете обязательные навыки и инструментарий.
- Поймёте, как начать свою карьеру, и пошаговый гайд-план по поиску работу.
- Выполните реальную задачу специалиста по работе с данными: напишете код с помощью языка запросов SQL.
О преподавателях курса:
- Алексей Кузьмин — руководитель отдела Data Science в «ДомКлик».
- Елена Герасимова — руководитель направления «Аналитика» в «Нетологии».
«Введение в Data Science и машинное обучение» от Института биоинформатики
Язык: русский.
Длительность: 30 уроков, 9 часов видео, 54 теста, 21 интерактивная задача на 5-6 часов в неделю.
Формат обучения: видеоуроки + тесты + интерактивные задачи.
Уровень сложности: для начинающих.
Обратная связь: нет.
С сертификатом
Программа обучения:
- О чём курс?
- Big Data, Deep Machine Learning — основные понятия.
- Модель, начнём с дерева.
- Pandas, Dataframes.
- Фильтрация данных
- Группировка и агрегация.
- Визуализация, seaborn.
- Практические задания: Pandas.
- Секретный гость.
- Stepik ML contest — это ещё что такое?
- Stepik ML contest — data preprocessing.
- Какого музыканта Beatles я загадал или entropy reduction.
- Немного теории и энтропии.
- Titanic: Machine Learning from Disaster.
- Обучение, переобучение, недообучение и кросс-валидация.
- Последний джедай или метрики качества модели.
- Подбор параметров и ROC and Roll.
- Практика, Scikit-learn, fit, predict, you are awesome.
- ML на практике — автокорректор ошибок правописания.
- Секретный гость.
- Stepik ML contest.
- Снова возвращаемся к деревьям.
- Random forest.
- Зачем знать что-то ещё, если есть Random Forest?
- Секретный гость.
- И на Марсе будут яблони цвести.
- Нейроэволюция.
- Трюки в Pandas.
- Вот и всё, а что дальше?
- Stepik ML contest.
Что узнаете и чему научитесь:
- Основным понятиям Data Science и Machine Learning.
- Работе с наиболее популярными Python-библиотеками для анализа данных — Pandas и Scikit-learn.
Особенности курса:
- Для прохождения курса необходимы базовые знания в области статистики и програмирования на Python.
О преподавателях курса:
«Нейронные сети» от Института биоинформатики
Язык: русский.
Длительность: 24 урока, 6 часов видео, 90 тестов, 27 интерактивных задач, 6-10 часов в неделю.
Формат обучения: видеоуроки + тесты + интерактивные задачи.
Уровень сложности: для начинающих.
Обратная связь: нет.
С сертификатом
Программа обучения:
- Общая информация о курсе.
- Введение.
- Надо ли вам смотреть эту неделю? Урок с задачами.
- Ликбез по линейной алгебре: векторы.
- Ликбез по линейной алгебре: матрицы.
- NumPy: основы.
- Линейная алгебра в деле.
- Перцептрон и градиентный спуск.
- Нейроны: настоящие и искусственные.
- Перцептрон.
- Больше искусственных нейронов.
- Градиентный спуск.
- Больше градиентного спуска.
- Однослойные модели.
- Алгоритм обратного распространения ошибки.
- Многослойный перцептрон.
- Целевые функции.
- Мониторинг состояния сети.
- Визуализация.
- Тест.
- Практика.
- Сюрприз и заключение.
Что узнаете и чему научитесь:
- Ознакомитесь с принципами работы нейронных сетей.
- Применению нейронных сетей для решения практических задач.
Особенности курса:
- Для прохождения курса необходимы базовые знания в области статистики, линейной алгебры и програмирования на Python.
О преподавателях курса:
- Арсений Москвичёв — инженер-исследователь, выпускник биологического и психологического факультетов СПбГУ.
- Анастасия Миллер — сотрудница компании JetBrains, выпускница математико-механического факультета СПбГУ.
«Машинное обучение» от ОмГТУ
Язык: русский.
Длительность: 73 урока, 7 часов видео, 68 тестов.
Формат обучения: видеоуроки + тесты.
Уровень сложности: для начинающих.
Обратная связь: нет.
С сертификатом
Программа обучения:
- Введение в машинное обучение и основные понятия статистики.
- Восстановление пропущенных значений.
- Поиск выбросов и аномалий.
- Кластеризация.
- Задача предсказания, линейная регрессия.
- Классификация, kNN, кросс-валидация.
- Деревья в машинном обучении.
- Линейные классификаторы.
- Вероятностные алгоритмы. Наивный Байес.
- Ансамбли алгоритмов.
- Отбор признаков и объектов.
Что узнаете и чему научитесь:
- Построению моделей машинного обучения.
- Обработке таблиц с данными.
- Восстановлению данных с помощью искусственного интеллекта.
- Освоите необходимые термины на тему машинного обучения для общения с будущими заказчиками.
- Узнаете, какие задачи можно доверить ЭВМ.
Особенности курса:
- Для прохождения курса необходимы базовые математические навыки.
О преподавателях курса:
- Артём Шевляков — доктор физико-математических наук, преподаватель ОмГТУ. Заместитель директора Института математики и компьютерных наук Тюменского университета.
«Анализ данных в R» от Института биоинформатики
Язык: русский.
Длительность: 19 уроков, 5 часов видео, 26 тестов, 50 интерактивных задач.
Формат обучения: видеоуроки + тесты + интерактивные задачи.
Уровень сложности: для начинающих.
Обратная связь: нет.
С сертификатом
Программа обучения:
- Общая информация о курсе.
- Переменные.
- Работа с data frame.
- Элементы синтаксиса.
- Описательные статистики. Графики.
- Сохранение результатов.
- Статистика в R. Часть 1.
- Анализ номинативных данных.
- Сравнение двух групп.
- Применение дисперсионного анализа.
- Создание собственных функций.
- Статистика в R. Часть 2.
- Корреляция и простая линейная регрессия (МНК).
- Множественная линейная регрессия. Отбор моделей.
- Диагностика модели.
- Диагностика модели. Продолжение.
- Логистическая регрессия.
- Экспорт результатов анализа из R.
- Заключение.
Что узнаете и чему научитесь:
- Манипулировать данными, используя как стандартные методы R и Rstudio, так и специальные пакеты и библиотеки.
- Применять основные методы статистического анализа: t-тест, корреляция, регрессия, дисперсионный и регрессионный анализ и др.
- Писать собственные функции в R.
- Визуализировать получаемые результаты.
Особенности курса:
- Для прохождения курса необходимы базовые знания в области статистики.
О преподавателях курса:
- Иван Иванчей — выпускник факультета психологии СПбГУ, научный сотрудник СПбГУ. Специализируется на экспериментальном исследовании и вычислительном моделировании когнитивных процессов человека.
- Анатолий Карпов — работал ведущим аналитиком в VK и Stepik. Специализируется на статистике, A/B-тестировании, машинном обучении и построении аналитических хранилищ данных. Автор онлайн-курсов по анализу данных на платформе Stepik.
«Анализ данных просто и доступно» от Игоря Клейнера
Язык: русский.
Длительность: 106 уроков, 23 часа видео, 36 тестов.
Формат обучения: видеоуроки + тесты.
Уровень сложности: для начинающих.
Обратная связь: нет.
С сертификатом
Программа обучения:
- Данные по всюду. Эпоха анализа данных.
- Виды данных.
- Визуализация данных.
- Линейная регрессия.
- Катастрофа Челленджера.
- Анализ данных корона вируса.
- Анализ данных и болезни сердца.
- Любовь и данные.
- Нейронные сети. Глубокое обучение.
- Коронавирус сдавайся!
- Анализ изображений.
- Анализ текстовых данных: твитер, Энрон, смс — спам.
- Этика анализа данных.
- Понравилось? Как продолжить обучение.
Что узнаете и чему научитесь:
- Основам анализа данных.
- Основным алгоритмам анализа и их использованию для повседневных задач.
- Разговаривать с данными и уметь их слушать.
О преподавателях курса:
- Игорь Клейнер — работал в компаниях Huawei, Intel, Skype, Microsoft, Infowatch. Преподавал в открытом университете Израиля, Хайфском университете и других высших учебных заведениях. Опыт преподавания — более 20 лет.
«Квантовые вычисления» от СПбГУ
Язык: русский.
Длительность: 10 недель, 4-6 часов в неделю.
Формат обучения: видеоуроки + теоретические текстовые материалы + тесты.
Уровень сложности: для математиков и программистов.
Обратная связь: нет.
С сертификатом
Программа обучения:
- Введение.
- Математическая модель квантовых вычислений.
- Алгоритм Шора.
- Алгоритм Гровера и границы квантовых вычислений.
Что узнаете и чему научитесь:
- Разберётесь в математическом описании квантового алгоритма, научитесь разрабатывать собственные квантовые алгоритмы, анализировать применимость квантовых вычислений к конкретной задаче.
- Изучите математическую модель квантовых вычислений, структуру и примеры квантовых алгоритмов.
- Овладеете навыками анализа и сравнения классических и квантовых алгоритмов.
О преподавателе:
- Сысоев Сергей — кандидат физико-математических наук, доцент.
«Анализ данных» от РЭУ им. Г.В. Плеханова
Язык: русский.
Длительность: 20 уроков, 1 час видео.
Формат обучения: видеоуроки + теоретические текстовые материалы + тесты.
Уровень сложности: для прохождения курса требуются знания экономической теории и математики.
Обратная связь: нет.
С сертификатом
Программа обучения:
- Статистические данные: теоретические основы и классификации.
- Абсолютные и относительные статистические показатели.
- Виды относительных показателей.
- Средние величины.
- Понятие вариации. Абсолютные показатели вариации.
- Относительный показатели вариации.
- Виды дисперсий.
- Теоретические основы оценки взаимосвязи признаков.
- Критерий хи-квадрат в оценке взаимосвязи признаков.
- Оценка тесноты связи между качественными признаками.
- Неметрическая корреляция.
- Оценка тесноты связи количественных признаков.
- Понятие динамики социально-экономических явлений.
- Виды рядов динамики.
- Аналитические показатели рядов динамики.
- Средние показатели рядов динамики.
- Простейшие методы прогнозирования.
- Понятие структуры социально-экономических явлений.
- Показатели структурных сдвигов.
- Оценка концентрации и централизации.
Что узнаете и чему научитесь:
- Понимание абсолютных и относительных статистических показателей.
- Анализ взаимосвязи признаков.
- Понимание динамики и структуры социально-экономических явлений.
- Построение прогнозных оценок.
Кто проводит курс:
- Курс разработан на базе кафедры статистики РЭУ им. Г.В. Плеханова.
«Исследование статистических взаимосвязей» от НГУ совместно с «2ГИС»
Язык: русский.
Длительность: 6 уроков.
Формат обучения: видеоуроки + теоретические текстовые материалы + тесты.
Уровень сложности: для начинающих.
Обратная связь: в чате в Telegram.
С сертификатом (выдаётся на платном курсе)
Программа обучения:
- Статистическая гипотеза.
- Статистические критерии.
- Алгоритм проверки статистических гипотез.
- Свойства критериев.
- Метод Монте-Карло.
Что узнаете и чему научитесь:
- Чем статистическая гипотеза отличается от «обычного предположения».
- Какие бывают статистические гипотезы и какие статистические критерии разработаны для их проверки.
- Как делать проверку статистических гипотез (как формулировать статистические гипотезы для решения исследовательских задач, а также выбирать подходящие критерии для их проверки).
Особенности курса:
- Курс представляет собой первый бесплатный модуль большого платного курса.
О преподавателях:
- Ольга Ечевская — кандидат социологических наук, доцент кафедры социологии ЭФ НГУ, сооснователь проекта «Святая Сибирь».
- Наталья Галанова — специалист по анализу данных в 2GIS.
- Виктор Дёмин — специалист по анализу данных в 2GIS, кандидат технических наук.
«Основы статистики» от Института биоинформатики
Язык: русский.
Длительность: 29 уроков, 4 часа видео.
Формат обучения: видеоуроки + теоретические текстовые материалы + тесты.
Уровень сложности: для начинающих.
Обратная связь: нет.
С сертификатом
Программа обучения:
- Общая информация о курсе.
- Генеральная совокупность и выборка.
- Типы переменных. Количественные и номинативные переменные.
- Меры центральной тенденции.
- Меры изменчивости.
- Квартили распределения и график box-plot.
- Нормальное распределение.
- Центральная предельная теорема.
- Доверительные интервалы для среднего.
- Идея статистического вывода, p-уровень значимости.
- T-распределение.
- Сравнение двух средних; t-критерий Стьюдента.
- Проверка распределения на нормальность, QQ-Plot.
- Однофакторный дисперсионный анализ.
- Множественные сравнения в ANOVA.
- Многофакторный ANOVA.
- АБ тесты и статистика.
- Понятие корреляции.
- Условия применения коэффициента корреляции.
- Регрессия с одной независимой переменной.
- Гипотеза о значимости взаимосвязи и коэффициент детерминации.
- Условия применения линейной регрессии с одним предиктором.
- Применение регрессионного анализа и интерпретация результатов.
- Задача предсказания значений зависимой переменной.
- Регрессионный анализ с несколькими независимыми переменными.
- Выбор наилучшей модели.
- Классификация: логистическая регрессия и кластерный анализ.
- GLM и продвинутые темы.
- Заключение.
Что узнаете и чему научитесь:
- Визуализации, анализу и разбору данных.
- Расчёту коэффициентов корреляции.
- Построению регрессионных уравнений.
- Проверке гипотез.
- Практическому применению языка R.
О преподавателе:
- Анатолий Карпов — основатель онлайн-школы Data Science Karpov.Courses, экс-аналитик в VK Group, экс-руководитель команды аналитики в отделе бизнеса и рекламы «ВКонтакте»
«Знакомство с R и базовая статистика» от СПбГУ
Язык: русский.
Длительность: Курс рассчитан на 5 недель обучения, 4-5 часов в неделю.
Формат обучения: видеоуроки + теоретические дополнительные материалы + тесты.
Уровень сложности: для начинающих.
Обратная связь: есть.
С сертификатом
Программа обучения:
- Знакомство с R.
- Работа с данными.
- Графики с использованием ggplot2.
- Описательная статистика.
- Тестирование гипотез.
Что узнаете и чему научитесь:
- Выполнять простые математические действия, работать с переменными и векторами.
- Создавать скрипты на языке R.
- Использовать индексы и логические векторы для отбора данных в векторах и датафреймах.
- Импортировать в R данные в форматах .xlsx, .csv.
- Строить гистограммы, боксплоты, точечные, линейные графики средствами пакета ggplot2.
- Создавать документы в формате .Rmd.
- Рассчитывать для выборок разные описательные статистики (медиану, квантили, минимум и максимум; среднее и стандартное отклонение; дисперсию; стандартную ошибку среднего).
- Выбирать подходящие описательные статистики в зависимости от задач анализа.
- Стандартизировать (сделать z-преобразование) значений переменной.
- Рассчитывать вероятность попадания нормально распределенной величины в конкретный диапазон значений.
- Строить доверительные интервалы с использованием z и t распределений.
- Отличать односторонние и двусторонние альтернативные гипотезы.
- Распознавать наиболее частые варианты неправильной интерпретации уровней значимости.
- Применять t-тест для сравнения средних значений и интерпретировать его результаты.
- Делать поправки для уровня значимости в случае множественного тестирования гипотез.
- Проводить анализ данных (описывать выборки и сравнивать две группы при помощи t-критерия) при помощи R и создавать отчеты в формате Rmd.
Кто проводит курс:
- Курс разработан на основе образовательной программы Санкт-Петербургского государственного университета.
«Статистика для гуманитариев» от ТГУ
Язык: русский.
Длительность: 111 уроков. Курс рассчитан на 11 недель обучения, 8-12 часов в неделю.
Формат обучения: видеоуроки + тесты.
Уровень сложности: для прохождения курса необходимы базовые знания дисциплин «Математика» и «Компьютерные технологии и информатика».
Обратная связь: есть.
С сертификатом
Программа обучения:
- Знакомство с пакетом R.
- Рабочее пространство в R.
- Типы и структуры данных.
- Последовательности, векторы, матрицы.
- Списки, массивы, факторы.
- Объекты типа data.frame.
- Введение в статистику.
- Сводка, группировка.
- Измерительные шкалы и типы данных.
- Генеральная и выборочная совокупность.
- Табличные способы представления выборок.
- Графические способы представления выборок.
- Точечные оценки параметров.
- Числовые характеристики выборки.
- Средние показатели.
- Меры вариации.
- Структурные характеристики.
- Интервальное оценивание.
- Предварительная обработка данных (пропуски, выбросы).
- Проверка статистических гипотез.
- Критерии согласия.
- Критерии проверки нормальности.
- Параметрические критерии сравнения групп.
- Непараметрические критерии сравнения групп.
- Корреляционный анализ количественных данных.
- Парный коэффициент корреляции Пирсона.
- Ранговая корреляция.
- Анализ таблиц сопряженности.
- Регрессионный анализ. Общая постановка задачи.
- Парная регрессии.
- Множественная регрессия.
- Дисперсионный анализ (ANOVA). Общая постановка задачи.
- Однофакторный ANOVA.
- Двухфакторный ANOVA.
- Определение и структура временного ряда.
- Методы сглаживания временного ряда.
- Сезонная составляющая.
- Экономические индексы.
- Итоговая аттестация.
Что узнаете и чему научитесь:
- Проводить предварительную обработку данных для статистических исследований.
- Выбирать наиболее адекватные статистические методы для анализа.
- Применять (реализовывать) статистические методы для анализа данных.
- Применять пакеты прикладных программа для реализации статистических методов.
- Интерпретировать полученные результаты.
Кто проводит курс:
- Курс подготовлен на базе Томского государственного университета.
«Эконометрика» от НИУ ВШЭ
Язык: русский.
Длительность: 15 недель на освоение программы, 6-7 часов в неделю, длина одной лекции 1,5 часа.
Формат обучения: видеолекции + тест + домашнее задание.
Уровень сложности: для прохождения курса необходимы знания по теории вероятности, математической статистики и линейной алгебре.
Обратная связь: есть.
С сертификатом
Программа обучения:
- Метод наименьших квадратов.
- Статистические свойства оценок коэффициентов.
- Введение в R.
- Дамми-переменные, сравнение вложенных моделей.
- Графики, фиктивные переменные и прогнозы в R.
- Мультиколлинеарность.
- Гетероскедастичность.
- Мультиколлинеарность и гетероскедастичность в R.
- Автокорреляция.
- Метод максимального правдоподобия, модели бинарного выбора.
- Автокорреляция и модели бинарного выбора в R.
- Временные ряды.
- Эндогенность.
- Временные ряды и эндогенность в R.
- Дополнительные главы эконометрики.
Что узнаете и чему научитесь:
- Собирать и анализировать исходные данные, необходимые для расчета экономических и социально-экономических показателей, характеризующих деятельность хозяйствующих субъектов.
- Осуществлять сбор, анализ и обработку данных, необходимых для решения поставленных экономических задач.
- Выбирать инструментальные средства для обработки экономических данных в соответствии с поставленной задачей, анализировать результаты расчетов и обосновывать полученные выводы.
- На основе описания экономических процессов и явлений строить стандартные теоретические и эконометрические модели, анализировать и содержательно интерпретировать полученные результаты.
- Использовать для решения аналитических и исследовательских задач современные технические средства и информационные технологии.
О преподавателе:
- Борис Демешев — старший преподаватель факультета экономических наук ВШЭ, магистр.
«Быстрый старт в искусственный интеллект» от МФТИ
Язык: русский.
Длительность: 23 урока, курс рассчитан на 4 недели, 2-5 часов в неделю.
Формат обучения: видеоуроки + тесты + интерактивные задачи.
Уровень сложности: для начинающих с базовыми знаниями в области программирования.
Обратная связь: нет.
С сертификатом
Программа обучения:
- Введение в машинное обучение.
- Линейные алгоритмы в машинном обучении.
- Метрики машинного обучения.
- Алгоритмы машинного обучения. Выбор модели.
- Домашнее задание.
- Нейронные сети: основы.
- Сверточные нейронные сети.
- Практика: классификация картинок.
- Задачи компьютерного зрения.
- Популярные архитектуры (ResNet), дообучение нейронной сети.
- Домашнее задание.
- Введение в NLP.
- Выделение признаков.
- Word Embeddings.
- Рекуррентные нейронные сети.
- Рекуррентные нейронные сети на практике.
- Домашнее задание.
- Жадный алгоритм.
- Вероятностный подход.
- Эмпирические наблюдения.
- Подкрутка простых решений.
- Классификация с помощью подсчета статистик.
- Итоговое тестирование.
Что узнаете и чему научитесь:
- Разберётесь в основах и алгоритмах машинного обучения.
- Узнаете, что такое нейронные сети, как они работают и как применять их на практике.
- Разберётесь в основах нейро-лингвистического программирования.
О преподавателях:
- Татьяна Гайнцева — исследователь в лаборатории LAMBDA (НИУ ВШЭ) и группе Video Intelligence Huawei, преподаватель Deep Learning School (МФТИ).
- Михаил Григорьев — преподаватель математики ФПМИ МФТИ, победитель международных олимпиад по математике, тренер сборной МФТИ на международных олимпиадах, жюри и составитель всероссийской олимпиады школьников по математике.
- Юрий Яровиков — заместитель заведующего лаборатории инноватики МФТИ, руководитель Школы глубокого обучения МФТИ, исследователь данных в «СберБанке».
- Антон Астахов — преподаватель DLSchool.
«Как стать аналитиком данных» от «Яндекс.Практикума»
Язык: русский.
Длительность: 2 недели, 20 часов.
Формат обучения: видеоуроки + практические занятия в онлайн-тренажёре.
Уровень сложности: для начинающих с базовыми знаниями в области программирования.
Обратная связь: нет.
Без сертификата
Программа обучения:
- Moscow Catnammycs.
- Ошибки, переменные и гипотезы.
- Что делают специалисты в области данных.
- Списки в Python.
- Цикл for.
- Условия и булева логика.
- Машинное обучение.
- Финальный проект.
Что узнаете и чему научитесь:
- Разберётесь в основных концепциях анализа данных.
- Узнаете, чем занимаются аналитики данных и специалисты по Data Science.
- Решите пять реальных кейсов по работе с данными из разных областей.
- Изучите азы Python и библиотеки pandas, научитесь строить некоторые графики и верно их трактовать.
Особенности курса:
- Первый модуль большого платного полугодового курса, во время которого учащиеся создают 13 учебных и реальных проектов для портфолио и получают диплом о профессиональной переподготовке либо сертификат о прохождении курса.
«Математическая статистика» от Computer Science Center
Язык: русский.
Длительность: 29 уроков, 11 часов видео.
Формат обучения: видеоуроки + тесты + интерактивные задачи.
Уровень сложности: для начинающих с базовыми знаниями в области математического анализа и теории вероятностей.
Обратная связь: нет.
С сертификатом
Программа обучения:
- Общие рекомендации. Моделирование.
- Краткий обзор понятий теории вероятностей.
- Выборка. Выборочное пространство.
- Описательная статистика.
- Задание на тему описательной статистики.
- Точечные оценки и их свойства.
- Методы построения точечных оценок.
- Задание на тему построения точечных оценок.
- Стратифицированные выборки.
- Доверительные интервалы.
- Задание на тему стратификации и построение интервальной оценки.
- Лемма Неймана-Пирсона.
- Критерии о параметрах нормального распределения.
- Критерии о параметрах нормального и биномиального распределений.
- Задача на проверку статистической гипотезы.
- Параметрические критерии однородности.
- Непараметрические критерии однородности.
- Однофакторный дисперсионный анализ.
- Задача на проверку однородности.
- Критерии согласия хи-квадрат и Колмогорова.
- Критерии нормальности.
- Таблицы сопряженности.
- Задание на проверку гипотезы о законе распределения.
- Множественная линейная регрессия.
- Анализ остатков.
- Корреляционный анализ.
- Задание на построение линейной регрессии.
- Итоговый тест.
- Заключительный урок.
О преподавателе:
- Лидия Грауэр — старший веб-аналитик Wrike. Имеет несколько лет опыта анализа данных в «Яндекс». Преподаватель Computer Science Center.
«BI разработчик. Основы работы в Tableau» от Артёма Прыткова
Язык: русский.
Длительность: 10 урока, 2 часов видео
Формат обучения: видеолекции + тесты.
Уровень сложности: для прохождения курса необходимы навыки работы в Exсel.
Обратная связь: нет.
С сертификатом
Программа обучения:
- Введение. Что вы узнаете в этом курсе. Об авторе.
- Инструменты Tableau. Подготовка к работе.
- Подключение к данным.
- Знакомство с интерфейсом. Основные понятия.
- Создание сводной таблицы. Форматирование данных. Фильтры.
- Создание графиков.
- Расчетные поля. Группы и наборы. Параметры.
- Рззработка простого дашборда.
- Настройка интерактивных графиков и фильтров. Tableau Public.
- Карьера BI разработчика.
О преподавателе:
- Артём Прытков — специалист в области анализа и визуализации данных с 10-летним стажем.
«Hadoop. Система для обработки больших объёмов данных» от VK Team
Язык: русский.
Длительность: 33 урока, 12 часов видео
Формат обучения: видеолекции + тесты + интерактивные задачи.
Уровень сложности: для прохождения курса необходимы знания языков программирования и английского языка.
Обратная связь: нет.
С сертификатом
Программа обучения:
- Вводный урок курса.
- Что такое Hadoop?
- Архитектура HDFS.
- Shell-команды.
- Java API.
- Парадигма MapReduce.
- Фреймворк MapReduce.
- Java API. Введение.
- Java API. Продолжение.
- Hadoop Streaming.
- Алгоритмы на MapReduce.
- Реляционные функции.
- Расчет TF-IDF.
- Графы в MapReduce.
- Поиск кратчайшего пути в графе.
- PageRank.
- Проблемы MR-алгоритмов на графах.
- Pig.
- Основные операторы PigLatin.
- Hive.
- Pig vs Hive.
- Способы хранения данных.
- NoSQL.
- Введение в HBase.
- Архитектура HBase.
- Cassandra.
- Основные понятия Spark.
- Операторы Spark.
- Фреймворк Spark.
- Что такое YARN?
- Компоненты YARN.
- MapReduce 2.0.
- Заключительный урок.
О преподавателе:
- Евгений Чернов — руководитель отдела анализа в Поиск@Mail.ru.
«Теория игр» от МФТИ
Язык: русский.
Длительность: длительность курса 13 недель.
Формат обучения: видеолекции + тесты + практические задания.
Уровень сложности: для начинающих с базовыми знаниями линейной алгебры, математического анализа в рамках университетского курса, теории вероятностей.
Обратная связь: при оплате итоговой сертификации.
С сертификатом (выдаётся после успешного завершения платной сертификации)
Программа обучения:
- Позиционные игры.
- Статические игры.
- Динамические игры.
- Кооперативные игры.
- Приложения теории игр.
Что узнаете и чему научитесь:
- Изучите классификацию игр, основы моделирования розыгрышей игр, основные принципы решения игр.
- Научитесь применять имеющиеся знания для решения практических задач и использовать новые технологии анализа экономических систем.
- Получите представление о формировании стратегий, платежах, цене игры, основах рационального поведения, правилах справедливого дележа, взаимосвязи дисциплины с другими смежными дисциплинами.
- Разовьёте способность к восприятию, обобщению, анализу информации, постановке цели и выбору путей её достижения.
- Получите способность использовать основные законы естественнонаучных дисциплин в профессиональной деятельности, применять методы математического анализа и моделирования, теоретического и экспериментального исследования.
- Обретёте способность использовать основные положения и методы гуманитарных и социально-экономических наук при решении профессиональных задач.
О преподавателе:
- Савватеев Алексей Владимирович — доктор физико-математических наук, профессор кафедры дискретной математики МФТИ.
«A Crash Course in Data Science» от университета Джона Хопкинса
Язык: английский, с русскими субтитрами.
Длительность: 11 уроков, общая длительность 78 минут.
Формат обучения: видеоуроки + текстовые материалы + тесты + практические упражнения.
Уровень сложности: для начинающих.
Обратная связь: нет.
С сертификатом (выдаётся платно)
Программа обучения:
- About Your Instructors.
- What is Data Science?
- Statistics by example activities.
- Machine learning, the basics.
- Machine learning further reading.
- What is Software Engineering for Data Science?
- The Structure of a Data Science Project.
- The outputs of a data science experiment.
- The four secrets of a successful data science experiment.
- Data Scientist Toolbox.
- Separating Hype from Value.
О преподавателях курса:
- Jeff Leek — Associate Professor, Biostatistics Johns Hopkins University.
- Brian Caffo — Professor, Biostatistics, Johns Hopkins University
- Roger D. Peng — Associate Professor, Biostatistics, Johns Hopkins University
«Introduction to Data Science» от Alison
Язык: английский.
Длительность: общая длительность 1,5-2 часа.
Формат обучения: видеоуроки.
Уровень сложности: для прохождения курса необходимы базовые знания математики, линейной алгебры, а также базовые навыки программирования на R или Python.
Обратная связь: нет.
С сертификатом (выдаётся платно)
Программа обучения:
- Обзор науки о данных.
- Обзор машинного обучения.
- Оценка курса.
Что узнаете и чему научитесь:
- Для чего используется наука о данных
- Об этапах процесса обработки данных.
- Что такое машинное обучение и из каких частей оно состоит.
- Как используют различные типы регрессии.
- О различных типах алгоритмов классификации.
- Как работают два самых популярных алгоритма кластеризации.
- Зачем использовать Azure ML для своих проектов по науке о данных.
«Learn Data Science» от Dataquest
Язык: английский.
Формат обучения: текстовые теоретические материалы + практические упражнения.
Уровень сложности: для начинающих.
Обратная связь: нет.
Без сертификата
Что узнаете и чему научитесь:
- В процессе выполнения практических упражнений создадите реальные проекты, которыми пополните своё портфолио и которые сможете использовать в практической работе.
«Data Science» от Гарвардского университета
Язык: английский.
Длительность: курс рассчитан на 13 недель.
Формат обучения: видеоуроки + практические задания.
Уровень сложности: для начинающих.
Обратная связь: нет.
Без сертификата
Программа обучения:
- Обзор курсов.
- Pandas, Python, and Github.
- Scraping, Pandas, Python, and viz.
- Probability, Distributions, and Frequentist Statistics.
- Regression, Logistic Regression: in sklearn and statsmodels.
- Machine Learning.
- Machine Learning 2.
- Ensembles.
- Vagrant and VirtualBox, AWS, and Spark.
- Bayes.
- Text and Clustering.
- Projects, and an example.
«Introduction to Data Science in Python» от Мичиганского университета
Язык: английский, с русскими субтитрами.
Длительность: курс рассчитан на 4 недели, общая длительность уроков 35 часов.
Формат обучения: видеоуроки + практические задания.
Уровень сложности: для начинающих.
Обратная связь: нет.
С сертификатом (выдаётся платно)
Программа обучения:
- Основы обработки данных с помощью Python.
- Базовая обработка данных с помощью Pandas.
- Дополнительная обработка данных с помощью Pandas.
- Ответы на вопросы с беспорядочными данными.
Что узнаете и чему научитесь:
- Понимать такие методы, как лямбда-выражения и управление CSV-файлами.
- Описывать общие функциональные возможности и функции Python, используемые в науке о данных.
- Запрашивать структуры DataFrame для очистки и обработки.
- Объяснять распределения, выборку и t-тесты.
О преподавателях курса:
- Кристофер Брукс — доцент Мичиганского университета.
Очень жаль, что курсы в видео-формате. Мне крайне тяжело воспринимать на слух и неприятно тратить свое время, когда на чтение уйдет в 3 раза меньше времени (даже на полуторной скорости видео).