Я решил наконец-то разобраться в Data Science и AI. Поэтому собрал список сайтов, где можно изучить эти сферы с нуля.
1. Kaggle [ENG]
Сайт, известный соревнованиями по машинному обучению с призовым фондом, доходящим до $1 000 000.
В разделе Learn есть курсы по:
- Основам программирования
- Machine learning
- Глубокому обучению
- Компьютерному зрению
- Python-библиотеке Pandas
- SQL
- Визуализации данных
- Временным рядам
- Геопространственному анализу
Также есть встроенная среда программирования – Kaggle Notebooks, которая создана на основе Jupyter Notebook.
В разделе Code можно посмотреть опубликованный код других участников платформы. В Models – скачать модели машинного обучения от таких компаний, как Google, Meta, Mistral AI, а также пользователей Kaggle. В Discussions – задать вопросы коммьюнити. В Datasets – загрузить тысячи датасетов в формате CSV, JSON, BigQuery и SQLite, которые затем вы можете использовать для обучения, исследований и работы.
Не забывайте присоединиться к официальному Discord-серверу Kaggle и нетворкать с дата сайнтистами со всего мира!
2. OSSU [ENG]
OSSU – это проект по созданию роудмапов для обучения различным областям Computer Science.
Данный «путь» – это пошаговый план изучения Data Science, состоящий из онлайн-курсов с edX, Coursera, MIT OpenCourseWare, Udacity, YouTube и других бесплатных образовательных платформ.
Роудмап имеет следующую программу:
- Introduction to Data Science
- Introduction to Computer Science
- Data Structures and Algorithms
- Databases
- Single Variable Calculus
- Linear Algebra
- Multivariable Calculus
- Statistics & Probability
- Data Science Tools & Methods
- Machine Learning/Data Mining
- Final project
При временных затратах 20 часов в неделю её можно освоить за 2 года.
По уровню знаний она примерно равна программе бакалавриата.
Самостоятельное обучение на протяжении такого долгого срока требует очень крутой дисциплины. Общение с другими людьми, осваивающими программу, поможет не сойти с пути – Discord-сервер OSSU.
3. Stepik [RU]
Российский образовательный маркетплейс с упором на курсы по программированию, IT в целом и подготовке к экзаменам.
Есть много как бесплатных, так и платных обучающих программ.
Примеры, которые могут быть вам полезны:
- Введение в Data Science и машинное обучение
- Нейронные сети
- Практикум по статистике на Python
- Введение в соревновательный Data Science
- Big Data и Data Science: начни погружение с нуля
4. Сайт Андрея Карпаты [ENG]
Андрей Карпаты – сооснователь OpenAI, бывший директор по искусственному интеллекту в Tesla, ныне работает над образовательным AI-стартапом Eureka Labs и публикует туториалы на YouTube.
5. fast.ai [ENG]
Курс из 2 частей с более чем 50+ часами контента.
6. DataPen [ENG]
Каталог бесплатных материалов для всех, кто связан с аналитикой данных.
- R
- Python
- SQL
- Excel
- Прохождение интервью
И другие гайды – на DataPen.
7. Reddit [ENG]
Много тематических сабреддитов:
- r/ArtificialInteligence
- r/datascience
- r/MachineLearning
- r/learnmachinelearning
- r/MLQuestions
- r/dataisbeautiful
- r/LanguageTechnology
- r/deeplearning
- r/datasets
- r/visualization
И дискуссий-подборок обучающих материалов:
- What are the best resources to learn about AI for complete beginners?
- How do I get into the AI world as complete beginner?
- A clear roadmap to complete learning AI/ML from ZERO
- What are some of the great resources to learn Machine learning from beginner to advanced?
- What are the best sources to self learn data science from scratch?
- Is it still worth self-learning Data Science and is it okay to abandon it?