Курсы по Data Engineering для начинающих
Базовый минимум для junior Data Engineer. Понятно, практично, с поддержкой наставника и сокурсников.
Каждый проект — это реальная бизнес-проблема. Ты не упражняешься в вакууме, ты помогаешь бизнесу принимать решения на основе данных.
Чтение CSV-файла стандартными средствами Python.
Поиск хита продаж с помощью функции
Забираем реальные вакансии из открытого API на Python.
Чистим грязные данные: пустые поля, лишние символы, значения-списки.
DuckDB и SQL: сколько платят, каких позиций больше, где больше вакансий.
Дашборд на Streamlit: зарплаты, уровни и страны на графиках.
Первая взрослая аналитическая база: поднимаем ClickHouse в Docker одной командой.
Данные-списки: храним теги, индустрии и регионы в Array(String) и LowCardinality.
Пагинация API на Python: собираем все 6000 компаний постранично и заливаем через clickhouse-connect.
SQL-аналитика: рост YC по годам, топ индустрий и тегов, статусы компаний.
Дашборд на Streamlit: фильтры по индустрии, батчу и статусу, графики роста.
Apache Airflow + ClickHouse: поднимаем окружение через Docker Compose.
Два DAG-а и слои данных: один собирает координаты МКС, второй обогащает их страной.
Расписание раз в минуту, retry при ошибках, чтение логов.
SQL-аналитика: над какими странами МКС летит чаще всего и трек за 30 минут.
Дашборд на Streamlit: трек станции на карте и графики по странам.
ClickHouse + DBeaver: поднимаем аналитическую БД в Docker.
Генерация и загрузка данных о поездках таксопарка.
SQL-аналитика: топ водителей по выручке без Excel.
Генерация синтетических данных и загрузка в ClickHouse.
Построение staging-слоя и витрин с помощью dbt.
Документация, lineage-граф и упаковка проекта в Git.
Оформление профиля: структура About, Headline, Featured, настройки Open to Work.
Развитие сети контактов: кого добавлять, как комментировать и разгонять профиль.
Посты: как показать, что ищешь работу, не говоря об этом прямо — 5 идей.
Структура поста для поиска работы и шаблон сопроводительного письма.
Аутрич и самопрезентация: как выходить на нужных людей напрямую.
Общие рекомендации по поиску работы
Наша сеть Telegram-каналов и чатов: вакансии и сообщества дата-инженеров по странам - Global, Кипр, Беларусь, Грузия, Казахстан, Кыргызстан, Узбекистан и др.
База из 100 компаний с корнями из СНГ - Fintech, AI/Data, DevTools, SaaS, Gaming, Health, EdTech и другие. Знакомый контекст как первый шаг на международный рынок.
Lorem ipsum dolor sit amet, consectetur adipiscing elit.
