ОБЯЗАННОСТИ:
- Разработка ETL процессов для подключения новых систем-источников
- Оптимизация и поддержка работы существующих ETL процессов
- Парсинг полуструктурированных данных для заливки в хранилище данных
- Коммуникация с экспертами систем-источников и BI аналитиков для корректной трансформации данных
- Документирование разработанных процессов
ТРЕБОВАНИЯ:
- Образование – Высшее в сфере ИТ
- Опыт работы – от 2-х лет
- Знание языков: английский Upper-Intermediate, Русский - свободно
- Опыт работы с инструментами Apache Nifi, Apache Airflow, Apache Spark, облачными технологиями MS Azure, AWS, GCP
- Знание Python и библиотек по работе с СУБД
- Опыт разработки DWH, Data Lakes