ViXtract

Удобный ETL-инструмент для предварительной обработки данных и загрузки через API на основе Python

Выгрузка и преобразование данных

Каждый специалист в области анализа данных знает, что самое трудоемкое и сложное в этой работе – это выгрузка и преобразование данных, или ETL (Extract-Transform-Load). Есть множество инструментов, но все они имеют свои недостатки. Миссия сообщества ViXtract – в том, чтобы аналитики направляли силы именно на анализ данных, а рутинные технические задачи закрывал бы простой и понятный инструмент.

ViXtract был создан и развивается командой профессионалов в области ETL, BI, DWH и Data Science при поддержке ряда коммерческих компаний. На сегодняшний день это:

ViXtract

Сборка на основе популярных открытых инструментов обработки данных, которая помогает аналитикам BI самостоятельно выгружать, очищать и преобразовывать данные без помощи ETL-разработчиков.

Главные принципы ViXtract

Удобство работы аналитика и неограниченные возможности развития. В основе ViXtract лежат три ключевых компонента.
PETL
Интерактивная среда для работы с Python
Простая в освоении библиотека преобразования данных
Надежный планировщик с удобным интерфейсом

Что вы можете сделать с ViXtract?

Любые файловые источники и СУБД, а также API. AmoCRM, Google Analytics, 1С – огромное количество готовых Python библиотек и примеров к вашим услугам.
Подключиться к любым источникам данных
Очищайте, объединяйте, обогащайте данные простыми командами, которые можно выполнять в произвольном порядке или соединять в пайплайны.
Интерактивно преобразовать данные
Подготовленные данные легко выгрузить в любой формат или напрямую в BI-систему при наличии коннектора.
Выгружать данные в любую BI-систему
Добавляйте задания в планировщик, настраивайте цепочки исполнения и уведомления об успешном/неуспешном выполнении, отслеживайте статистику использования серверных ресурсов.
Автоматизировать созданные задания ETL

Почему ViXtract?

Лучшее из мира Open-Source
Подобранное на основе опыта лучших специалистов в области ETL, BI, DWH и Data Science. Продуманная интеграция всех компонентов.
Простая установка и настройка
Сообщество и поддержка
Установка осуществляется одной командой, а для использования нужен только веб-браузер. Из коробки поддерживается HTTPS и разграничение доступа пользователей.
Постоянно пополняемая коллекция обучающих видеороликов и демопримеров, а еще Telegram-чат сообщества, в котором можно получить помощь и совет.
1
2
3

Tutorials по системе

Обратная связь

ViXtract – это открытый проект под лицензией BSD-3, он создан, чтобы приносить пользу сообществу специалистов по управлению на основе данных. Каждый желающий может внести свой вклад.
Внести свои доработки проекта
На текущий момент наибольшая потребность заключается в написании автотестов и создании базы примеров интеграций с различными системами. Внести доработки можно, открыв Pull request на GitHub.
Поделиться обратной связью
Популяризировать ViXtract и сам подход к ETL на основе экосистемы Python
Cообщением о найденном баге или идее улучшения, открыв Issue на GitHub.
Поделитесь информацией в профильных сообществах!
1
2
3
С любыми идеями и вопросами вы можете обратиться к мейнтейнерам проекта, заполнив форму