VIXTRACT

Удобный ETL инструмент для предварительной обработки данных и загрузки через API на основе Python.
Каждый специалист в области анализа данных знает, что самое трудоемкое и сложное в этой работе – это выгрузка и преобразование данных, или ETL (Extract-Transform-Load). Есть множество инструментов, но все они имеют свои недостатки. Миссия сообщества ViXtract – в том, чтобы аналитики направляли силы именно на анализ данных, а рутинные технические задачи закрывал бы простой и понятный инструмент.

ViXtract был создан и развивается командой профессионалов в области ETL, BI, DWH и Data Science при поддержке ряда коммерческих компаний. На сегодняшний день это:
ViXtract – это сборка на основе популярных открытых инструментов обработки данных, которая помогает аналитикам BI самостоятельно выгружать, очищать и преобразовывать данные без помощи ETL разработчиков.

Главные принципы ViXtract – удобство работы аналитика и неограниченные возможности развития. В основе ViXtract лежат три ключевых компонента: Jupyter – интерактивная среда для работы с Python, PETL – простая в освоении библиотека преобразования данных, и Cronicle – надежный планировщик с удобным интерфейсом.
Maintainer
Contributor

ЧТО ВЫ МОЖЕТЕ СДЕЛАТЬ С VIXTRACT?

Любые файловые источники и СУБД, а также API. AmoCRM, Google Analytics, 1С – огромное количество готовых Python библиотек и примеров к вашим услугам.
ПОДКЛЮЧИТЬСЯ К ЛЮБЫМ ИСТОЧНИКАМ ДАННЫХ
Очищайте, объединяйте, обогащайте данные простыми командами, которые можно выполнять в произвольном порядке или соединять в пайплайны.
ИНТЕРАКТИВНО ПРЕОБРАЗОВАТЬ ДАННЫЕ
Подготовленные данные легко выгрузить в любой формат или напрямую в BI систему при наличии коннектора.
ВЫГРУЖАТЬ ДАННЫЕ В ЛЮБУЮ BI СИСТЕМУ
Добавляйте задания в планировщик, настраивайте цепочки исполнения и уведомления об успешном/неуспешном выполнении, отслеживайте статистику использования серверных ресурсов.
АВТОМАТИЗИРОВАТЬ СОЗДАННЫЕ ЗАДАНИЯ ETL

ПОЧЕМУ VIXTRACT?

1
ЛУЧШЕЕ ИЗ МИРА OPEN-SOURCE
Подобранное на основе опыта лучших специалистов в области ETL, BI, DWH и Data Science.
Продуманная интеграция всех компонентов.
2
ПРОСТАЯ УСТАНОВКА И НАСТРОЙКА
Установка осуществляется одной командой, а для использования нужен только веб-браузер.
Из коробки поддерживается HTTPS и разграничение доступа пользователей.
3
СООБЩЕСТВО И пОДДЕРЖКА
Постоянно пополняемая коллекция обучающих видеороликов и демо-примеров, а еще Telegram-чат сообщества, в котором можно получить помощь и совет.

НАЧНИТЕ ИСПОЛЬЗОВАТЬ VIXTRACT ПРЯМО СЕЙЧАС!

Вы можете зарегистрироваться, чтобы получить доступ к публичному демо-серверу.
ПОПРОБОВАТЬ В ОБЛАКЕ
Для использования требуется компьютер с Linux, желательно чистая установка Ubuntu 18.04 LTS.
СКАЧАТЬ НА GITHUB
Рекомендуем начать работу с ViXtract с прохождения уроков (tutorials) по системе, а также с ознакомления с демо-примерами. Уроки и примеры доступны на демо-сервере сразу при регистрации, а для локальной установки их можно взять в папках docs/tutorials и docs/examples соответственно.

tutorials по системе

ОБРАТНАЯ СВЯЗЬ

ViXtract – это открытый проект под лицензией BSD-3, он создан, чтобы приносить пользу сообществу специалистов по управлению на основе данных. Каждый желающий может внести свой вклад:

– Внести свои доработки проекта. На текущий момент наибольшая потребность заключается в написании автотестов и создании базы примеров интеграций с различными системами. Внести доработки можно, открыв Pull request на GitHub.

– Поделиться обратной связью: сообщением о найденном баге или идее улучшения, открыв Issue на GitHub

– Популяризировать ViXtract и сам подход к ETL на основе экосистемы Python. Поделитесь информацией в профильных сообществах!

С любыми идеями и вопросами вы можете обратиться к мейнтейнерам проекта, заполнив форму ниже.
Нажимая на кнопку «Отправить», я даю согласие на обработку своих персональных данных и соглашаюсь с политикой конфиденциальности.