Загрузка данных и настройка модели данных

Практическая работа 1

Знакомство с Visiology 3.X

МОДЕЛИРУЕм ситуацию

Давайте представим, что вы классный аналитик, и к вам обратилась знакомая-риелтор с просьбой сделать аналитику рынка жилья, чтобы лучше разобраться в динамике рынка, застройщиках и в целом улучшить качество обслуживания клиентов.

Она предоставила несколько баз данных по предложениям на рынке, банковским покупкам и т. д.

Задание

Необходимо загрузить данные в платформу и на их базе создать модель данных, которая впоследствии позволит на ее основе делать аналитические запросы данных так, чтобы между файлами источника была настроена связь.
!
Если вам необходимо выполнить практическую работу, а свободного сервера нет, то можно получить доступ к нашему открытому демостенду Visiology 3.Х.

Открытый сервер — это сервер, на который могут зайти все желающие и посмотреть на платформу в действии. Вы также можете загрузить свои тестовые данные, поработать с панелью администрирования и построить дашборд.

Исходные данные

Работать мы будем с тремя Excel-файлами + календарем. Данные представляют собой несколько не связанных между собой баз, которые ведутся автономно.

Первая таблица «offer.xlsx» включает информацию о площади, количестве квартир, цене за кв. м, а также содержит ID жилого комплекса.

Вторая таблица «ЖК.xlsx» — это по сути таблица-справочник, где фигурирует тот же ID, название девелопера, название ЖК и атрибуты для жилого комплекса: класс объекта, тип объекта и его местоположение.

И последняя таблица, которую мы будем загружать («transaction.xlsx») — это таблица с информацией по сделке. Здесь у нас имеется столбец «ID жилого комплекса», конкретный ID квартиры/ площадь квартиры и цена за квадратный метр этой квартиры.

Также имеется четвертая таблица «Календарь.xlsx»: так как встроенного календаря в платформе нет, нам нужно будет загрузить его отдельно.

Ход выполнения

  • Авторизуйтесь на платформе.
  • Зайдите в рабочую область, в которой будете выполнять кейс.
  • На сайдбаре выберите «Создание набора данных».
  • В открывшемся окне дайте имя. Оно может быть произвольным.
Перед вами открылось окно настройки модели данных, но оно сейчас пустое.

Загрузим данные на платформу.
  • В верхнем левом углу экрана выбираем «Данные» ➜ «Выбрать источник данных».
  • Выбираем «Книга Excel», так как работаем с этим форматом.
  • Выбираем файл с компьютера, таблицу «offer.xlsx».
После этого открывается окно настройки таблицы (данных), которую загружаем.
  • Для начала смотрим листы из книги Excel, которые хотим загрузить, также здесь их можно переименовать.
  • Обращаем внимание на настройки заголовков и то, с какой строки загружаются данные.
  • Настраиваем тип данных.

Типы данных

Слева от галочки находится отображение типа данных в столбце. В данном случае Visiology автоматически определила тип данных как Int64, или целочисленный тип данных.

При клике по типу данных появляется выпадающий список, и тип данных в столбце можно поменять.
Выпадающий список с типами данных
!
  • String — строковые тип данных
  • Int64 — целочисленный тип данных
  • Float — вещественны тип данных, или числа с плавающей точкой
  • DateTime — данные в формате дата-время в виде ГГГГ-ММ-ДД ЧЧ:ММ:СС
  • Decimal — десятичный тип данных, обладающий повышенной точностью при вычислениях в сравнении с типом данных Float, округляемый до второго знака после запятой
Платформа поддерживает работу со следующими типами данных
Тип данных результата в DAX зависит от оператора, а не от исходных столбцов, значения которых приводятся к нужному типу автоматически согласно требованиям выбранного оператора.
  • После настройки нажимаем кнопку «Загрузить выбранные», и после завершения загрузки таблица отобразится в поле настройки модели данных.
Таким же образом загружаем оставшиеся таблицы:
  • «ЖК.xlsx»
  • «transaction.xlsx»
Иногда случается так, что загружаемые таблицы накладываются друг на друга. Поэтому, если вы загрузили несколько таблиц, но в модели данных их не видно, попробуйте переместить мышкой доступную.
ViTalk GPT
Виртуальный ассистент
У вас должны быть загружены четыре таблицы.
  • После этого осталось только связать таблицы.
Для удобства мы рекомендуем вам не спешить с загрузкой данных в платформу. Откройте их, ознакомьтесь с содержимым, подумайте, как вы могли бы их связать между собой. Попробуйте нарисовать схему для этого, допустим, на бумаге.

После выполнения задания сравните свой результат с решением.

У вас должно получиться так:

Последовательность таблиц может отличаться, это не страшно.

Отлично! Если у вас получилось, продолжаем двигаться дальше.
Если у вас появились вопросы, напишите нам
Если у вас появились вопросы, напишите нам