Давайте представим, что вы классный аналитик, и к вам обратилась знакомая-риелтор с просьбой сделать аналитику рынка жилья, чтобы лучше разобраться в динамике рынка, застройщиках и в целом улучшить качество обслуживания клиентов.
Она предоставила несколько баз данных по предложениям на рынке, банковским покупкам и т. д.
Необходимо загрузить данные в платформу и на их базе создать модель данных, которая впоследствии позволит на ее основе делать аналитические запросы данных так, чтобы между файлами источника была настроена связь.
!
Если вам необходимо выполнить практическую работу, а свободного сервера нет, то можно получить доступ к нашему открытому демостенду Visiology 3.Х.
Открытый сервер — это сервер, на который могут зайти все желающие и посмотреть на платформу в действии. Вы также можете загрузить свои тестовые данные, поработать с панелью администрирования и построить дашборд.
Работать мы будем с тремя Excel-файлами + календарем.Данные представляют собой несколько не связанных между собой баз, которые ведутся автономно.
Первая таблица «offer.xlsx» включает информацию о площади, количестве квартир, цене за кв. м, а также содержит ID жилого комплекса.
Вторая таблица «ЖК.xlsx» — это по сути таблица-справочник, где фигурирует тот же ID, название девелопера, название ЖК и атрибуты для жилого комплекса: класс объекта, тип объекта и его местоположение.
И последняя таблица, которую мы будем загружать («transaction.xlsx») — это таблица с информацией по сделке. Здесь у нас имеется столбец «ID жилого комплекса», конкретный ID квартиры/ площадь квартиры и цена за квадратный метр этой квартиры.
Также имеется четвертая таблица «Календарь.xlsx»: так как встроенного календаря в платформе нет, нам нужно будет загрузить его отдельно.
Ход выполнения
Авторизуйтесь на платформе.
Зайдите в рабочую область, в которой будете выполнять кейс.
На сайдбаре выберите «Создание набора данных».
В открывшемся окне дайте имя. Оно может быть произвольным.
Перед вами открылось окно настройки модели данных, но оно сейчас пустое.
Загрузим данные на платформу.
В верхнем левом углу экрана выбираем «Данные» ➜ «Выбрать источник данных».
Выбираем «Книга Excel», так как работаем с этим форматом.
Выбираем файл с компьютера, таблицу «offer.xlsx».
После этого открывается окно настройки таблицы (данных), которую загружаем.
Для начала смотрим листы из книги Excel, которые хотим загрузить, также здесь их можно переименовать.
Обращаем внимание на настройки заголовков и то, с какой строки загружаются данные.
Настраиваем тип данных.
Типы данных
Слева от галочки находится отображение типа данных в столбце. В данном случае Visiology автоматически определила тип данных как Int64, или целочисленный тип данных.
При клике по типу данных появляется выпадающий список, и тип данных в столбце можно поменять.
Выпадающий список с типами данных
!
String — строковые тип данных
Int64 — целочисленный тип данных
Float — вещественны тип данных, или числа с плавающей точкой
DateTime — данные в формате дата-время в виде ГГГГ-ММ-ДД ЧЧ:ММ:СС
Decimal — десятичный тип данных, обладающий повышенной точностью при вычислениях в сравнении с типом данных Float, округляемый до второго знака после запятой
Платформа поддерживает работу со следующими типами данных
Тип данных результата в DAX зависит от оператора, а не от исходных столбцов, значения которых приводятся к нужному типу автоматически согласно требованиям выбранного оператора.
После настройки нажимаем кнопку «Загрузить выбранные», и после завершения загрузки таблица отобразится в поле настройки модели данных.
Таким же образом загружаем оставшиеся таблицы:
«ЖК.xlsx»
«transaction.xlsx»
Иногда случается так, что загружаемые таблицы накладываются друг на друга. Поэтому, если вы загрузили несколько таблиц, но в модели данных их не видно, попробуйте переместить мышкой доступную.
ViTalk GPT
Виртуальный ассистент
У вас должны быть загружены четыре таблицы.
После этого осталось только связать таблицы.
Для удобства мы рекомендуем вам не спешить с загрузкой данных в платформу. Откройте их, ознакомьтесь с содержимым, подумайте, как вы могли бы их связать между собой. Попробуйте нарисовать схему для этого, допустим, на бумаге.
После выполнения задания сравните свой результат с решением.
У вас должно получиться так:
Последовательность таблиц может отличаться, это не страшно.
Отлично! Если у вас получилось, продолжаем двигаться дальше.