На данный момент доступно создание потока по выгрузке расходов из системы Яндекс Директ в ClickHouse.
Из-за особенностей API Яндекс отдает расходы двумя отчетами:
- Статистика. В этом отчете передается вся информация о расходах
- Контент. В этом отчете передаются url объявления
Для получения и объединения двух этих отчетов необходимо использовать определенный набор данных, подробнее в первом шаге настроек потока.
Первоначально необходимо зайти в систему Garpun Feeds https://feeds.garpun.com/ под своим логином и паролем и нажать кнопку "+Поток данных".
Обратите внимание
Для корректной передачи расходов требуется версия ClickHouse не ниже 23.8. К сожалению, версии ниже 23.8 не поддерживают часть функций, в следствие чего агрегирующие запросы могут работать некорректно.
Алгоритм создания потока из системы Я.Директ в ClickHouse:
1) Источник данных > Приемник данных
В открывшемся меню выбираем:
- Источник данных - Yandex Direct,
- Приемник данных - Database (PostgreSQL, MySQL, ClickHouse)
Набор данных "Загрузка расходов CH". Преимущество этого набора данных в том, что в результирующую таблицу будут добавлены поля utm_cource, utm_medium, utm_campaign, utm_term и utm_content, содержащие соответствующие метки. Это поможет более детально анализировать трафик и расходы.
2) Настройка источника данных
- Выбираем необходимое подключение, либо добавляем новое
- Указываем логин рекламного аккаунта, с которого собирается статистика. По нажатию на кнопку "+ Добавить" можно добавлять логины, однако просим учесть, что каждый новый логин будет тарифицироваться как отдельный поток, т.к. для каждого логина нужно отправлять отдельный запрос в Яндекс.
Необязательные настройки:
3) Настройка приемника данных
Выбираем подключение ClickHouse, либо добавляем подключение через кнопку "+Добавить"
- Выбираем базу данных
- Название схемы БД заполнять не нужно, т.к. это важно только для передачи в PostgreSQL.
- В качестве способа записи данных в таблицу оставляем обновление
4) Общие настройки
- В графе “Название потока” ввести название либо оставить сгенерированное автоматически
- В графе “Период сбора при автоматическом запуске” можно выбрать за какой период поток будет пересобирать статистику. По умолчанию - 30 дней.
- В графе “Расписание” - выбрать например 7:00 утра, в это время поток будет запускаться ежедневно
- Нажать "Готово"
В качестве итоговой таблицы мы получаем таблицу со следующей схемой:
Обратите внимание
Из-за технических особенностей передачи данных к итоговой таблице могут быть добавлены префиксы систем, участвующих в выгрузке, указание набора данных, а так же название кабинета/аккаунта. Так, при выгрузке расходов из системы Яндекс.Директ в ClickHouse нейминг таблицы будет следующим: db_yandex_direct_keyword_cost_upload_ch_our_cabinet, где:
db – система-приемник;
yandex_direct – система-источник;
keyword_cost_upload_ch – название набора данных;
our_cabinet – название кабинета Яндекс.Директ