Ранее при создании потоков с CSV- или JSON-файлами была необходима помощь техподдержки. Теперь вы можете самостоятельно настраивать пресеты для таких потоков на этапе настройки источника данных.
Выгрузки в виде CSV- и JSON-файлов - универсальный способ настроить перекладку данных для любой системы, даже если в Garpun Feeds для нее нет готового коннектора. Многие популярные приложения и сервисы позволяют экспортировать содержащиеся в них данные в файловом виде. Далее вам достаточно указать в настройках потока путь к файлу и задать правила перекладки данных (настроить пресет).
А еще мы расширили список поддерживаемых протоколов для загрузки CSV- и JSON-файлов. Теперь загрузить данные можно и через SFTP наряду с доступными ранее загрузкой по URL и через FTP.
Алгоритм создания потока
Первоначально необходимо зайти в систему Garpun Feeds https://feeds.garpun.com/ под своим логином и паролем и нажать кнопку "+Поток данных".
1) Источник данных > Приемник данных
В открывшемся меню выбираем:
- Источник данных - CSV,
- Приемник данных - Database или BigQuery, в зависимости от задачи
Набор данных – Ручная конфигурация настроек
2) Настройка источника данных
Указываем:
- URL адрес файла FTP или SFTP
Ниже поля написаны все примеры URL, в зависимости от того, где файл расположен и требуется ли авторизация
- Тип разделителя в CSV файле
- Кодировка файла – UTF-8/cp1251
- Тип архива(если есть)
- Название файла – требуется ввести, если необходима фильтрация файлов. В строке поддерживаются регулярные выражения
- Использовать даты из периода запуска задачи – если ВКЛ, то в названии файла будет искаться дата из периода, например, поток запущен за 2024-01-01 – 2024-01-03, будет осуществлен поиск по названиям и выгружены только файлы, в названии которых есть "2024-01-01", "2024-01-02" и "2024-01-03"
- Данные о структуре файла – здесь мы указываем какие поля мы берем из исходного файла, в каком типе эти данные и то, в какое конкретно поле в приемники эти файлы будут помещены
name - имя колонки куда будут загружены даные (только латинские символы и нижнее подчеркивание)
path - заголовок колонки в исходном файле
type - тип данных
3) Настройка приемника данных
Этот шаг может отличаться, зависит от того, какой приемник был выбран на первом шаге настроек потока, однако принцип схожий для всех приемников.
На примере Database(clickhouse)
Выбираем подключение ClickHouse, либо добавляем подключение через кнопку "+Добавить"
- Выбираем базу данных
- Название схемы БД заполнять не нужно, т.к. это важно только для передачи в PostgreSQL.
- В качестве способа записи данных в таблицу оставляем обновление
4) Общие настройки
- В графе “Название потока” ввести название либо оставить сгенерированное автоматически
- В графе “Период сбора при автоматическом запуске” можно выбрать за какой период поток будет пересобирать статистику. По умолчанию - 30 дней.
- В графе “Расписание” - выбрать например 7:00 утра, в это время поток будет запускаться ежедневно
- Нажать "Готово"