Пример реестра с почтовым адресом в нескольких колонках

В данном примере рассмотрим реестр, состоящий из четырех колонок, приведенный на рисунке ниже. Данная таблица содержит адреса компаний. Как видно из рисунка, мы уже дали колонкам нормальные названия, из которых следует, что в таблице по каждой компании присутствует ее идентификатор, адрес, название, а также отдельно указан регион, который на самом деле является частью адреса.

Такая странная структура таблицы встречается достаточно часто, поскольку почтовые адреса, как правило, выгружаются из CRM-систем, где они хранятся не в одном поле, а как-то разбиты на несколько полей. Ситуация усугубляется тем, что между двумя частями адреса вклинилось название компании. Чтобы выполнить правильную обработку такого реестра, необходимо аккуратно настроить его схему.

По умолчанию сервис создал одну секцию «Секция 1» типа Адрес и объединил в эту секцию все колонки таблицы. Очевидно, что в таком виде обрабатывать адреса компаний не следует. Нам нужно исключить «ID компании» и «Название компании» из данной секции, поскольку эти колонки не содержат информации об адресе. Заодно назовем данную секцию «Полный адрес компании», это делается с помощью кнопки редактирования секции, отмеченной на рисунке выше. В результате данных изменений схема будет выглядеть следующим образом.

Кроме удаления лишних колонок из секции «Полный адрес компании» мы поменяли местами колонку «Адрес компании» и «Регион». Менять местами колонки в рамках секции можно путем их перетаскивания с помощью мыши, «хватаясь» за держатель, размещенный в левой части колонки, как это отмечено стрелками на рисунке выше. Смена порядка следования колонок внутри секции влияет на ход обработки их данных. В данном примере мы поставили регион перед остальной частью адреса, поскольку такой порядок записи адреса является более естественным и в ходе обработки учитывается сервисом для ускорения процесса и улучшения качества разбора и нормализации.

Для наглядности мы подсветили колонки на образце реестра с помощью кнопки с изображением галочки, чтобы еще раз убедиться, что секция с почтовым адресом компании скомпонована корректно.

версия сервиса:
обработано за 1 (мс)