Компоновки почтовых адресов
По умолчанию в личном кабинете пользователя компоновки адресов отсутствуют. В этом случае при загрузке и обработке реестров в отчетах будет использоваться неявная типовая компоновка адреса, которая подразумевает вывод достаточно большого числа колонок с информацией о стандартизованном адресе, что не всегда востребовано. Чтобы создать собственную компоновку стандартизованного адреса, выбрав только те адресные элементы, которые необходимы для вывода в отчеты, необходимо нажать на кнопку «Создать новую пустую компоновку», как это продемонстрировано на следующем рисунке.
Чтобы начать редактировать созданную пустую компоновку, необходимо запустить редактор компоновки, который открывается с помощью кнопки редактирования, обозначенной на рисунке выше.
Предположим, что мы хотим создать простую компоновку, с помощью которой в отчетах по каждому обработанному адресу будет выводиться только почтовый индекс и улица. Конечно, в реальных задачах такая компоновка вряд ли будет уместна, поскольку, как правило, требуется получить все нормализованные поля адреса, начиная с названия региона и заканчивая номером квартиры. Однако здесь мы рассмотрим вымышленный пример, чтобы упростить и сократить изложение.
Для начала в открывшемся редакторе необходимо дать нормальное название компоновки. Поскольку наша вымышленная компоновка содержит только почтовый индекс и улицу, дадим ей соответствующее название «Только индекс и улица» и с помощью кнопки с изображением плюсика добавим первую колонку компоновки. Добавленная колонка будет называться «Безымянная колонка 1».
В эту колонку мы хотим выводить почтовый индекс. Для этого необходимо добавить в колонку соответствующий адресный элемент, нажав на кнопку с изображением плюсика рядом с названием колонки. В выпадающем списке нужно выбрать добавляемый в колонку элемент адреса, в данном случае нас интересует «Почтовый индекс адреса», как это проиллюстрировано на следующем рисунке.
По нашему замыслу вторая колонка должна содержать информацию об улице почтового адреса. Поскольку все адресные поля содержат информацию о названии адресного объекта и о его типе, то договоримся, что во вторую колонку мы выведем оба этих адресных элемента. Тип улицы будем обрамлять круглыми скобками, а отделять его от имени улицы будем с помощью пробела. В итоговом отчете это должно выглядеть, следующим образом: (ул) Ткацкая.
Для решения данной задачи добавим в компоновку вторую колонку, также как мы это делали при добавлении почтового индекса. И последовательно включим в эту колонку два адресных элемента – «Тип улицы» и «Имя улицы». После этого дадим колонке имя «Улица». В результате этих действий редактор компоновки должен принять следующий вид.
В такой конфигурации второй колонки, в нее будет выводиться тип улицы и имя улицы без разделителей. Это необходимо всегда учитывать, когда в одну колонку сразу выводится несколько адресных элементов. Чтобы избежать слияния типа улицы с ее именем мы договорились, что тип улицы будет обрамляться скобками и отделяться от имени улицы пробелом. Чтобы этого добиться, необходимо нажать на кнопку редактирования напротив адресного элемента «Тип улицы», как показано на следующем рисунке.
В открывшемся окне в поле «Постоянный префикс перед реальными данными элемента» поставим открывающуюся скобку. В поле «Постоянный постфикс после реальных данных элемента» поставим закрывающуюся скобку. А в поле «Разделитель, если элемент не последний в колонке» поставим пробел. Результат выполнения этих действий уже отражен на рисунке выше. Таким образом, при выводе в колонку типа улицы, перед ним всегда будет вставляться открывающаяся скобка, после него – всегда будет выводиться закрывающаяся скобка, после чего будет выводиться пробел, чтобы отделить тип улицы от следующего адресного элемента данной колонки. В нашем случае следующим элементом в этой колонке является «Имя улицы», поэтому между типом и именем улицы будет устанавливаться пробел.
В редакторе элемента колонки также присутствует флажок «Выводить элемент, даже если он пустой». Если данный флажок установить, то в случае, если в стандартизованном адресе улица не будет иметь типа, то в колонку все равно принудительно будет выводиться открывающаяся и закрывающаяся скобка, между которыми выводиться ничего не будет (т.к. самого типа улицы нет). Данный флажок в основном может потребоваться, если итоговые отчеты, куда выводятся результаты нормализации адресов, в дальнейшем автоматически разбираются пользовательским приложением, например, CRM-системой, в процессе импорта стандартизованных данных. В этом случае, для упрощения парсинга полученных от сервиса CSV-отчетов, содержимое всех ячеек – и пустых, и заполненных – можно безусловно обрамлять префиксами и постфиксами.
После выполнения описанных выше действий внешний вид редактируемой компоновки адреса должен принять вид, показанный на следующем рисунке.
Как видно, у типа улицы вместо исходных иконок, соответствующих отсутствию префикса, постфикса и разделителя появились данные, указанные при редактировании этого элемента – открывающаяся и закрывающаяся скобки и пробел.
После нажатия кнопки «Ок» редактор компоновки закроется, и все выполненные изменения будут сохранены на сервисе.
Отчет, содержащий результат стандартизации адресов, отформатированных с использованием данной компоновки будет иметь следующий вид. Для наглядности первая колонка отчета содержит исходный адрес, подвергшийся обработке. Сам же результат выводится во второй и третьей колонках так, как мы этого и ожидали, настраивая компоновку. Во второй колонке выводится почтовый индекс адреса, а в третьей колонке – тип и название улицы.
Поскольку созданная нами компоновка является первой, она автоматически объявлена умолчальной, поэтому она будет использоваться автоматически, когда мы будем создавать и настраивать собственные отчеты. Типовые отчеты, настройки которых создает сам сервис при создании типовой персональной схемы для реестра, будут продолжать использовать неявную типовую компоновку. Подробнее о работе с отчетами рассказывается в статье по следующей ссылке.
При настройке компоновок адреса важно иметь представление о том, какие вообще адресные элементы можно включать в колонки итогового отчета. Все доступные в текущей версии сервиса адресные элементы можно увидеть в выпадающем списке при попытке добавить очередной элемент в колонку, как это показано на следующем рисунке.
Этот список может расширяться по мере выхода новых версий нашего сервиса. В настоящий момент для включения в колонки отчета доступны следующие элементы адреса.
-
Служебные данные – в данной категории представлены элементы служебного характера. В основном они могут быть интересны ИТ-специалистам.
-
Количество вариантов распознавания – с помощью данного элемента выводится число, отражающее количество вариантов распознавания адреса. Если при обработке адрес не удалось привести к стандартному виду, либо, если такой адрес вообще не существует, данный элемент будет выводить в отчет число 0. Если адрес записан так, что его можно интерпретировать по-разному, то данный элемент будет выводить число, большее 1. Для качественных адресов, интерпретируемых однозначно, данный элемент будет выводить значение 1.
-
Время обработки – с помощью данного элемента выводится количество миллисекунд, которые сервису потребовалось для обработки адреса. Данный параметр можно использовать для оценки быстродействия сервиса на реальных данных пользователя.
-
Почтовый индекс адреса – выводит в отчет индекс стандартизованного адреса. Почтовый индекс выводится независимо от того, присутствовал ли он в исходной записи реестра, поскольку сервис всегда выполняет восстановление индекса на основе эталонной адресной базы.
-
Адресные объекты – данная категория содержит элементы, соответствующие отдельным адресным компонентам – региону, району, городу, населенному пункту, территории и улице. Для типов и названий адресных объектов в данной категории присутствуют отдельные элементы. При настройке компоновки в приведенном выше примере использовался элемент «Тип улицы» и «Имя улицы» из этой категории для формирования колонки «Улица», выводимой в итоговый отчет.
-
Числовые поля – данная категория содержит элементы, соответствующие полям адреса, содержащим дом, корпус, строение и квартиру. По аналогии с предыдущей категорией, каждое числовое поле имеет отдельный элемент для вывода типа и отдельный элемент – для вывода числового значения.
-
Городской район и округ – в данной категории собраны элементы, с помощью которых в отчёт можно вывести информацию о принадлежности адреса городскому району и округу.
-
Кольцевая дорога – в данной категории сгруппированы элементы, отвечающие за вывод в отчёт информации о ближайшей к обработанному адресу кольцевой дороге. Элементы позволяют узнать, находится ли адрес в пределах кольца, и если нет – то вывести в отчёт расстояние от адреса до кольцевой дороги. Элемент может помочь в ситуациях, когда требуется оценить стоимость доставки до адреса, находящегося за пределами кольцевой дороги.
-
Станции рядом – в данной категории содержатся элементы, с помощью которых в отчёт выводятся данные о ближайших станциях метро и станциях скоростного легкорельсового транспорта. В отчёт можно вывести до 3-ёх ближайших станциях. По каждой из них можно вывести название станции, название линии или ветки в рамках транспортной сети, которой принадлежит станция, а также название самой транспортной сети. Кроме этого в отчёт можно вывести.
-
Тип станции – может принимать одно из двух значений: Subway и LightRail. Первое указывает на то, что данная станция является станцией метро, второе значение соответствует станции скоростного легкорельсового транспорта.
-
Расстояние до станции – расстояние в километрах по прямой линии на карте от адреса до станции.
-
Неиспользованный текст – данный элемент позволяет выводить в колонку отчета фрагмент исходной обработанной записи, который оказался бесполезным в процессе приведения адреса к стандартному виду. Данный элемент может использоваться, например, чтобы выводить в отдельную колонку комментарии или ориентиры, указанные в исходной записи. Например, при обработке адреса Москва, ул. Ткацкая, д. 5 (справа от входа в магазин), в неиспользованный текст попадет фрагмент (справа от входа в магазин). Чтобы не терять данную информацию, ее можно вывести в отдельную колонку отчета с помощью данного элемента.
-
Координаты – данная категория содержит элементы, позволяющие выводить GPS-координаты адреса. В данной категории кроме широты и долготы присутствует элемент:
-
Уровень координат объекта – данный элемент указывает, для какого поля адреса удалось получить координаты. Например, если в исходном адресе указан номер дома, а в элементе Уровень координат объекта присутствует Street, то это означает, что координаты для дома получить не удалось, поэтому сервис вернул координаты середины улицы.
-
Коды по справочникам – данная категория содержит элементы, с помощью которых можно выводить коды адреса, присвоенные ему в различных справочниках. В настоящий момент в данной категории доступны следующие элементы.
-
Актуальный код КЛАДР – классификационный код по справочнику КЛАДР, присвоенный актуальной в настоящий момент форме адреса. Если исходный адрес был записан в устаревшей форме, то сервис при обработке получит ее нормализованный вид, после чего приведет ее к актуальному виду. При этом устаревший и актуальный вид могут иметь различные КЛАДР-коды. Данный элемент позволяет выводить КЛАДР-код именно актуальной формы адреса.
-
Актуальный код ФИАС – классификационный код по справочнику ФИАС, присвоенный актуальной в настоящий момент форме адреса.
-
Идентификатор адреса по ФИАС – уникальный идентификатор стандартизованного адреса по справочнику ФИАС. Данные идентификаторы реально присваиваются обрабатываемым адресам, только если перед обработкой реестров в разделе Профиль личного кабинета установить флажок "Определять для адресов коды ФИАС, ОКАТО, ОКТМО и ИФНС при обработке реестров".
-
Уровень объекта, для которого получен идентификатор ФИАС. Данный элемент содержит имя адресного поля, для которого удалось детализировать идентификатор ФИАС. Если адрес распознан до дома и в ФИАС был успешно найден данный дом, то данный элемент будет содержать значение House. Если адрес распознан только до улицы, которая успешно найдена в ФИАС, то данный элемент будет содержать значение Street. Для остальных адресных полей применяется аналогичная логика: для поля с территорией элемент принимает значение Site, для поля с населённым пунктом - значение Place, для поля с городом используется значение City, для поля с административным районом - District, для поля с регионом – Region.
-
Идентификатор адреса по ГАР - идентификатор, присвоенный данному адресу в рамках Государственного Адресного Реестра (ГАР).
-
Код адреса по ОКАТО – код стандартизованного адреса по справочнику ОКАТО.
-
Кода адреса по ОКТМО – код стандартизованного адреса по справочнику ОКТМО.
-
Код ИФНС для физ. лиц – код налоговой инспекции, обслуживающей физических лиц по данному адресу.
-
Код ИФНС для юр. лиц – код налоговой инспекции, обслуживающей юридических лиц по данному адресу.
-
Актуальный АБР-код – классификационный кода актуальной версии адреса по внутреннему справочнику АБР.
-
Распознанный АБР-код – классификационный АБР-кода именно той версии адреса, которая была указана в реестре и которая была получена в процессе обработки, прежде чем сервис выполнил актуализацию адреса. Данный элемент заполняется только в случае, если обработанный адрес распознан как устаревший. В этом случае в поле «Распознанный АБР-код» сервис запишет АБР-код устаревшей версии адреса, тогда как в поле «Актуальный АБР-код» будет записан код актуальной на текущий момент версии адреса.
-
Показатели качества – данная категория позволяет выводить в отчет различные числовые характеристики, отражающие качество исходных данных. На основе значений этих показателей можно судить о достоверности информации, которую вернул сервис в результате стандартизации адреса.
-
Точность распознавания – данный элемент выводит число от 0 до 100, которое является количественной мерой того, насколько исходные адресные данные соответствуют стандартизованному адресу. Чем меньше ошибок и неточностей допущено при написании исходного адреса, тем выше возвращаемое значение точности.
-
Полнота распознавания - данный элемент выводит число от 0 до 100, которое является количественной мерой того, насколько полно были задействованы текстовые данные исходной адресной записи при распознавании. Чем больше в исходной записи лишних неадресных данных, не участвующих в распознавании адреса, тем меньше полнота.
-
Целевое количество полей - число содержит количество канонических полей адреса, информация по которым в идеале должна была присутствовать в исходном запросе. Данный показатель учитывает только поля от региона до улицы включительно. Числовые поля в данном показателе не учитываются.
-
Распознанное количество полей - число содержит количество реально распознанных полей адреса в исходной адресной записи. Данное количество может совпадать или быть меньше количества полей, возвращаемых в элементе «Целевое количество полей». Количество реально распознанных полей может быть меньше количества канонических полей адреса в том случае, если в исходных адресных данных пропущена информация о некоторых адресных полях, например, адрес записан без явного указания региона.
-
Количество верифицированных числовых полей по адресной БД - число содержит количество числовых адресных полей, значения которых удалось проверить по эталонным справочникам. Например, если в исходном адресе указан номер дома, который удалось распознать и проверить на существование по справочнику КЛАДР, данный показатель примет значение 1.
-
Признаки распознавания адреса – в данной категории присутствуют элементы, позволяющие выводить в отчеты латинские наименования признаков, которые были присвоены адресу в ходе его обработки. Данные признаки можно использовать совместно с показателями качества, чтобы принимать решение о том, насколько данный результат стандартизации целесообразно использовать в своих бизнес-задачах.
-
Признак Incomplete – присваивается обработанному адресу, если тот не является завершенным, поскольку в исходной записи не удалось найти обязательные к заполнению адресные поля, например, поле с улицей. Адреса с таким признаком нельзя использовать для почтовой рассылки. Например, адрес вида город Москва, дом 1 будет отмечен признаком Incomplete.
-
Признак ChildIsSkipped - наличие данного признака указывает на то, что в исходной записи не удалось найти необязательные адресные поля, например, поле с улицей. В отличие от адресов с признаком Incomplete, в адресах с признаком ChildIsSkipped не запрещено оставлять незаполненными такие поля, как улица. Но поскольку обычно такие поля все-таки заполняются, сервис снабжает такой адрес предупреждающим признаком ChildIsSkipped.
-
Признак HouseIsAbsent – данный признак присваивается адресу, если в нем одновременно не заполнен дом, корпус и строение. Такие адреса обычно не пригодны для почтовой рассылки, однако, отсутствие дома не является поводом для отбраковки адреса. Решение по таким адресам зависит от пользовательских задач, поэтому сервис помечает такие адреса предупреждающим признаком HouseIsAbsent.
-
Признак RestoredPlaceOrCity – наличие у адреса такого признака говорит о том, что при его обработке был восстановлен населенный пункт или город, отсутствующий в исходной записи. Во многих ситуациях сервис старается отбраковывать адреса, у которых явно пропущено название города или населенного пункта, тем не менее, есть ситуации, когда сервис выполняет восстановление этих полей. Поскольку в таких ситуациях есть небольшой шанс восстановить населенный пункт там, где на самом деле населенный пункт не указан осознанно, такие адреса отмечаются данным признаком.
-
Признак FoundInSearchMode – данный признак присваивается адресу, если его удалось привести к стандартному виду только с использованием режима смарт-поиска. Использование данного режима можно включить в разделе Профиль личного кабинета. По умолчанию данный режим всегда отключен. Режим смарт-поиска позволяет исправлять сильные искажения и ошибки в адресе, с которыми не справляются стандартные алгоритмы обработки. Однако использование данного режима может привести к тому, что адрес будет исправлен некорректно. Чтобы у пользователя была возможность проконтролировать результат обработки таких сложных адресов, они снабжаются данным признаком.
-
Признак UndetectedZip – признак сообщает о том, что в исходном адресе не был указан почтовый индекс. При этом индекс, который вернул сервис, был восстановлен по адресной базе.
-
Признак ImpreciseZip – данный признак присваивается тем адресам, у которых в исходном виде был указан некорректный почтовый индекс. В результате обработки сервис проверил этот индекс и выполнил его корректировку, согласно своей адресной базе.
-
Признак StandardisedImpreciseHouse – сервис возвращает данный признак, если в результате обработки адреса его номер дома был принудительно исправлен на похожий вариант по эталонной базе номеров, которой располагает сервис. Такую замену сервис делает, если исходный номер дома похож только на одну подходящую эталонную запись. Если подходящих похожих записей несколько, то замена не выполняется, и данный признак адресу не присваивается.
-
Свойства адреса – данная категория содержит элементы, позволяющие выводить в отчеты латинские наименования свойств, присущих адресу не зависимо от хода его обработки сервисом. Данный свойства носят в основном справочный характер.
-
Свойство CityIsRegion – данное свойство присваивается адресу, если он принадлежит городу, который в соответствии с административно-территориальным делением является субъектом России (например, Москва, Санкт-Петербург и Севастополь).
-
Свойство CenterOfRegion – адрес снабжается данным свойством, если в его поле города или населенного пункта присутствует адресный объект, являющийся региональным центром.
-
Свойство CenterOfDistrict – свойство присваивается адресу, если в его поле с городом или населенным пунктом присутствует адресный объект, являющийся районным центром.
-
Свойство AddressIsObsolete – свойство указывает на то, что исходный адрес не является актуальным, он был переподчинен, а в качестве результата распознавания возвращена его актуальная версия. Такое возможно, например, если в адресе указан населенный пункт, который в настоящий момент вошел в состав крупного города.
-
Свойство AddressIsNonexistent – свойство указывает на то, что для распознанного адреса не существует актуальной версии, так что данный адрес в настоящий момент является не существующим. Такое возможно, например, если в адресе указан заброшенный, нежилой к настоящему моменту, населенный пункт.
-
Признаки отбраковки адреса – в данной категории располагаются элементы, с помощью которых можно выводить признаки, присвоенные адресу в ходе его обработки и отвечающие на вопрос, почему адрес не удалось стандартизовать.
-
Признак FilteredByMask – признак присваивается адресу, если он был распознан по некоторому фрагменту исходной записи, при этом в процессе обработки сервис обнаружил другие важные адресные фрагменты, которые не удалось использовать при распознавании. В результате адрес был отбракован. Данный случай соответствует, например, ситуации, когда в адресе указано по ошибке название региона, не соответствующее остальной части адреса.
-
Признак FilteredByZip – признак присваивается адресу, если он был отбракован из-за того, что исходный почтовый индекс, присутствующий в обработанном адресе, не соответствует индексу адреса, полученному в результате стандартизации.
-
Признак FilteredUnstableDetection – признак присваивается адресу, если адрес был отбракован из-за того, что некоторые его поля (как правило, улица или населённый пункт) не удаётся распознать достаточно уверенно. Например, в адресе может быть указано неточное название промзоны без явного указания на то, что имеется в виду именно территория такого типа, а не одноимённая улица. В таком случае адрес будет отбракован и помечен данным признаком.
-
Признак FilteredByUser – признак присваивается адресу, если он был отбракован в результате применения пользовательского фильтра, заданного в разделе "Фильтры адресов" личного кабинета и присвоенного реестру перед началом его обработки.
-
Признак AbnormalDetection – признак присваивается адресу, если он был отбракован из-за того, что его распознавание было выполнено только с привлечением вспомогательной информации, такой как почтовый индекс, без которой распознавание было бы невозможным. При этом даже в результате использования такой информации результат распознавания оказался неоднозначным, в результате чего адрес был отбракован.