地理编码过程
创建地址定位器后,即可使用它对地址进行地理编码。然而,了解地址定位器如何准备输入地址数据、搜索地址属性和匹配地址(并了解修改地址定位器的设置将如何影响此过程)有助于提高地理编码的效率和准确程度。
此过程如下所示:
步骤 |
概念示例 | |
---|---|---|
1. 输入原始地址 |
127 West Point Drive, Olympia, WA 98501 | |
127 | West | Point | Drive | Olympia | WA | 98501 127 | West Point | Drive | Olympia | WA | 98501 | ||
| ||
| ||
| ||
127 W Point Dr, Olympia, WA 98501 | ||
解析地址
地址定位器解析地址时,会根据地址定位器的样式将地址分解为地址元素。例如,在地址 123 Main Street 中,123 是门牌号,Main 是街道名称,Street 是街道类型。某些情况下,可以使用多种方式对地址进行解析。虽然地址 127 West Point Drive 中的 West 通常被解释为街道方向,但在某些情况下,还可能被视为街道名称 West Point。为了增加找到地址的几率,地址定位器会将地址解析为地理编码过程所需的一组或多组不同的地址元素。
为地址创建多种表示
地址中的许多元素(例如,方向或街道类型)通常使用缩写形式表示。这些缩写具有多种形式。例如,Avenue 既可缩写为 AV 或 AVE,也可完整拼写为 Avenue。将根据对地址定位器样式的定义为地址的每个组成部分创建一组值。例如,在地址 127 West Point Drive, Olympia, WA 98501 中,每个组成部分均包含多个值或多种表示(如下表所示)。
搜索地址定位器
地址定位器对地址进行解析并为地址的每个组成部分生成一组值后,将根据一组搜索条件在定位器中查找与输入地址的元素匹配的要素。如果使用一组条件(例如,按城市、州和邮政编码搜索地址)无法找到地址候选项,则将使用限制较少的条件(例如,仅使用地址和邮政编码)继续搜索,直至找到所有可能的匹配候选项。
为各个可能的匹配项计算得分
地址定位器生成一组可能的位置候选项后,将会计算各候选项的得分,以确定各候选项与要进行地理编码的地址的匹配程度。各个可能的候选项都将被指定一个得分,得分范围为 0 至 100。将使用各个地址元素来计算此得分。如果地址元素出现以下某种情况,各个可能的候选项的得分将会变低:
- 拼写错误 - 较长或不常见的街道名称(例如,Pennsylvania 和 Ahwatukee)很可能导致拼写错误。
- 地址元素不正确 - 例如,地址的街道号不在候选项的地址范围内。
- 地址元素缺失 - 例如,已在地址数据中指定街道方向,但未在可能的候选项中指定。
过滤候选项列表
计算各候选项的得分后,地址定位器将根据为其设置的最低候选得分生成一组可能与地址匹配的候选项。得分低于最低候选得分的可能的匹配项将从可能的匹配项的列表中移除。
指明匹配的要素
作为地理编码过程的最后一步,将使用与最佳候选项相对应的要素为匹配的地址生成位置。此位置可能基于线要素的插值(包括单侧偏移参数和末端偏移参数),或基于面的质心(如果参考要素是面或点)。