gpt4 book ai didi

c# - 将完整地址转换为单独的列

转载 作者:太空宇宙 更新时间:2023-11-03 17:52:24 24 4
gpt4 key购买 nike

我将 1000 个地址的列表加载到 oracle 表中。

完整地址在单列 CompleteAddress Varchar(1000)

示例数据:

12003 Main St New York NY 00991
123 ANYWHERE BLVD ABINGDON MD 21009

我需要将所有地址拆分为街道编号 + 街道名称、城市、州和 zip (有时是 zip5+zip4)

数据中没有逗号或斜线。如何拆分地址?如果这很重要,我在 C# 工作。 RegEx 是合适的方法吗?

到目前为止,我尝试使用 SubString,但我认为这不会很好地工作。

string zipcode = completeAddress.Substring(completeAddress.Length - 5, 5);
string mystate = completeAddress.Substring(completeAddress.Length - 8, 2);

有什么想法吗?

最佳答案

地址很复杂。非常复杂。它们是非常不规则和主观的东西。在几十年的过程中,物流公司已经花费了数十亿来试图理解它们。

更好地利用他人所做的事情,而不是尝试重新发明它。

您拥有的数据实际上非常有意义。它只是不“感觉”很有意义。企业喜欢将他们的地址数据分成很多小块,但为什么呢?所有这些小片段是什么意思?为什么它们需要彼此区分开来?您拥有的数据是一个“地址”。保留它,但添加它。利用现有信息推断出更多信息。

使用地理编码 API(Google?Bing?其他一些服务?价格等会有所不同)搜索您拥有的数据并返回更多强类型数据。把它和你所有的一起储存起来。例如,你有这个:

12003 Main St New York NY 00991

所以你在这里提出请求:

http://maps.googleapis.com/maps/api/geocode/json?address=12003+Main+St+New+York+NY+00991&sensor=false

然后你得到这个:

{
"results" : [
{
"address_components" : [
{
"long_name" : "D R Main Street",
"short_name" : "D R Main Street",
"types" : [ "point_of_interest", "establishment" ]
},
{
"long_name" : "5",
"short_name" : "5",
"types" : [ "street_number" ]
},
{
"long_name" : "West 31st Street",
"short_name" : "W 31st St",
"types" : [ "route" ]
},
{
"long_name" : "Midtown",
"short_name" : "Midtown",
"types" : [ "neighborhood", "political" ]
},
{
"long_name" : "Manhattan",
"short_name" : "Manhattan",
"types" : [ "sublocality", "political" ]
},
{
"long_name" : "New York",
"short_name" : "New York",
"types" : [ "locality", "political" ]
},
{
"long_name" : "New York",
"short_name" : "New York",
"types" : [ "administrative_area_level_2", "political" ]
},
{
"long_name" : "New York",
"short_name" : "NY",
"types" : [ "administrative_area_level_1", "political" ]
},
{
"long_name" : "United States",
"short_name" : "US",
"types" : [ "country", "political" ]
},
{
"long_name" : "10001",
"short_name" : "10001",
"types" : [ "postal_code" ]
},
{
"long_name" : "4414",
"short_name" : "4414",
"types" : []
}
],
"formatted_address" : "D R Main Street, 5 West 31st Street, New York, NY 10001, USA",
"geometry" : {
"location" : {
"lat" : 40.7468529,
"lng" : -73.9865046
},
"location_type" : "APPROXIMATE",
"viewport" : {
"northeast" : {
"lat" : 40.7482018802915,
"lng" : -73.98515561970851
},
"southwest" : {
"lat" : 40.7455039197085,
"lng" : -73.98785358029151
}
}
},
"partial_match" : true,
"types" : [ "point_of_interest", "establishment" ]
}
],
"status" : "OK"
}

现在是一些看起来有意义的数据。也许不是您公司中有人认为地址是由数据“单元”组成的,但有意义且有用。对于数据中的任何给定地址,您都可以将其自动化。

让用户以他们知道的方式输入他们的地址。将该主观地址存储为用户输入的版本。对其进行地理编码以获取更多结构化数据并与其一起存储。

关于c# - 将完整地址转换为单独的列,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/20787082/

24 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com