python - 需要有关 RNN 模型格式化字符串的建议

转载作者：行者123 更新时间：2023-11-30 09:35:07

24

4

情况

我目前正在学习 Tensorflow，第一次尝试(在遵循/尝试 MINST 教程之后)我想创建一个模型(可能是 RNN)来执行一些基本的字符串格式化:

我知道对于下面的案例我可能不需要像深度学习那么复杂的东西，但这只是为了训练自己。

我有一组假定的“干净地址”字符串，我想在其中提取实际的干净地址。

她就是我想要得到的转变:

RUE DE MADAGASCAR   --> RUE DE MADAGASCAR 
ZI DE LA PLAINE     
55 RUE DU 1ER SEPTEMBRE 1944    -->    55 RUE DU 1ER SEPTEMBRE 1944  
ZONE INDUSTRIELLE RUE DE LA VALLEE B.P. 8   -->    RUE DE LA VALLEE
BP 62 AVENUE BECQUEREL      -->    AVENUE BECQUEREL
291 VOIE ATLAS      -->    291 VOIE ATLAS
12 RUE ARMAND BUSQUET ZONE INDUSTRIELLE     -->    12 RUE ARMAND BUSQUET
DOSSIER MLOC 5 RUE AMABLE LOZAI     -->    5 RUE AMABLE LOZAI 
ZI CAEN CANAL   -->         
RUE DE L'EUROPE ZI PORTUAIRE    -->    RUE DE L'EUROPE
BP 5229 BOULEVARD HENRY BECQUEREL CAMPUS JULES HOROWITZ     -->    BOULEVARD HENRY BECQUEREL
GIE MONSIEUR GAUTIER BOULEVARD H. BECQUEREL BP 5027     -->    BOULEVARD H. BECQUEREL
21 PLACE DE LA REPUBLIQUE   -->    21 PLACE DE LA REPUBLIQUE  
18 RUE DE LA GIRAFE     -->    18 RUE DE LA GIRAFE  
21 RUE DES GOUDRIERS    -->    21 RUE DES GOUDRIERS  
AVENUE STRASSBURGER     -->    AVENUE STRASSBURGER  
7 RUE DE L'EGLISE   -->    7 RUE DE L'EGLISE  
1060 RUE LEON FOUCAULT ZI DE LA SPHERE      -->    1060 RUE LEON FOUCAULT

我需要更多示例:这里是 spreadsheet 的链接包含 200 个元素(计划扩展到 1000 - 5000 个元素)

正如您所看到的，有很多可识别的模式:

不要使用 BP 个单词以及后面的 2 或 4 位数字
请勿使用 ZI 、ZA 或 Zone d'activiter ...
地址通常类似于 00 (Rue|Voie|Avenue|...) nameOfStreet
等等...

我认为如何进行

我正在尝试获取作为输入字符串一部分的输出字符串。它将根据上述模式删除单词。

我认为我会继续使用 RNN 类型的图，因为它应该检测诸如“有一个“BP”之类的东西，所以我不会采用这个词，并且如果下一个输入是 2 或 4 位数字的字符串 I我也不接受那些”，我认为应该有某种内存。

这完全取决于我想要输入数据的方式。我想我有两三种方法可以做到这一点:

输入单个单词(按空格分隔)
输入整个字符串(整个地址)
输入一个字符串，然后将其分割到更深的一层？

事情是:

如果输入单个单词，如何标记字符串分隔？
如果我输入整个字符串，看起来有点像丢失了
系统只会获取或删除单个单词。
第三种选择(混合两种)是否有意义？

是否可以批量训练，使用“批量部分”输入多个单词，每个批量代表和寻址。

另外，我想知道在我的系统中，节点的权重是否全部为 0 和 1(因为它只能接受或删除单个单词)，或者是否为中间值，例如保留词。

流程回顾

创建所有单个单词的字典
将我的字符串填充到相同的长度？
将我的所有字符串(或单词？)转换为一维数组
定义图表
小批量输入字符串(或单词？)
测试和显示准确性(输出字符串是否与预期输出完全匹配，或者预期输出与输出之间的差异百分比更有趣？)
保存图表
用它来格式化我的字符串

非常感谢您阅读所有内容，如有任何帮助，我们将不胜感激。

特别是关于我前进的总体方向，以及将数据输入图表的方式。

最佳答案

有两种方法可以立即想到解决问题:

序列标记 - 用 1 或 0 标记输入中的每个单词，指示是否应保留该单词。
seq2seq 模型 - 让 RNN 读取整个输入，然后逐字或逐字符生成输出。

如果您刚刚开始，我会推荐序列标记模型。如果您想这样做，我将遵循的步骤是:

将输入表示为 one-hot 向量序列(每个维度代表一个单词)
将标签表示为 1 和 0 的序列(指示是否应保留每个单词)
使用 rnn 读取每个序列
使用 2 节点层输出每个单词的 1 类和 0 类分数
使用优化器最大限度地减少预测标签与实际标签之间的差异

有关如何在 tensorflow 中进行序列标记的示例，请查看: https://github.com/guillaumegenthial/sequence_tagging

关于python - 需要有关 RNN 模型格式化字符串的建议，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/45140619/

24

4

0

文章推荐： python - AWS 机器学习 Boto3 分割数据

文章推荐： c# - 是否可以通过基于屏幕截图的机器学习来识别敌人？

文章推荐： python - 多个人工神经网络

c# - Mvvm 模型 View 模型
可不可以命名为MVVM模型？因为View通过查看模型数据。 View 是否应该只与 ViewModelData 交互？我确实在某处读到正确的 MVVM 模型应该在 ViewModel 而不是 Mode
javascript - 模型 -> 观察者 -> View -> Controller -> 模型 ->
我正在阅读有关设计模式的文章，虽然作者们都认为观察者模式很酷，但在设计方面，每个人都在谈论 MVC。我有点困惑，MVC 图不是循环的，代码流具有闭合拓扑不是很自然吗？为什么没有人谈论这种模式: mo
c# - WPF 中的便笺项目。模型、 View 、 View 模型
我正在开发一个 Sticky Notes 项目并在 WPF 中做 UI，显然将 MVVM 作为我的架构设计选择。我正在重新考虑我的模型、 View 和 View 模型应该是什么。我有一个名为 Not
C# 根据模型中的枚举属性将列表<模型> 转换为字典<枚举，列表<模型>>？
不要混淆:How can I convert List to Hashtable in C#? 我有一个模型列表，我想将它们组织成一个哈希表，以枚举作为键，模型列表(具有枚举的值)作为值。 publi
c# - 实体 vs 模型 vs View 模型
我只是花了一些时间阅读这些术语(我不经常使用它们，因为我们没有任何 MVC 应用程序，我通常只说“模型”)，但我觉得根据上下文，这些意味着不同的东西: 实体这很简单，它是数据库中的一行: 2) In
c# - 在大型应用程序中使用 MVVM - 共享 View 模型、模型、状态等
我想知道你们中是否有人知道一些很好的教程来解释大型应用程序的 MVVM。我发现关于 MVVM 的每个教程都只是基础知识解释(如何实现模型、 View 模型和 View )，但我对在应用程序页面之间传递
swift - 清除 Realm 中除一种对象类型(模型)之外的所有对象类型(模型)的方法
我想realm.delete() 我的 Realm 中除了一个模型之外的所有模型。有什么办法可以不列出所有这些吗？也许是一种遍历 Realm 中当前存在的所有类型的方法？最佳答案您可以从您的 R
php - Mocking Laravel Eloquent 模型 - AppServiceProvider 中使用的 Mocking 模型
我正在尝试使用 alias 指令模拟一个 Eloquent 模型，如下所示: $transporter = \Mockery::mock('alias:' . Transporter::class)
R Stargazer 与 pglm 模型 - 在 plm 模型中转换二项式 pglm 模型
我正在使用 stargazer 创建我的 plm 汇总表。 library(plm) library(pglm) data("Unions", package = "pglm") anb1 <- pl
ASP.NET MVC + EF 4.1 分层、模型、 View 模型
我读了几篇与 ASP.NET 分层架构相关的文章和问题，但是读得太多后我有点困惑。 UI 层是在 ASP.NET MVC 中开发的，对于数据访问，我在项目中使用 EF。我想通过一个例子来描述我的问题
ios -/ml 模型/Inception V3.ml 模型 : unable to read document
我收到此消息错误: Inceptionv3.mlmodel: unable to read document 我下载了最新版本的 xcode。 9.4 版测试版 (9Q1004a) 最佳答案您没有
c# - ASP.NET MVC3 Automapper View 模型/模型 View 验证
(同样，一个 MVC 验证问题。我知道，我知道......) 我想使用 AutoMapper ( http://automapper.codeplex.com/ ) 来验证我的创建 View 中不在我
android - 如何使用 sharedview 模型 koin android 注入(inject)具有作用域的 View 模型
需要澄清一件事，现在我正在处理一个流程，其中我有两个 View 模型，一个依赖于另一个 View 模型，为了处理这件事，我尝试在我的基本 Activity 中注入(inject)两个 View 模型，
wpf - 如何在 Window.Resources 标签中使用带有数据绑定(bind)的 View 模型、模型、命令类？
如果 WPF MVVM 应该没有代码，为什么在使用 ICommand 时，是否需要在 Window.xaml.cs 代码中实例化 DataContext 属性？我已经并排观看并关注了 YouTube
asp.net - 模型-存储库-服务-验证器- View - View 模型- Controller 设计模式(？)
当我第一次听说 ASP.NET MVC 时，我认为这意味着应用程序由三个部分组成:模型、 View 和 Controller 。然后我读到 NerdDinner并学习了存储库和 View 模型的方法
python - 如何使用 mmconvert 将 tensorflow 模型(InceptionResnetV2 pb 文件)转换为 pytorch 模型？
Platform : ubuntu 16.04 Python version: 3.5.2 mmdnn version : 0.2.5 Source framework with version :
swift - 在 super.init 初始化 self super.init 之前，在属性访问 'self' 中使用 'model'(品牌 : brand, 模型:模型)
我正在学习本教程:https://www.raywenderlich.com/160728/object-oriented-programming-swift ...并尝试对代码进行一些个人调整，看看
AngularJS 模型
我正试图围绕 AngularJS。我很喜欢它，但一个核心概念似乎在逃避我——模型在哪里？例如，如果我有一个显示多个交易列表的应用程序。一个列表向服务器查询匹配某些条件的分页事务集，另一个列表使用不同
模型、业务规则和持久性
我在为某个应用程序找出最佳方法时遇到了麻烦。我不太习惯取代旧 TLA(三层架构)的新架构，所以这就是我的来源。在为我的应用程序(POCO 类，对吧？？)设计模型和 DAL 时，我有以下疑问: 我的模
Django - 模型 - 如何描述两个模型之间的特定双向关系？
我有两个模型:Person 和 Department。每个人可以在一个部门工作。部门可以由多人管理。我不确定如何在 Django 模型中构建这种关系。这是我不成功的尝试之一 [models.py]:

首页

博学

6Ren·AI

商城

python - 需要有关 RNN 模型格式化字符串的建议

情况

我认为如何进行

流程回顾