- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
使用 Python,我想从一堆包含硬编码数据的 javascript 文件中将如下所示的数据行提取到 csv 文件,如下所示:
....html code....hotels[0] = new hotelData();hotels[0].hotelName = "MANHATTAN";hotels[0].hotelPhone = "";hotels[0].hotelSalesPhone = "";hotels[0].hotelPhone = 'Phone: 888-350-6432
';hotels[0].hotelStreet = "787 11TH AVENUE";hotels[0].hotelCity = "NEW YORK";hotels[0].hotelState = "NY";hotels[0].hotelZip = "10019";hotels[0].hotelId = "51543";hotels[0].hotelLat = "40.7686";;hotels[0].hotelLong = "-73.992645";;hotels[1] = new hotelData();hotels[1].hotelName = "KOEPPEL";hotels[1].hotelPhone = "";hotels[1].hotelSalesPhone = "";hotels[1].hotelPhone = 'Phone: 718-721-9100
';hotels[1].hotelStreet = "57-01 NORTHERN BLVD.";hotels[1].hotelCity = "WOODSIDE";hotels[1].hotelState = "NY";hotels[1].hotelZip = "11377";hotels[1].hotelId = "51582";hotels[1].hotelLat = "40.75362";;hotels[1].hotelLong = "-73.90366";; var mykey = "AlvQ9gNhp7oNuvjhkalD4OWVs_9LvGHg0ZLG9cWwRdAUbsy-ZIW1N9uVSU0V4X-8"; var map = null; var pins = null; var i = null; var boxes = new Array(); var currentBox = null; var mapOptions = { credentials: mykey, enableSearchLogo: false, showMapTypeSelector: false, enableClickableLogo: false }.....html code .....
因此,所需的 csv 输出将类似于上述数据的行:
MANHATTAN,,,Phone: 888-350-6432 ...KOEPPEL,,,Phone: 718-721-9100 ...
是否应该使用代码生成工具直接解析上述语句来获取数据?将数千个 Javascript 文件中包含的此类数据转换为 csv 表格格式的最有效的 Python 方法是什么?
更新:
理想情况下,我希望解决方案将 JavaScript 语句解析为 Python 对象,然后将其存储到 CSV,以获得最大程度的独立性,不受输入脚本代码的排序和格式化的影响
最佳答案
我建议使用正则表达式来挑选所有“hotel[#]. ...”行,然后将所有结果添加到字典中。然后,使用字典,输出到 CSV 文件。以下内容应该有效:
import re
import csv
src_text = your_javascript_text
p = re.compile(r'hotels\[(?P<hotelid>\d+)\].(?P<attr>\w+) = ("|\')(?P<attr_val>.*?)("|\');', re.DOTALL)
hotels = {}
fieldnames = []
for result in [m.groupdict() for m in p.finditer(src_text)]:
if int(result['hotelid']) not in hotels:
hotels[int(result['hotelid'])] = {}
if result['attr'] not in fieldnames:
fieldnames.append(result['attr'])
hotels[int(result['hotelid'])][result['attr']] = result['attr_val']
output = open('hotels.csv','wb')
csv_writer = csv.DictWriter(output, delimiter=',', fieldnames=fieldnames, quoting=csv.QUOTE_ALL)
csv_writer.writerow(dict((f,f) for f in fieldnames))
for hotel in hotels.items():
csv_writer.writerow(hotel[1])
您现在拥有一个带有属性的酒店字典,按 Javascript 中的 ID 分组,以及输出文件“hotels.csv”(带有标题行和正确的转义)。我确实做了诸如命名组之类的事情,这些事情实际上没有必要,但发现它更具 self 评论性。
需要注意的是,如果在 Javascript 中提供了两次相同的组(例如 hotelPhone),则仅存储最后一个组。
在处理此类问题时,取决于您和您的判断,您需要多少宽容和卫生。您可能需要修改正则表达式以处理不提供小样本的示例(即捕获组的更改、将匹配限制为行开头的匹配等);或转义换行符,例如电话号码中的换行符);或删除某些文本(例如电话号码中的“电话:”)。我们没有真正的方法可以知道这一点,所以请记住这一点。
干杯!
关于python - 将硬编码初始化值转换为 CSV,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/17321783/
我是 Spring 新手,这就是我想要做的事情: 我正在使用一个基于 Maven 的库,它有自己的 Spring 上下文和 Autowiring 字段。 它的bean配置文件是src/test/res
我在我的测试脚本中有以下列表初始化: newSequenceCore=["ls", "ns", "*", "cm", "*", "ov", "ov", "ov", "ov", "kd"] (代表要在控
这个问题在这里已经有了答案: 关闭 11 年前。 Possible Duplicate: Class construction with initial values 当我查看 http://en.
我得到了成员变量“objectCount”的限定错误。编译器还返回“ISO C++ 禁止非常量静态成员的类内初始化”。这是主类: #include #include "Tree.h" using n
我有如下所示的a.h class A { public: void doSomething()=0; }; 然后我有如下所示的b.h #include "a.h" class b: publi
我需要解析 Firebase DataSnapshot (一个 JSON 对象)转换成一个数据类,其属性包括 enum 和 list。所以我更喜欢通过传递 DataSnapshot 来手动解析它进入二
我使用 JQuery 一段时间了,我总是使用以下代码来初始化我的 javascript: $(document).ready( function() { // Initalisation logic
这里是 Objective-C 菜鸟。 为什么会这样: NSString *myString = [NSString alloc]; [myString initWithFormat:@"%f", s
我无法让核心数据支持的 NSArrayController 在我的代码中正常工作。下面是我的代码: pageArrayController = [[NSArrayController alloc] i
我对这一切都很陌生,并且无法将其安装到我的后端代码中。它去哪里?在我的页脚下面有我所有的 JS? 比如,这是什么意思: Popup initialization code should be exec
这可能是一个简单的问题,但是嘿,我是初学者。 所以我创建了一个程序来计算一些东西,它目前正在控制台中运行。我决定向其中添加一个用户界面,因此我使用 NetBeans IDE 中的内置功能创建了一个 J
我有 2 个 Controller ,TEST1Controller 和 TEST2Controller 在TEST2Controller中,我有一个initialize()函数设置属性值。 如果我尝
据我所知, dependentObservable 在声明时会进行计算。但如果某些值尚不存在怎么办? 例如: var viewModel ={}; var dependentObservable1 =
我正在阅读 POODR 这本书,它使用旧语法进行默认值初始化。我想用新语法实现相同的功能。 class Gear attr_reader :chainring, :cog, :wheel de
我按照 polymer 教程的说明进行操作: https://www.polymer-project.org/3.0/start/install-3-0 (我跳过了可选部分) 但是,在我执行命令“po
很抱歉问到一个非常新手的Kotlin问题,但是我正在努力理解与构造函数和初始化有关的一些东西。 我有这个类和构造函数: class TestCaseBuilder constructor(
假设我们有一个包含 30 列和 30 行的网格。 生命游戏规则简而言之: 一个小区有八个相邻小区 当一个细胞拥有三个存活的相邻细胞时,该细胞就会存活 如果一个细胞恰好有两个或三个活的相邻细胞,那么它就
我是 MQTT 和 Android 开放附件“AOA” 的新手。在阅读教程时,我意识到,在尝试写入 ByteArrayOutputStream 类型的变量之前,应该写入 0 或 0x00首先到该变量。
我有 2 个 Controller ,TEST1Controller 和 TEST2Controller 在TEST2Controller中,我有一个initialize()函数设置属性值。 如果我尝
我有一个inotify /内核问题。我正在使用“inotify” Python项目进行观察,但是,我的问题仍然是固有的关于inotify内核实现的核心。 Python inotify项目处理递归ino
我是一名优秀的程序员,十分优秀!