- android - 多次调用 OnPrimaryClipChangedListener
- android - 无法更新 RecyclerView 中的 TextView 字段
- android.database.CursorIndexOutOfBoundsException : Index 0 requested, 光标大小为 0
- android - 使用 AppCompat 时,我们是否需要明确指定其 UI 组件(Spinner、EditText)颜色
我尝试使用 pandas 操作 .txt 文件,但收到此错误:
pandas.parser.CParserError: Error tokenizing data. C error: Expected 2 fields in line 3, saw 12
我尝试阅读 pandas 文档,但一无所获。
我的代码如下:
import pandas as pd
df = pd.read_csv('McKData_2511.txt')
我的文本文件如下所示:
,{'McKesson':''ManufacturerNo':'42023015925','Brand':'Generic Equivalent to Adrenalin®','Manufacturer':'Par Sterile Products LLC','CountryofOrigin':'United States','AlternatePackaging':'CT/25','Application':'Alpha- and Beta-Adrenergic Agonist','ContainerType':'Single Use Vial','DosageForm':'Injection','GenericDrugCode':'26184','GenericDrugName':'Epinephrine','NDCNumber':'42023-0159-25','StorageRequirements':'USP Controlled Room Temperature','Strength':'1 mg / mL (1:1000)','UNSPSCCode':'51391743','Volume':'1 mL'}
,{'McKesson':''ManufacturerNo':'00573016040','Manufacturer':'Pfizer','CountryofOrigin':'Unknown','ActiveIngredients':'Ibuprofen','Application':'Pain Relief','ContainerType':'Bottle','DosageForm':'Tablet','GenericDrugCode':'35743','NDCNumber':'00573-0160-40','Strength':'200 mg Strength','UNSPSCCode':'51384509','Volume':'100 per Bottle'}
,{'McKesson':''ManufacturerNo':'33332041910','Brand':'Afluria® Quadrivalent 2019 - 2020','Manufacturer':'Seqirus USA Inc','CountryofOrigin':'Australia','Application':'Flu Vaccine','ContainerType':'Multiple Dose Vial','DosageForm':'Injection','NDCNumber':'33332041910','StorageRequirements':'Requires Refrigeration','Strength':'60 mcg / 0.5 mL','Type':'Intramuscular','UNSPSCCode':'51201608','User':'Indicated For People 6 Months of Age and Above','Volume':'5 mL'}
,{'McKesson':''ManufacturerNo':'04110081127','Brand':'Afrin® Allergy Sinus','Manufacturer':'Bayer','CountryofOrigin':'Unknown','ActiveIngredients':'Oxymetazoline HCl','Application':'Sinus Relief','ContainerType':'Bottle','DosageForm':'Nasal Spray','Strength':'0.05% Strength','UNSPSCCode':'51162732','Volume':'15 mL'}
,{'McKesson':''ManufacturerNo':'04110081125','Brand':'Afrin® Original','Manufacturer':'Bayer','CountryofOrigin':'Unknown','ActiveIngredients':'Oxymetazoline HCl','Application':'Sinus Relief','ContainerType':'Bottle','DosageForm':'Nasal Spray','Strength':'0.05% Strength','UNSPSCCode':'51162732','Volume':'30 mL'}
,{'McKesson':''ManufacturerNo':'17478025310','Brand':'AK-Fluor®','Manufacturer':'Akorn','CountryofOrigin':'United States','Application':'Ophthalmic Disclosing Agent','ContainerType':'Single Dose Vial','DosageForm':'Injection','GenericDrugCode':'27760','GenericDrugName':'Fluorescein Sodium','NDCNumber':'17478025310','Strength':'10%, 500 mg / 5 mL','Type':'Intravenous','UNSPSCCode':'51441603','Volume':'5 mL'}
Error 487990425
,{'McKesson':''ManufacturerNo':'00487950103','Manufacturer':'Nephron Pharmaceutical','CountryofOrigin':'Unknown','AlternateManufacturerNumber':'1978717','Application':'Beta-Adrenergic Agonist','ContainerType':'Nebulizer Vial','DosageForm':'Solution','GenericDrugCode':'41681','GenericDrugName':'Albuterol Sulfate, Preservative Free','HCPCS':'J7609','NDCNumber':'00487-9501-03','Strength':'0.083%, 2.5 mg / 3 mL','Type':'Unit Dose, Inhalation','UNSPSCCode':'51391703','Volume':'30 Vials'}
,{'McKesson':''ManufacturerNo':'00591379760','CountryofOrigin':'Unknown','AlternateManufacturerNumber':'1151067','Application':'Beta-Adrenergic Agonist','ContainerType':'Nebulizer Vial','DosageForm':'Solution','GenericDrugCode':'41681','GenericDrugName':'Albuterol Sulfate, Preservative Free','NDCNumber':'00591-3797-60','Strength':'0.083%, 2.5 mg / 3 mL','Type':'Unit Dose, Inhalation','UNSPSCCode':'51391703','Volume':'60 Vials'}
Error 4879908743
,{'McKesson':''ManufacturerNo':'01093974344','Manufacturer':'McKesson Brand','CountryofOrigin':'Unknown','ActiveIngredients':'Ethyl Alcohol','Application':'Antiseptic','ContainerType':'Bottle','DosageForm':'Topical Solution','Strength':'70% Strength','UNSPSCCode':'42295421','Volume':'16 oz.'}
,{'McKesson':''ManufacturerNo':'70677000601','Brand':'sunmark®','Manufacturer':'McKesson Brand','CountryofOrigin':'Unknown','ActiveIngredients':'Cetirizine HCl','Application':'Allergy Relief','ContainerType':'Box','DosageForm':'Tablet','NDCNumber':'70677-0006-01','Strength':'10 mg Strength','UNSPSCCode':'51313101','Volume':'30 per Box'}
我怎样才能用这些数据将其读入 pandas 数据帧,因为在某些行中缺少许多值,该值应该包含 null 就像品牌位于第一行,但不在第二行,因此第二行应该为 null
因为我只想要这些值制造商编号UNSPSC代码品牌制造商国家数据中心我该如何解决这个问题?
最佳答案
这是我的原始方法,也许对你有帮助使用此代码,您将收到包含数据的列ManuFACTURERnO
的示例:
df=pd.read_csv('data',sep='{|}',engine='python',header=None)
df=df[1].str.split(',',expand=True)
df_all = pd.concat([df[0],df[1],df[2],df[3],df[4],df[5],df[6],df[7],
df[8],df[9],df[10],df[11],df[12],df[13],df[14],
df[15],df[16],df[17]]) #concat all columns, if number will be different, edit this line
df_all = pd.DataFrame(df_all)
df_all['ManufacturerNo'] = df_all[0].str.extract(r"(ManufacturerNo':'[0-9]{1,30})",expand=True)
df_all['ManufacturerNo'] = df_all['ManufacturerNo'].replace("ManufacturerNo':'","",regex=True)
print(df_all)
0 ManufacturerNo
0 'McKesson':''ManufacturerNo':'42023015925' 42023015925
1 'McKesson':''ManufacturerNo':'00573016040' 00573016040
2 'McKesson':''ManufacturerNo':'33332041910' 33332041910
3 'McKesson':''ManufacturerNo':'04110081127' 04110081127
4 'McKesson':''ManufacturerNo':'04110081125' 04110081125
5 'McKesson':''ManufacturerNo':'17478025310' 17478025310
6 None NaN
7 'McKesson':''ManufacturerNo':'00487950103' 00487950103
8 'McKesson':''ManufacturerNo':'00591379760' 00591379760
9 None NaN
10 'McKesson':''ManufacturerNo':'01093974344' 01093974344
11 'McKesson':''ManufacturerNo':'70677000601' 70677000601
0 'Brand':'Generic Equivalent to Adrenalin®' NaN
1 'Manufacturer':'Pfizer' NaN
2 'Brand':'Afluria® Quadrivalent 2019 - 2020' NaN
3 'Brand':'Afrin® Allergy Sinus' NaN
4 'Brand':'Afrin® Original' NaN
5 'Brand':'AK-Fluor®' NaN
6 None NaN
7 'Manufacturer':'Nephron Pharmaceutical' NaN
ManufacturerNo=df_all['ManufacturerNo'].dropna().tolist()
print(ManufacturerNo)
['42023015925', '00573016040', '33332041910', '04110081127', '04110081125', '17478025310', '00487950103', '00591379760', '01093974344', '70677000601']
如果您想为其他值创建列,例如 UNSPSCCode
,只需使用相同的正则表达式创建新列,或者根据需要创建新列,并替换其中的名称,例如:df_all['UNSPSCCode'].replace("UNSPSCCode':'","",regex=True)
关于python - 如何读取类似于json格式的文本文件,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/59030658/
是否有一种 STL 算法允许我将一个函数应用于一个范围内的每个元素,转换元素,并将之前转换的元素作为输入? 我在想这样的事情(显然行不通,因为第二个迭代器将无效): struct Input {
我有一个字典列表,例如: l =[{country:'Italy',sales:100,cost:50}{country:'Italy',sales:130,cost:60} {co
考虑以下几点: $var = 'Now is the time' if ($var -like 'Now*') { 'true' } else { 'false' } 输出:真 现在交换 -like
我认为这是一个简单的问题,但尚未得到解决方案。我只想从此处解释的列中获取有效数字。 假设我们有一个包含以下值的 varchar 列 ABC Italy Apple 234.62 2:234:43:22
这个问题已经有答案了: MySQL LIKE IN()? (12 个回答) 已关闭 4 年前。 是否可以使用 IN 子句扩展 LIKE 表达式? 此时我得到以下 SQL: select * from
这个问题在这里已经有了答案: How to postpone/defer the evaluation of f-strings? (14 个答案) 关闭 3 年前。 考虑字符串 string_0
关闭。这个问题需要details or clarity .它目前不接受答案。 想改进这个问题吗? 通过 editing this post 添加细节并澄清问题. 关闭 8 年前。 Improve t
我刚刚阅读了以下关于同一主题的帖子: Facebook like notifications tracking (DB Design)和 Database design to store notifi
我如何在 javascript 中创建一个新事件/像在 c# 中一样? private event EventHandler asdCompleted; private void SetEventHa
我经常访问一个名为 GOOD 的网站我特别喜欢一种审美风格;导航栏如何在网站背景中扩展其颜色。如果您访问该网站,就会明白我的意思。 在 CSS 中,我怎样才能以最简单的方式复制它?我已经用 z-ind
我对 LINQ 比较陌生,不知道如何执行 Like 条件。我有一个 myObject 的 IEnumerable 列表,想要做一些类似 myObject.Description 的事情,比如“Help
我正在尝试在 Sharepoint 2013 提供商托管的应用程序中构建一个类似人员选择器的工具。最初,我使用的是 Utility.ResolvePrincipal,它让我可以访问 Sharepoin
过去几个月我一直在研究微服务架构应用程序,我仍在努力适应分布式特性。我多次注意到一种模式,但我不确定处理它的首选方式是什么。 假设我们有服务 A、服务 B 和服务 C。服务 A 公开了一个 API,其
这个问题在这里已经有了答案: Equivalent to unix "less" command within R console (5 个回答) 6年前关闭。 R 控制台中是否有任何命令与 Linu
是否可以在 Xcode 中为类似于 emacs 中的“标记”功能的行添加书签?还有我可以用来跳转到行号的快捷方式吗?我的源代码变得很长且难以导航。 最佳答案 是的;如果您将文本插入符号放在要添加书签的
在使用 vi 15 年的大部分时间后,我在使用 Go 时一时兴起尝试了 Rob Pike 的 Acme。我真的很喜欢它的小巧轻便。现代 unix 风格的东西在 Acme 中表现不佳,而 Ruby 开发
我正在寻找可以打印矩阵[1:5, 1:5] 的任何包中的函数。 head() 适用于列数较少但矩阵较大的用户。我知道我可以为它创建自己的函数,但我想知道是否已经有函数了。 最佳答案 在名为futile
我正在用 C++ 构建一个聚类算法,但我不能很好地处理 OOP 和发生变化的变量(成员数据)的状态。对于某种复杂的算法,我发现这是我发展的障碍。 因此,我正在考虑将编程语言更改为一种功能语言:Ocam
我有一个这样的日志: Jun 21 06:25:07 172.25.1.1 kernel: DROP IN=ppp0 OUT= MAC= SRC=206.221.177.2 DST=185.79.95
我需要一些帮助来制作类似于 Accordion 的东西。目标是,如果您单击导航中的链接,一个部分会消失,而您单击的部分会出现(在相同位置且不明显)。 如果可能,它还应该自动滚动到该部分的开头(导航的结
我是一名优秀的程序员,十分优秀!