- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
10/03/2014 16:55 Local Title: TRANSFER OUT NOTE
Standard Title: TRANSFER SUMMARIZATION NOTE
AUTHOR: D,WARD
XYZ MEDICAL INSTITUTE
ABC NAGAR, PQW CITY-101011
******************************************************************
TRANSFER OUT NOTE
******************* OCT 03, 2014
UHID:000-01-0202 PATIENT NAME: NAME , SINGH
AGE/SEX:42/FEMALE
DOA:Sep 30,2014
DEPARTMENT:GYNAE AND OBSTETRICS UNIT:II
TRANSFERRED FROM:D3
NAME , SINGH 000-01-0202 DOB: 01/01/1972
TRANSFERRED TO : MCU
DIAGNOSIS:pop- em lscs with male baby nicu B
TREATMENT:
inj.cefazolin 1 gm bd
inj.rantac 1 amp tds
inj.perinorm 1 amp tds
inj.pcm 1 gm tds
inj.texid 1 gm tds
PATIENT STATUS AT THE TIME OF SHIFTING:
g.c. fair on iv fluid ..
NAME , SINGH 000-01-0202 DOB: 01/01/1972
VITALS AT THE TIME OF SHIFTING:
TEMP:98.6F
HR:88/MIN RR:24/MIN
GCS: E V M
< THE ABOVE NOTE IS UNSIGNED >
- DRAFT COPY * DRAFT COPY * DRAFT COPY * DRAFT COPY * DRAFT COPY * DRAFT COPY -
09/21/2014 23:01 Local Title: MED ONCO IRCH DISCHARGE SUMMARY
Standard Title: DISCHARGE SUMMARY
AUTHOR: KUMAR,UVW
LOCAL TITLE: MED ONCO IRCH DISCHARGE SUMMARY
STANDARD TITLE: DISCHARGE SUMMARY
NAME , SINGH 000-01-0202 DOB: 01/01/1972
DATE OF NOTE: SEP 21, 2014@22:04 ENTRY DATE: SEP 21, 2014@22:04:42
AUTHOR: UVW KUMAR
REGISTRATION DETAILS
********************
UHID No:000-01-0202 IRCH No:000222 CR No:111000
NAME: NAME AGE:22 YEAR GENDER:MALE
DOA:Sep 2, 2014 DOD:Sep 18, 2014 DURATION OF STAY: days
WARD: MRO Ward BED No:14
CONSULTANT INCHARGE:Dr UVW Kumar
DIAGNOSIS & REASON FOR CURRENT ADMISSION
****************************************
DIAGNOSIS:Acute Promyelocytic leukemia (Intermediate Risk)
ADMITTED FOR :Chemotherapy
CASE SUMMARY:NAME Singh presented with complaints of bleeding gums, fever,
NAME , SINGH 000-01-0202 DOB: 01/01/1972
blurring of vision and gum hypertrophy. He diagnosed as APML in PQW
hospital based on PS, BMA and PML/RARa positive. He started on ATRA and after
that reffered here. His basline hemorem at PQW Hospital was s/o Hb :
4.6, TLC: 1580/cu.mm, Platlet: 6000/cu.mm. So he is classified as
intermideate risk APML. After coming here diagnosis reconfirmed,
daunorubicin given 60mg/m2 and continoued on ATRA. No features of
ATRA syndrome noticed during ward stay. His fibrinogen level were > 450
mg/dl. He remained afebrile and hemodynamically stable and dischared on
stable condition.
PRESENTATION AT CURRENT ADMISSION
*********************************
VITAL SIGNS:
TEMP:99 F RESP:19/min PULSE:98/min
BP:121/78 mm of Hg SPO2:99% on RA
NAME , SINGH 000-01-0202 DOB: 01/01/1972
GENERAL PHYSICAL EXAMINATION: PERFORMANCE STATUS: I
PALLOR:+ ICTERUS:- OEDEMA:- CYANOSIS:-
STERNAL TENDERNESS:- CLUBBING:- GUM HYPERTROPHY:+
LYMPHNODES: -
BIOMETRIC DETAILS: WEIGHT: 45 kg HEIGHT:166 cms BSA: 1.4 m2
INVESTIGATIONS AT CURRENT ADMISSSION
************************************
PS (3/9/2014) : N2, L8, E-, M1, B-, Meta-, Myelo-, Blast 89%. Blast and abnormal
promyelocytes present. F/S/O Acute promyelocytic leukemia.
BMA (3/9/2014): Cellular BM shows 90% blast and abnormal promyelocyte. F/S/O
APML.
Flow Cytometery (3/9/2014): 87% abnormal promyelocyte, Positive : CD45, CD15,
NAME , SINGH 000-01-0202 DOB: 01/01/1972
CD11b, CD13, CD33, CD64, CD9, CD18, cMPO.
Negative for CD2, CD14, CD117, CD19, HLADR, CCD79a, cCD3.
Day 12 PS (9/9/2014): N78, L20, E-, M2, B-, Meta-, Myelo_ Promyelo Nil, Blast
Nil.
Condition at discharge:
VITAL SIGNS:
TEMP:99 F RESP:18/min PULSE:78/min
BP:112/74 mm of Hg SPO2:99% on RA
Plan At discharge and follow up: As written in OPD card
NAME , SINGH 000-01-0202 DOB: 01/01/1972
< THE ABOVE NOTE IS UNSIGNED >
- DRAFT COPY * DRAFT COPY * DRAFT COPY * DRAFT COPY * DRAFT COPY * DRAFT COPY -
09/21/2014 22:04 Local Title: MED ONCO IRCH DISCHARGE SUMMARY
Standard Title: DISCHARGE SUMMARY
AUTHOR: UVW,AMIT
REGISTRATION DETAILS
********************
UHID No:000-01-0202 IRCH No:000222 CR No:111000
NAME: NAME , SINGH AGE:42 GENDER:FEMALE
DOA:Sep 2, 2014 DOD:Sep 18, 2014 DURATION OF STAY: days
WARD: MRO Ward BED No:14
CONSULTANT INCHARGE:Dr Lalit Kumar
ADDRESS: ,
NAME , SINGH 000-01-0202 DOB: 01/01/1972
DIAGNOSIS & REASON FOR CURRENT ADMISSION
****************************************
DIAGNOSIS:
Acute Promyelocytic leukemia (Intermediate Risk)
ADMITTED FOR :Chemotherapy
CASE SUMMARY:NAME Singh presented with complaints of bleeding gums,
fever, blurring of vision and gum hypertrophy. He diagnosed as APML in
UVW hospital based on PS and PML/RARa positive. He started on ATRA and
after that reffered to XYZ hospital
PRESENTATION AT CURRENT ADMISSION
*********************************
VITAL SIGNS:
TEMP:F RESP:/min PULSE:/min
BP:/mm of Hg SPO2:%
NAME , SINGH 000-01-0202 DOB: 01/01/1972
GENERAL PHYSICAL EXAMINATION: PERFORMANCE STATUS:
PALLOR: ICTERUS: OEDEMA: CYANOSIS:
STERNAL TENDERNESS: CLUBBING: GUM HYPERTROPHY:
LYMPHNODES:
SPECIFIC FINDINGS:
BIOMETRIC DETAILS: WEIGHT:kgS HEIGHT:cms BSA: m2
INVESTIGATIONS AT CURRENT ADMISSSION
************************************
< THE ABOVE NOTE IS UNSIGNED >
- DRAFT COPY * DRAFT COPY * DRAFT COPY * DRAFT COPY * DRAFT COPY * DRAFT COPY -
NAME , SINGH 000-01-0202 DOB: 01/01/1972
这是我需要转换为 CSV 的文本内容。这是一位多次来医院的患者的详细信息。我想在不同的列头中提取医疗数据[年龄、性别、UHID、DOA、部门、诊断、治疗、患者状态、生命体征、本地职称、标准职称、病例摘要、入院、一般体检]。
正如您所看到的“诊断”的重复,并且列名也可能不同。
要处理的文件大小为 15GB。
请提出解决问题的方法。我尝试使用 python、openrefine 和 ctakes 工具。
请告诉我如何解决此类问题。限制是我们只能使用开源免费工具。
最佳答案
你可以用 gawk 做一些这样的事情。多行字段,如生命体征和治疗,可能很难硬塞进 CSV 格式,但这里是单值字段的开始。
function dump() {
print age "," sex "," uhid "," doa "," dept "," diagnosis
}
BEGIN { onfirst = 1 }
END { dump() }
{
sub(/^ */, "")
sub(/UHID No/, "UHID")
}
match($0, /UHID:([^ ]*)/, a) {
if(onfirst)
onfirst = 0
else
dump()
uhid = a[1]
}
match($0, /AGE\/SEX:([0-9]*)\/(.*[^ ]) *$/, a) {
age = a[1]
sex = a[2]
}
match($0, /DOA:([^ ][^ ]* *[^ ][^ ]* *[^ ][^ ]*)/, a) {
doa = a[1]
}
match($0, /DEPARTMENT:(.*[^ ]) *UNIT/, a) {
dept = a[1]
}
match($0, /DIAGNOSIS:(.*[^ ]) *$/, a) {
diagnosis = a[1]
}
关于data-analysis - 将非结构化医学文本数据处理为 CSV 的工具/方法,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/35650679/
解释 我的应用程序基本上使用带有代表建筑物的多边形叠加层的 map View ,以及注释。为此,它导入了一个名为 Annotation 的自定义类,该类在点击注释时处理弹出详细信息,这意味着它存储建筑
我有一个数据处理问题,我想计算两支球队在不同比赛中的进球数差异。数据如下所示: matchId teamId eventSec 1 2799331 6718 443.55984
如下所示: ? 1
我想知道 cocoa 是否有默认的数据存储方式。如果是,那是什么?我的意思是 Rails 默认使用 sqlite... 此外,我正在寻找有关如何使用它的教程...例如获取数据并将其显示到 ListVi
我正在使用 HTML5 创建在线游戏。我将使用 JSON 字符串通过 Websockets 通信数据,因此典型的字符串将包含被调用的操作以及随之而来的数据: {action: "chat", user
我需要按特定列对一组 csv 行进行分组,并对每个组进行一些处理。 JavaRDD lines = sc.textFile ("somefile
我有一个情况: 基本上有 3 个模块,分别命名为“A”、“B”、“C”。每个模块都涉及多线程。 模块“A”获取高速数据(20ms)并发送。模块“B”的一个线程启动。 模块“B”提取相关数据并执行一些位
我正在处理有关城镇和城镇内区域的 MySQL 数据库中的一些数据。 数据库看起来像这样 ID | NAME 1 | Manchester 2 | Manchester/North 3 | Man
当我注册用户时,我得到一个状态代码 200 和一个 token :“”返回 JSON。如果用户已经存在,那么我会得到状态代码 200 和 html 响应而不是 JSON。我应该如何处理这个问题。提前致
我有一个应用程序,我从网络上下载大量资源,并对每个资源进行一些处理。我不希望这项工作发生在主线程上,但它非常轻量级且优先级较低,因此所有这些工作都可以真正发生在同一个共享工作线程上。这似乎是一件好事,
我目前正在与一家小公司合作,该公司将其所有应用程序数据存储在 AWS Redshift 集群中。我的任务是对该 Redshift 集群中的数据进行一些数据处理和机器学习。 我需要做的第一个任务是根据一
简介 有些 post 的请求参数是 json 格式的,这个前面发送post 请求里面提到过,需要导入 json模块处理。现在企业公司一般常见的接口因为json数据容易处理,所以绝大多数返回数据也是
1.数组的处理: 1.1 数组的创建和初始化: 1.arrary()函数创建数组,默认情况下0元素是数组的第一个元素, count()和sizeof()函数获得数
我正在尝试将 CKEditor 与 AngularJS 结合使用,用于具有数据绑定(bind)的 WYSIWYG 编辑器,一切似乎都运行良好。极端的可配置性对我们的需求匹配有很大帮助。 我们现在面临表
我正在对负样本和正样本进行文本二元分类任务,我想包括以下所有内容: 处理数据..(例如标记化) 特征选择,例如 Chi2 应用随机投影,因为我有一个大型稀疏矩阵(n_samples:974,n_fea
数据与我在 Pandas 系列: data = ["1. stock1 (1991)", "3. stock13 (1993)", "5. stock19 (1999)", "89. stock
1.字符串的定义与显示 定义:通过””,''来标志 显示:echo()和print(),但print()具有返回值值,1,而echo()没有,但echo比print()要快,
1.正则表达式基础知识 含义:由普通字符和(a-z)和一些特殊字符组成的字符串模式 功能:有效性验证。 替换文本。 从一个字符串提取一个子字符串。&n
我想知道是否可以在我的 Cost Explorer 中发现这个成本背后的资源,按使用类型分组我可以看到它是数据处理字节,但我不知道哪个资源会消耗这个数量数据的。知道如何在 CloudWatch 上发现
我有一个 Json 字符串。我想从该 Json 字符串中获取值。 这是我的 json 字符串{“纬度”:“22.5712854”},{“经度”:“88.4266847”} 我只需要使用 TSQL 查询
我是一名优秀的程序员,十分优秀!