- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
我需要从 OBO 文件中提取信息。
我需要的是从 xref
行获取每个术语 id
的信息。对于 13.000 个术语 aprox,文件中的信息如下所示:
[Term]
id: HP:0011540
name: Congenitally corrected transposition of the great arteries
def: "The essence of the lesion is the combination of discordant atrioventricular and ventriculo-arterial connections. Thus, the morphologically right atrium is connected to a morphologically left ventricle across the mitral valve, with the left ventricle then connected to the pulmonary trunk. The morphologically left atrium is connected to the morphologically right ventricle across the tricuspid valve, with the morphologically right ventricle connected to the aorta." [DDD:dbrown, pmid:21569592]
synonym: "L-transposition" RELATED []
synonym: "Ventricular inversion" RELATED []
xref: EPCC:01.01.03
xref: ICD-10:Q20.5
xref: MSH:C535426
xref: SNOMEDCT_US:56743000
xref: SNOMEDCT_US:83799000
xref: UMLS:C0232301
xref: UMLS:C0344616
is_a: HP:0011534 ! Abnormal spatial orientation of the cardiac segments
is_a: HP:0011603 ! Congenital malformation of the great arteries
created_by: peter
creation_date: 2012-04-07T10:48:56Z
[Term]
id: HP:0011555
name: Double inlet left ventricle
def: "The condition in which both atria are joined to the left ventricle each by its own atrioventricular valve. Usually there is a hypoplastic right ventricle, which may be on the opposite side of the heart as usual." [DDD:dbrown, HPO:probinson]
xref: EPCC:01.04.04
xref: ICD-10:Q20.4
xref: SNOMEDCT_US:253283000
xref: UMLS:C0344622
is_a: HP:0001750 ! Single ventricle
is_a: HP:0011554 ! Double inlet atrioventricular connection
created_by: peter
creation_date: 2012-04-07T11:53:33Z
[Term]
id: HP:0011589
name: Common origin of the right brachiocephalic artery and left common carotid artery
def: "The left common carotid artery has a common origin with the innominate artery." [DDD:dbrown, HPO:probinson, pmid:17138027]
comment: Commonly the three great vessels (innominate artery, left common carotid artery, and the left subclavian artery) originate from the arch of the aorta. The second most common variant of aortic arch branching occurs when the left common carotid artery has a common origin with the innominate artery.
synonym: "Bovine arch" RELATED []
synonym: "Common brachiocephalic trunk" EXACT []
synonym: "Ovine arch" RELATED []
xref: SNOMEDCT_US:460890003
xref: UMLS:C3532020
xref: UMLS:C4020746
xref: UMLS:C4021141
is_a: HP:0011587 ! Abnormal branching pattern of the aortic arch
created_by: peter
creation_date: 2012-04-08T01:38:36Z
结果在 txt 或 xlsx 格式中应如下所示:
id UMLS SNOMEDCT_US MSH EPCC ICD-10 ICD-9 ICD-O Fyler MEDDRA
HP:0011540 C0232301;C0344616 56743000;83799000 C535426 01.01.03 Q20.5
HP:0011555 C0344622 253283000 01.04.04 Q20.4
HP:0011589 C3532020;C4020746;C4021141 460890003
header (UMLS、SNOMEDCT_US、MSH、MEDDRA...)都是可能的外部参照。
最佳答案
这是一种使用 ontologyIndex
和 tidyverse
的方法:
library(tidyverse)
library(ontologyIndex)
hpo <- get_ontology("https://raw.githubusercontent.com/obophenotype/human-phenotype-ontology/master/hp.obo",
extract_tags = "everything") #Download HPO file from GitHub and import
simplify2array(hpo) %>% #Convert to array
as_tibble() %>% #Convert to tibble
select(id,xref) %>% #select HPO ID and xref
unnest(c(id,xref)) %>% #unnest list columns
separate(xref, into = c("Ontology","Term"), sep = ":") %>% #separate ontology from code
pivot_wider(id_cols = id, names_from = "Ontology",
values_from = Term,
values_fn = \(x)paste(x,collapse = ";")) #pivot wider and combine terms with paste
## A tibble: 11,652 x 22
# id UMLS MSH SNOMEDCT_US MEDDRA Fyler NCIT COHD EFO ICD10 ICD9 `ICD-10` EPCC DOID MONDO `ICD-O` MP MPATH PMID ORPHA SNOMED_CT `ICD-9`
# <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
# 1 HP:0000001 C0444868 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
# 2 HP:0000002 C4025901 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
# 3 HP:0000003 C3714581 D021782 204962002;82525005 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
# 4 HP:0000005 C1708511 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
# 5 HP:0000006 C0443147 NA 263681008 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
# 6 HP:0000007 C0441748;C4020899 NA 258211005 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
# 7 HP:0000008 C4025900 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
# 8 HP:0000009 C3806583 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
# 9 HP:0000010 C0262655 NA 197927001 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
#10 HP:0000011 C0005697 D001750 397732007;398064005 NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA NA
从这里您可以使用 write.table()
或 write_delim()
写出结果。
关于r - 解析 HPO obo 文件以提取外部参照,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/52254298/
我一直在使用 AJAX 从我正在创建的网络服务中解析 JSON 数组时遇到问题。我的前端是一个简单的 ajax 和 jquery 组合,用于显示从我正在创建的网络服务返回的结果。 尽管知道我的数据库查
很难说出这里要问什么。这个问题模棱两可、含糊不清、不完整、过于宽泛或夸夸其谈,无法以目前的形式得到合理的回答。如需帮助澄清此问题以便重新打开,visit the help center . 关闭 1
我在尝试运行 Android 应用程序时遇到问题并收到以下错误 java.lang.NoClassDefFoundError: com.parse.Parse 当我尝试运行该应用时。 最佳答案 在这
有什么办法可以防止etree在解析HTML内容时解析HTML实体吗? html = etree.HTML('&') html.find('.//body').text 这给了我 '&' 但我想
我有一个有点疯狂的例子,但对于那些 JavaScript 函数作用域专家来说,它看起来是一个很好的练习: (function (global) { // our module number one
关闭。此题需要details or clarity 。目前不接受答案。 想要改进这个问题吗?通过 editing this post 添加详细信息并澄清问题. 已关闭 8 年前。 Improve th
我需要编写一个脚本来获取链接并解析链接页面的 HTML 以提取标题和其他一些数据,例如可能是简短的描述,就像您链接到 Facebook 上的内容一样。 当用户向站点添加链接时将调用它,因此在客户端启动
在 VS Code 中本地开发时,包解析为 C:/Users//AppData/Local/Microsoft/TypeScript/3.5/node_modules/@types//index而不是
我在将 json 从 php 解析为 javascript 时遇到问题 这是我的示例代码: //function MethodAjax = function (wsFile, param) {
我在将 json 从 php 解析为 javascript 时遇到问题 这是我的示例代码: //function MethodAjax = function (wsFile, param) {
我被赋予了将一种语言“翻译”成另一种语言的工作。对于使用正则表达式的简单逐行方法来说,源代码过于灵活(复杂)。我在哪里可以了解更多关于词法分析和解析器的信息? 最佳答案 如果你想对这个主题产生“情绪化
您好,我在解析此文本时遇到问题 { { { {[system1];1;1;0.612509325}; {[system2];1;
我正在为 adobe after effects 在 extendscript 中编写一些代码,最终变成了 javascript。 我有一个数组,我想只搜索单词“assemble”并返回整个 jc3_
我有这段代码: $(document).ready(function() { // }); 问题:FB_RequireFeatures block 外部的代码先于其内部的代码执行。因此 who
背景: netcore项目中有些服务是在通过中间件来通信的,比如orleans组件。它里面服务和客户端会指定网关和端口,我们只需要开放客户端给外界,服务端关闭端口。相当于去掉host,这样省掉了些
1.首先贴上我试验成功的代码 复制代码 代码如下: protected void onMeasure(int widthMeasureSpec, int heightMeasureSpec)
什么是 XML? XML 指可扩展标记语言(eXtensible Markup Language),标准通用标记语言的子集,是一种用于标记电子文件使其具有结构性的标记语言。 你可以通过本站学习 X
【PHP代码】 复制代码 代码如下: $stmt = mssql_init('P__Global_Test', $conn) or die("initialize sto
在SQL查询分析器执行以下代码就可以了。 复制代码代码如下: declare @t varchar(255),@c varchar(255) declare table_cursor curs
前言 最近练习了一些前端算法题,现在做个总结,以下题目都是个人写法,并不是标准答案,如有错误欢迎指出,有对某道题有新的想法的友友也可以在评论区发表想法,互相学习🤭 题目 题目一: 二维数组中的
我是一名优秀的程序员,十分优秀!