gpt4 book ai didi

r - 使用 R bioconductor 包 STRINGdb 操作 String-db

转载 作者:搜寻专家 更新时间:2023-10-30 20:50:46 33 4
gpt4 key购买 nike

我想从 string-db.org 中提取一个大型网络,因为 Web 界面不支持超过 2000 个蛋白质。我需要大约 100.000 到 200.000 种蛋白质。所以我正在使用 R bioconductor 包 STRINGdb 来探索数据库。由于我是 R 的新手,即使有了文档,我也不知道该怎么做,也不知道要使用 .我试过了PS:我对癌症网络很感兴趣,(蛋白质-蛋白质相互作用数据集)我试过:

source("https://bioconductor.org/biocLite.R")
biocLite("STRINGdb")
library(STRINGdb)
string_db <- STRINGdb$new( version="10", species=9606, score_threshold=0.4, input_directory="" )
##Not sure if it is the right function to use##
string_proteins <- string_db$get_proteins() ## Returns 20475 obs. 4 variables

我不知道如何进行。

最佳答案

好的,正如我读到的,您想要癌症过程中涉及的 2-4k 蛋白质网络,并可能以某种方式在 R 中将其可视化。嗯,很容易获得特定蛋白质的信息、邻居和相互作用,这来自手册:

tp53 = string_db$mp( "tp53" )
atm = string_db$mp( "atm" )
string_db$get_neighbors( c(tp53, atm) )
string_db$get_interactions( c(tp53, atm) )

因此,如果您列出蛋白质,就很容易获得有关它们的信息。由于可视化,函数 get_graph 可能很有用,它采用 stringdb 蛋白质的向量,例如 c(tp53, atm)

提供更多信息,yowu 想做什么,我们会解决的:)

关于r - 使用 R bioconductor 包 STRINGdb 操作 String-db,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/44153847/

33 4 0
Copyright 2021 - 2024 cfsdn All Rights Reserved 蜀ICP备2022000587号
广告合作:1813099741@qq.com 6ren.com