python - 从 ClinicalTrials.gov 抓取数据-6ren

python - 从 ClinicalTrials.gov 抓取数据

转载作者：行者123 更新时间：2023-12-01 02:20:51

27

4

我正在开发一个小型 Python 函数来从 clinicalTrials.gov 中抓取数据。。我希望从每个研究记录中抓取该研究针对的条件。例如，对于 this学习记录我想要以下内容:

conditions = ['Rhinoconjunctivitis', 'Rhinitis', 'Conjunctivitis'. 'Allergy']

但是，每一个研究记录中，都有不同数量的条件。我编写了以下获取数据的脚本:

page = requests.get('https://clinicaltrials.gov/ct2/show/study/NCT00550550')
soup = BeautifulSoup(page.text, 'html.parser')
studyDesign = soup.find_all(headers='studyInfoColData')
condition = soup.find(attrs={'class':'data_table'}).find_all('span')
for each in condition:
    print(each.text.encode('utf-8').strip())

像这样:

b'Condition or disease'
b'Intervention/treatment'
b'Phase'
b'Rhinoconjunctivitis'
b'Rhinitis'
b'Conjunctivitis'
b'Allergy'
b'Drug: Placebo'
b'Biological: SCH 697243'
b'Drug: Loratadine Syrup 1 mg/mL Rescue Treatment'
b'Drug: Loratadine 10 mg Rescue Treatment'
b'Drug: Olopatadine 0.1% Rescue Treatment'
b'Drug: Mometasone furoate 50 mcg Rescue Treatment'
b'Drug: Albuterol 108 mcg Rescue Treatment'
b'Drug: Fluticasone 44 mcg Rescue Treatment'
b'Drug: Prednisone 5 mg Rescue Treatment'
b'Phase 3'

我现在如何才能只获得病情而没有干预/治疗信息？

最佳答案

您可以仅将第一个table与data_table类一起使用，并在td中提取span元素:

import requests
from bs4 import BeautifulSoup

page = requests.get('https://clinicaltrials.gov/ct2/show/study/NCT00550550')
soup = BeautifulSoup(page.text, 'html.parser')
studyDesign = soup.find("table", {"class" : "data_table"}).find('td')
conditions = [ t.text.strip() for t in studyDesign.find_all('span') ]
print(conditions)

给出:

[u'Rhinoconjunctivitis', u'Rhinitis', u'Conjunctivitis', u'Allergy']

关于python - 从 ClinicalTrials.gov 抓取数据，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/47956702/

27

4

0

文章推荐： javascript - 如何在vuejs中将索引绑定(bind)到value属性

文章推荐： Jquery Bootstrap TouchSpin 插件和更新/重置一个选项

文章推荐： asp.net - gridview 高亮显示当前行

文章推荐： jsf - 不要重新显示

中对话框中已经显示的消息

python - 从 ClinicalTrials.gov 抓取数据
我正在开发一个小型 Python 函数来从 clinicalTrials.gov 中抓取数据。。我希望从每个研究记录中抓取该研究针对的条件。例如，对于 this学习记录我想要以下内容: condit
使用 beautifulsoup 进行 Python 网络抓取 - 无法从 Clinicaltrials.gov 中提取首席研究员
(免责声明:我是 Python 和网络抓取新手，但我正在尽我最大努力学习)。我正在尝试从 clinicaltrials.gov 上的研究中提取 3 个关键数据点。他们有一个 API，但 API 没有

首页

博学

6Ren·AI

商城

python - 从 ClinicalTrials.gov 抓取数据