- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
https://www.morningstar.com/stocks/xnas/ATVI/price-fair-value
我正在尝试提取每年的总返回数据
28.59 13.32 0.36 -12.34 69.68 14.13 93.25 -6.04 76.18 -25.92 3.99
来自上述网站。我需要有关下一步如何进行的帮助。
Option Explicit
Sub genOP()
Dim i As Long, fI As Long
Dim tickeR As String
Dim urlStr As String
Dim ie As New InternetExplorer
With INP
fI = .Range("A" & .Rows.Count).End(xlUp).Row
For i = 2 To fI
tickeR = Trim(.Range("A" & i))
Debug.Print tickeR
'https://www.morningstar.com/stocks/xnas/abmd/price-fair-value'
urlStr = "https://www.morningstar.com/stocks/xnas/" & tickeR & "/price-fair-value"
Debug.Print urlStr
With ie
.Visible = True
.navigate urlStr
While .readyState <> 4
DoEvents
Wend
Stop
.document.getElementsByClassName("annual-data-row ng-scope").innerText
End With
Next i
End With
End Sub
最佳答案
如果您观察网络流量,您将看到该页面对该图表信息执行 API xhr 请求,并以 json 形式返回。
检查发送的请求,我们看到以下内容:
请求 URL 本身,例如
https://api-global.morningstar.com/sal-service/v1/stock/priceFairValue/v2/0P00000053/data?secExchangeList=
字符串0P00000053
是该股票代码的唯一标识符;我稍后将其称为 share_id
(占位符)和 shareId
变量。它是从对实际股票页面的请求中获取的。
查询字符串参数没有值,可以忽略。重要的标题已突出显示。请参阅 key 以了解重要性的解释。
两个红色框 header 唯一标识特定的股票 URI。
两个蓝色需要 js 文件中提供的访问 key 。
您可以提出初始请求来获取这些访问 key ;获取所有股票列表的附加请求 - 我使用纳斯达克 100 作为来源;或提供您自己的股票代码列表(每个示例都给出了示例 - 根据需要注释行)。
自己的列表使用:
tickers = Array("ATVI") ''etc....extend
纳斯达克 100 指数使用:
tickers = GetNasdaqTickers(xhr, html)
必须向每个股票代码页面发出请求,以检索唯一标识符(“X-SAL-ContentType” header 的 contentId
和 API url 的 shareId
)以及 header 相应更新:
tickerName = tickers(ticker)
url = Replace$("https://www.morningstar.com/stocks/xnas/{ticker}/price-fair-value", "{ticker}", tickerName)
headersDict("Referer") = url
Set ids = GetContentIdShareId(xhr, url, re) 'Set up correct ids for each indiv request
headersDict("X-SAL-ContentType") = ids("contentId")
API 调用在股票循环期间更新,并使用 json 解析器解析出图表信息。我会使用 jsonconverter.bas来解析 json。将来自该链接的代码安装到名为 JsonConverter
的标准模块中。所有必需的项目引用都显示在代码顶部。
For ticker = LBound(tickers) To UBound(tickers)
'other code
nasdaqDict.Add tickerName, GetChartData(xhr, ids("shareId"), headersDict)
Next
函数GetChartData
返回一个字典,其中图表日期作为键,图表值作为值。对于给定的代码,每个返回的字典都会添加到父字典 nasdaqDict
中。 nasdaqDict
将股票名称作为键,将关联的图表字典作为值。
最后,这个父字典被循环,所有值都由 WriteOutDict
写入工作表。
您可以探索字典中的字典,nasdaqDict
,here .
VBA 代码:
Option Explicit
'VBE > Tools > References:
' Microsoft HTML Object Library
' Microsoft XML ,vn.0 e.g. Microsoft XML ,v6.0
' Microsoft VBScript Regular Expressions n.n e.g. Microsoft VBScript Regular Expressions 5.5
' Microsoft Scripting Runtime
Public Sub GetNasdaq100ChartValues()
Dim re As VBScript_RegExp_55.RegExp, html As mshtml.HTMLDocument, xhr As MSXML2.XMLHTTP60
Dim nasdaqDict As Scripting.Dictionary
Set re = New VBScript_RegExp_55.RegExp
Set html = New mshtml.HTMLDocument
Set xhr = New MSXML2.XMLHTTP60
'##Set-up **************************************************************************************************
Dim headersDict As Scripting.Dictionary
Set headersDict = New Scripting.Dictionary
headersDict.Add "User-Agent", "Mozilla/5.0"
headersDict.Add "If-Modified-Since", "Sat, 1 Jan 2000 00:00:00 GMT"
headersDict.Add "Referer", vbNullString
headersDict.Add "ApiKey", vbNullString
headersDict.Add "X-API-REALTIME-E", vbNullString
headersDict.Add "X-SAL-ContentType", vbNullString
Set headersDict = UpdateHeaders(xhr, re, headersDict)
Set nasdaqDict = New Scripting.Dictionary 'This will be a dictionary of dictionaries with keys as ticker names _
and values as dictionaries containing the associated chart dates as keys and values as values.
Dim ids As Scripting.Dictionary, tickerName As String, tickers(), ticker As Long, url As String
'## This gets all nasdaq tickers (from https://www.cnbc.com/nasdaq-100/) and populates tickers with these.
'## You could instead replace this with a manually supplied list of desired tickers e.g.
tickers = Array("ATVI") ''etc....extend
'tickers = GetNasdaqTickers(xhr, html) ''comment this line out if passing hardcoded ticker values
'##Get info ************************************************************************************************
For ticker = LBound(tickers) To UBound(tickers)
tickerName = tickers(ticker)
url = Replace$("https://www.morningstar.com/stocks/xnas/{ticker}/price-fair-value", "{ticker}", tickerName)
headersDict("Referer") = url
Set ids = GetContentIdShareId(xhr, url, re) 'Set up correct ids for each indiv request
headersDict("X-SAL-ContentType") = ids("contentId")
nasdaqDict.Add tickerName, GetChartData(xhr, ids("shareId"), headersDict) 'make indiv API call for current ticker
Next
WriteOutDict nasdaqDict
End Sub
Public Function UpdateHeaders(ByVal xhr As MSXML2.XMLHTTP60, ByVal re As VBScript_RegExp_55.RegExp, ByVal headersDict As Scripting.Dictionary) As Scripting.Dictionary
Dim s As String, accessKeys As VBScript_RegExp_55.MatchCollection
Dim apiKey As String, apiRealtimeKey As String
With xhr 'Make request to get keys from js file
.Open "GET", "https://www.morningstar.com/assets/quotes/1.3.0/js/sal-components-wrapper.js", False
.send
s = .responseText
End With
With re
.Global = True
.MultiLine = True
.IgnoreCase = False
.Pattern = "apigee:""(.*?)""|realtime:""(.*?)""" 'regex pattern to return both api key values
Set accessKeys = .Execute(s)
End With
apiKey = accessKeys.item(0).SubMatches(0)
apiRealtimeKey = accessKeys.item(1).SubMatches(1)
headersDict("ApiKey") = apiKey
headersDict("X-API-REALTIME-E") = apiRealtimeKey
Set UpdateHeaders = headersDict
End Function
Public Function GetNasdaqTickers(ByVal xhr As MSXML2.XMLHTTP60, ByVal html As HTMLDocument) As Variant
Dim tickers As Object, results(), i As Long
With xhr
.Open "GET", "https://www.cnbc.com/nasdaq-100/", False
.send
html.body.innerHTML = .responseText
End With
Set tickers = html.querySelectorAll(".quoteTable a")
ReDim results(0 To tickers.Length - 1)
For i = 0 To tickers.Length - 1
results(i) = tickers.item(i).innerText
Next
GetNasdaqTickers = results
End Function
Public Function GetContentIdShareId(ByVal xhr As MSXML2.XMLHTTP60, ByVal url As String, ByVal re As VBScript_RegExp_55.RegExp) As Scripting.Dictionary
Dim ids As Scripting.Dictionary, s As String
Set ids = New Scripting.Dictionary
With xhr 'Make request to get keys from js file
.Open "GET", url, False
.send
s = .responseText
End With
With re
.Global = True
.MultiLine = True
.IgnoreCase = False
.Pattern = "contentType:""(.*?)"",profile" 'regex pattern to get contentId
ids("contentId") = .Execute(s)(0).SubMatches(0)
.Pattern = "byId:{""(.*?)""" 'regex pattern to get shareId
ids("shareId") = .Execute(s)(0).SubMatches(0)
End With
Set GetContentIdShareId = ids
End Function
Public Function GetChartData(ByVal xhr As MSXML2.XMLHTTP60, ByVal shareId As String, ByVal headersDict As Scripting.Dictionary) As Scripting.Dictionary
Dim key As Variant, chartValues As Scripting.Dictionary, i As Long, json As Object
Set chartValues = New Scripting.Dictionary
With xhr
.Open "GET", Replace$("https://api-global.morningstar.com/sal-service/v1/stock/priceFairValue/v2/{share_id}/data", "{share_id}", shareId), False
For Each key In headersDict.keys
.setRequestHeader key, headersDict(key)
Next
.send
Set json = JsonConverter.ParseJson(.responseText)
End With
For i = 1 To json("columnDefs").Count 'collection
chartValues(json("columnDefs")(i)) = json("table")("rows")(2)("datum")(i)
Next
Set GetChartData = chartValues
End Function
Public Sub WriteOutDict(ByVal nasdaqDict As Scripting.Dictionary)
Dim key As Variant, row(), r As Long, headers()
Application.ScreenUpdating = False
headers = nasdaqDict(nasdaqDict.keys(0)).keys 'assumption that charts show for same time period for all tickers
r = 2
With ThisWorkbook.Worksheets("Sheet1")
.Cells(1, 1) = "Ticker"
.Cells(1, 2).Resize(1, UBound(headers) + 1) = headers
For Each key In nasdaqDict.keys
row = nasdaqDict(key).items
.Cells(r, 1) = key
.Cells(r, 2).Resize(1, UBound(row) + 1) = row
r = r + 1
Next
End With
Application.ScreenUpdating = True
End Sub
<小时/>
结果示例:
<小时/>Python:
我最初是用 python 编写的,以防万一感兴趣:
import requests, re
from bs4 import BeautifulSoup as bs
def get_chart_data(share_id):
r = s.get(f'https://api-global.morningstar.com/sal-service/v1/stock/priceFairValue/v2/{share_id}/data', headers=headers).json()
chart_values = dict(zip(r['columnDefs'], r['table']['rows'][1]['datum']))
return chart_values
headers = {
'User-Agent': 'Mozilla/5.0',
'Referer': '',
'ApiKey': '',
'X-API-REALTIME-E': '',
'X-SAL-ContentType': '',
}
p = re.compile(r'apigee:"(.*?)"|realtime:"(.*?)"')
p1 = re.compile(r'contentType:"(.*?)",profile')
p2 = re.compile(r'byId:{"(.*?)"')
with requests.Session() as s:
#set-up
###########################################################################
## This gets all nasdaq tickers and populates tickers with these.
r = s.get('https://www.cnbc.com/nasdaq-100/')
soup = bs(r.content, 'lxml')
tickers = [i.text for i in soup.select('.quoteTable a')]
## you could instead replace the above with a manually supplied list of desired tickers
# tickers = ['tickerA','tickerB']
##########################################################################
r = s.get('https://www.morningstar.com/assets/quotes/1.3.0/js/sal-components-wrapper.js')
access_keys = p.findall(r.text)
api_key = access_keys[0][0]
api_realtime_key = access_keys[1][1]
headers['ApiKey'] = api_key
headers['X-API-REALTIME-E'] = api_realtime_key
results = {}
#specific
for ticker in tickers:
url = f'https://www.morningstar.com/stocks/xnas/{ticker}/price-fair-value'
headers['Referer'] = url
r = s.get(url)
content_id = p1.findall(r.text)[0]
share_id = p2.findall(r.text)[0]
headers['X-SAL-ContentType'] = content_id
results[ticker] = get_chart_data(share_id)
关于excel - 如何从网站中提取表值,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/57447128/
我想制作一个引用另一个 excel 文件中的单元格的公式。我已经弄清楚了,如下所示: ='C:\Users\17\Desktop\[JAN-11 2011.xlsx]1'!$H$44 但由于此工作表中
有谁知道是否可以在 Excel 中生成缺少地址门牌号的报告? 例如,我们在 Apple St (no.5, 9, 11) 有三个地址记录,是否可以生成一个报告: 列出工作簿中每条街道的所有记录街道编号
这个问题已经有答案了: VBA auto hide ribbon in Excel 2013 (7 个回答) 已关闭 4 年前。 我试图在打开工作文件时隐藏我的丝带。 我已点击以下链接,但不断收到运行
我编写了一个 VBA 程序来删除元音。我无法从 excel 调用该函数。我收到 #NAME 错误。下面的代码 Function REMOVEVOWELS(Txt) As String 'Removes
嗨,我正在尝试在 MS excel 中应用一个函数(正确函数) 但是当我编写这个函数并使用填充句柄将其复制到其他单元格时,我在所有复制的单元格中得到相同的输出。 但是当我点击单元格时,引用是好的。但结
假设我有一个格式如下的电子表格: Sheet 1 | Sheet 2 name email | name e
我正在尝试简化财务报告中的数据输入,因此我尝试使用 Excel Visual Basic 制作表格。 到目前为止我做了2个用户表单,以后我会做5个。我做了用户表单,以便数据输入运算符(operator
我需要对单元格公式而不是单元格内容执行 Mid 或 Find。 如果我的单元格公式是: =[功能](Arg1, Arg2, Arg3) 我需要能够将 Arg2 提取到另一个单元格。 如果不使用 VBA
我想用 VBA 管理嵌入在另一个 Excel 文件中的 Excel 文件。我可以使用 .docx 文档找到很多结果,但我坚持使用 .xlsx 文档。 我最后一次尝试是使用 OLE 对象,但停留在“Sa
我最近一直在尝试使用 perl 和一些模块来读取 Excel 文件,尤其是单元格的格式。 例如,我写了一段使用 ParseExcel 模块读取单元格背景颜色的 perl 代码。然而,在测试时我注意到对
我目前正在使用 Maatwebsite 的 Excel 包,并且能够很好地生成一个包含我想要的列和值的表格,但我希望能够生成表格,其他表格位于单个 Excel 工作表的下方。可能吗? 上面附上的屏幕截
我需要以下方面的指导。我有一个包含 150000 条记录的文件 (excel)。收到另一个包含 5000-6000 条记录的 excel 文件,需要根据第二个文件中信息的某些条件删除该行。 我使用字典
我有我认为的标准公式,根据我使用的 Excel 版本、Excel 365 或 Excel 2019 的不同,它的行为会有所不同 =IF(F5=$M$1;IFERROR(IF(AND(IFERROR(F
信息: 我有一个名为 Demo.xlsm 的 Excel 文件 此文件包含一个名为 UserForm1 的用户表单,该用户表单会在打开文件时自动加载。 打开文件时,名为 Demo.xlsm 的工作簿也
我在A Excel工作表中有一个列,其值是1 1 1 2 2 2 3 3 3 4 4 4....,在B Excel工作表中有另一列,其值1 2 4 ....,什么我想要的是从 B 读取值并查看它们是否
所以,我有这个问题,我想通过使用 OR 函数检查调整列的条件来找到列的平均值,我尝试将 OR 放入 AverageIf 函数,失败,还尝试了“Average(IF( OR("再次不是正确的返回。认为这
假设我想要这种类型的formula = SUM(startcell:endcell)的答案,但是startcell和endcell组件发生了变化。 因此,我希望能够使用 和 中的任何值,而不是直接在公
我正在寻找一个简单的 Excel 宏,它可以根据单元格中的特定数字/值将行从一张工作表复制到 Excel 中的另一张工作表。我有两张纸。一个称为“master”,另一个表称为“top10”。 这是数据
我正在尝试调用另一个工作簿中的 Excel 宏。它是一个特定于工作表的宏,但 Microsoft 文档和网上研究给出的语法仅提供了一种仅通过工作簿访问宏的方法。该语法是: Application.Ru
我检查了很多不同的帖子,但似乎找不到我正在寻找的确切代码。另外,我以前从未使用过 VBA,因此我尝试从其他帖子中获取代码并输入我的信息以使其正常工作。还没有运气。在工作中,我们有一个 Excel 薪资
我是一名优秀的程序员,十分优秀!