- xml - AJAX/Jquery XML 解析
- 具有多重继承的 XML 模式
- .net - 枚举序列化 Json 与 XML
- XML 简单类型、简单内容、复杂类型、复杂内容
我需要从 SEC 10-K 文件中获取一些事实,例如毛收入、毛利润、毛利率、营业费用等以及相应的上下文。
对于像 https://www.sec.gov/Archives/edgar/data/1318605/000156459018002956/tsla-20171231.xml 这样的文件, 仅使用 XPath 找出少数必需的元素和值似乎是可行的。但是有像 ( https://www.sec.gov/Archives/edgar/data/19617/000001961718000057/jpm-20171231.xml ) 这样的文件,其中总费用被分解为具有扩展分类法的不同部分。
我的问题是
无论如何,如果仅使用 XPath 可以做到这一点,我会更愿意这样做。xbrl 文档的有效性并不重要。
最佳答案
处理 XBRL 文件的最可靠方法是使用 XBRL 处理库。有一些是用 Java 编写的,一些是专有的(收费),一些是开源的。
xbrl.org 上有一个维护的工具和服务列表:
https://www.xbrl.org/the-standard/how/tools-and-services/
据我所知,SEC 文档是可靠的,被很多人广泛使用并在许多处理器上进行了测试。如果 UBMatrix 存在问题,例如空指针异常,我建议联系他们并让他们知道,以便他们解决问题。
肯定(理论上)也可以使用 XPath/XQuery/XSLT,因为 XBRL 使用 XML 语法,但您需要注意,通过解析上下文(这是关系术语中的连接),您会实际上是从头开始重新实现一个不完整的 XBRL 处理器,伴随着错误和沉没成本的风险。除了核心的 XBRL 规范(例如维度等)之外,还有许多微妙之处和规范生态系统需要考虑,以免检索到错误的值。通过使用现有的处理器,您是在其他人已经为此付出的努力的基础上进行构建,以便获得正确的所有 XBRL 语义:这是 XBRL 成为标准的好处。
最后一点:用于毛收入、毛利润等的确切 XBRL 标签可能因公司而异,因为有些公司使用自己的标签(扩展名)而不是 US-GAAP 标签。此外,一些公司省略了一些需要消费者根据其他事实计算的事实。这可以在 XBRL 处理器之上使用映射和公式来解决。查尔斯·霍夫曼 (Charles Hoffman) 分享了有关此事的报告,并提供了许多有用的建议,并在线维护此类映射(搜索关键字是:基本会计概念、报告框架)。
关于java - 阅读 XBRL 事实 - Java,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/53418970/
我正在尝试使用以下命令通过 ansible 收集服务器 list : ansible all -m setup -a --tree facts/ 但这会在facts文件夹下为每个主机生成很多操作系统单
我决定学习 prolog 只是为了好玩,我正在看一些视频教程。我也在互联网上搜索了一些问题试图解决,但找不到解决方法。 我能够在纸上解决这个难题,但无法将其传递到代码中。 问题: I have 8 c
我正在通过DRT(规则模板)读取Excel表,然后通过Java类中的静态方法将其转换为类的对象。并将其插入到工作内存中。这样,工作内存就会被 Excel 表格中的所有事实填满。 现在,我通过 sess
我确信这非常简单,但我显然没有用谷歌搜索正确的东西。在几个单元测试相关的博客中,我看到了几个方法被赋予的属性 [fact] ,但我似乎无法弄清楚这意味着什么。示例: public class Some
我想知道这些术语之间的区别: 事实 仿函数 谓词。 规则 在Prolog中。 如果我写:brother(john, jack).这是事实吗?或谓词? 最佳答案 从 ISO/IEC 13211-1 Fi
问题 为什么选择 Ansible 事实,例如 ansible_distribution在角色部分不可用? --- - name: Test hosts: all tasks: - na
puppet 事实看起来像这样: processors => {"models"=>["AMD Opteron(tm) Processor 6172", "AMD Opteron(tm) Proces
在做了一些研究之后,我对 Prolog 以非常简单的方式表达查询的能力感到惊讶,几乎就像口头告诉机器该做什么一样。发生这种情况是因为我对工作中的 Propel 和 PHP 感到非常厌烦。 所以,我一直
我想生成一个密码和其他一些不存在的值。 像这样的东西: - name: Retrieve or generate my_password generated_fact: shell: so
我需要从 SEC 10-K 文件中获取一些事实,例如毛收入、毛利润、毛利率、营业费用等以及相应的上下文。 对于像 https://www.sec.gov/Archives/edgar/data/131
我是 puppet 新手,并计划在我们的环境中实现它。 我有在不同版本的 Redhat 上运行的 puppet 代理。 现在,我计划从 puppet master 推送存储库文件,我需要您的指导来实现
我是 puppet 新手,并计划在我们的环境中实现它。 我有在不同版本的 Redhat 上运行的 puppet 代理。 现在,我计划从 puppet master 推送存储库文件,我需要您的指导来实现
是否可以使用通常包含在 ansible_facts 中的内容?在 Ansible 临时命令中? 例如,我有一个位于 /tmp/myFile 的文件。在我所有的服务器上,我想做: ansible all
获得正确的术语是成功传达概念的一部分,当在 SO 中使用错误的术语时,带有 Prolog 标签的受访者会很好地指出错误。 在阅读 William F. Clocksin 于 1997 年 ( Worl
上下文:我的系统包含来自不同存储 Controller 的磁盘组合,因此每种类型的磁盘都有不同的用途。我是 ansible 的新手,我一边学习一边学习。编写一个剧本,从每种类型的 Controller
我是数据仓库的新手,我希望有一个关于构建星型模式的简单问题: 如果我有一个事实表,其中事实记录自然与单个维度具有一对多关系,那么如何建模星型模式来支持这一点?例如: 事实表:销售点条目(衡量标准是美元
我正在用 Idris 编写一个基本的 monadic 解析器,以适应与 Haskell 的语法和差异。我有基本的工作,但我坚持尝试为解析器创建 VerifiedSemigroup 和 Verified
我的应用程序需要足够的准确性,但 Google Places 按类别过滤的准确性似乎很差。所以我正在考虑迁移到 Factual API。大家用过吗?您如何看待它的准确性? 另一方面,我需要知道到某个地
我是一名优秀的程序员,十分优秀!