- html - 出于某种原因,IE8 对我的 Sass 文件中继承的 html5 CSS 不友好?
- JMeter 在响应断言中使用 span 标签的问题
- html - 在 :hover and :active? 上具有不同效果的 CSS 动画
- html - 相对于居中的 html 内容固定的 CSS 重复背景?
很抱歉,我不知道这是否是属于mathoverflow的数学问题,还是属于这里的计算机科学问题。
就是说,我相信我理解基本的difference between data, information, and knowledge。我的理解是信息既包含数据又包含含义。我不清楚的一件事是信息是否是数据。信息是被视为一种特殊的数据,还是完全不同?
最佳答案
单词data
,information
和knowlege
是基于值的概念,用于以主观方式对特定信息集的一般“简洁性”和“有用性”进行分类。
这些词没有确切的含义,因为它们与信息处理的基本目的和方法有关。在信息论领域,这些根本没有任何意义,因为这三个都是同一件事:“信息”的集合(从信息论的角度来说)。
然而,在上下文中,它们对于总结信息集的一般性质很有用,如下所述。
信息是从数据中获得的(或有时是从中得出的),但信息可能更丰富,更清晰(从而纠正了一些值)和“更简单”(从而消除了一些不相关的数据)。因此,在集合论的意义上,信息不是数据的子集,而是一个单独的集合(通常与数据相交,但也可以具有自己的元素)。
知识(有时称为洞察力)是又一个更高的层次,它是基于信息的,也不是信息的[设定理论]子集。实际上,知识通常没有直接引用信息元素,而是讲述了有关信息/数据的“元故事”。
在数据->信息->知识链中,较高的级别是较低的级别的子集的毫无根据的想法,可能是由于[IT]信息量通常有所减少这一事实。但是从质上来说,这些信息是不同的,因此没有真正的[集合论]子集关系。
例:
来自华尔街的原始证券交易所数据是...数据
“数据之海”!某人很难直接从这些数据中找到他/她的需求。此数据可能需要标准化。例如,价格信息有时可以用精度为1/32的文本字符串表示,在其他情况下,价格可以为精度为1/8的真实二进制整数。同样,指示买方ID或卖方ID的字段可能包含拼写错误,因此指向错误的卖方/买方。等等
从上面制作的电子表格是...信息
将各种过程应用于数据:
-清洁/校正各种值
-交叉引用(例如,查找关联的代码,例如在“买方ID”列旁边添加一列以显示个人/公司的实际名称)
-合并有关同一事件(但来自不同来源)的重复记录以相互证实,但也合并为一个记录。
-汇总:例如,将给定股票的所有交易价值相加(而不是显示所有单个交易)。
所有这些(然后还有一些)将数据转换为信息,即易于使用的一组[IT感觉]信息,在这里人们可以快速找到一些“数据”,例如IBM股票在纽约的开盘价和收盘价。 2009年6月8日。
请注意,虽然使用起来更方便,部分更精确/更精确并且也精简了,但是其中没有真正的[IT感]信息,无法通过相对简单的方式从原始信息中找到或计算出这些信息(如果仅是艰辛的话) )流程。
财务分析师的报告可能包含...知识
例如,如果报告指示[虚假示例],则每当油价超过某个阈值时,金价便开始下降,但随后在咖啡和茶的价格趋于稳定的时候又迅速回升。这种特殊的见识构成了知识。一直以来,这种知识可能一直只隐藏在数据中,但是只有当人们应用了一些花哨的统计分析和/或需要人类专家的帮助才能找到或确认这种模式时,这种知识才变得显而易见。
顺便说一下,在信息一词的信息论意义上,“数据”,“信息”和“已知知识”都包含[IT意义]信息。
人们可能会滑溜溜地说:“随着链条的上升,熵减小”,但这只是松散地成立,因为
熵减少与“对人类的有用性”没有直接或系统的联系
(一个典型的例子是压缩后的文本文件的熵较小,但阅读起来却很无趣)
实际上存在信息丢失(除了熵丢失)
(例如,当数据汇总时,有关单个记录的[IT感觉]信息会丢失)
特别是在信息->知识的情况下,抽象度的变化
最后一点(如果我还没有使所有人感到困惑……)是这样的想法,即data->info->knowledge
链实际上相对于[IT-sense]信息的预期用途/目的。ewernli
在下面的评论中提供了拼写检查器的示例,即,当重点是英语拼写检查时,华尔街天才最有见地的论文只是一串单词,实际上是“原始数据”,其中一些需要改进(沿着拼字法目的链。
同样,使用数千篇报纸文章的语言学家通常(我们希望...)至少包含一些见识/知识(一般意义上),他们可能只是考虑这些文章的原始数据,这将有助于他/她自动创建法语-德语词典(这将是信息),并且在他从事该项目期间,他可能会发现两种语言之间的普通单词用法出现了系统性的语义转换,因此可以洞悉不同的文化。
关于information-theory - 信息是数据的子集吗?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/2438911/
Win32 的 Delphi XE5 编译器具有新的调试信息设置:有限调试信息。 有限调试信息和调试信息有什么区别? 最佳答案 某些编译器提供调试标志的变体,可提供不同级别的调试信息和优化。根据编译和
我有一个 highcharts 散点图,我想添加一些自定义功能。对于每次单击 highcharts 中的项目(单击过滤器、数据点和关闭按钮),我想将有关单击的项目的信息发送到我在下面包含的函数“s”。
我们在 Java 应用程序中更新了安全证书,突然我们开始收到下面提到的异常: java.lang.SecurityException: class "org.hibernate.cfg.Configu
我正在使用 HttpURLConnection 实例来连接到 URL。 然后我调用 getResponseCode 方法以确定连接状态。 我正在使用此方法轮询连接,直到返回的响应代码不是 1xx: H
我很难调试 ASP.NET MVC 代码。我最终按照本 website 中的描述进行操作.调试符号已加载并适用于所有 dll,但 System.Web.MVC。当我双击 stacktrace 窗口中的
好吧,我在很多应用程序上都发现了这个文本,那就是当我安装一些应用程序时需要android.permission.READ_LOGS 权限,它们显示一些文本,例如“读取敏感日志数据的权限...”我不明白
我有一个在浏览器中运行并从 Javascript 调用的小程序。有 2 个类:PortalLauncher 和 ParamSplitter,它们位于默认包中。 Javascript 调用 Portal
我在 eclipse 中使用 OSGi 项目运行 JUnit 测试,我遇到了这个异常: java.lang.SecurityException: class "org.eclipse.core.run
我正在开发一个给 PDF 加水印的小工具,它适用于某些 PDF,但对某些其他 PDF 会崩溃。 我正在使用 iText 库和 bouncycaSTLe(依赖项) pom.xml:
很抱歉,我不知道这是否是属于mathoverflow的数学问题,还是属于这里的计算机科学问题。 就是说,我相信我理解基本的difference between data, information, a
在什么情况下“反文档频率”在信息检索中不起作用? 最佳答案 如果您不希望在系统中权衡稀有术语而不是频繁出现的术语,则可能不希望使用IDF。此外,计算idf是一项昂贵的操作。从以下事实可以明显看出这一点
我正在尝试计算 Average Precision (和 Mean Average Precision )在 Oxford Building image dataset 上. 下面是他们提供的用于计算
信息隐藏如何帮助解耦构成系统的模块? 最佳答案 封装(信息隐藏)允许您只向外界公开绝对最小值。这意味着您可以在不影响客户的情况下将未公开的位更改为您心中的内容。 一个例子。假设您已经实现了一个将字符串
想象一下,在接下来的 10 年里,你拥有世界上所有的 super 计算机。你的任务是尽可能无损地压缩 10 部完整的电影。另一个标准是普通计算机应该能够即时解压缩,并且不需要花费太多的 HD 来安装解
我生活在一个每年更改两次时间的国家。即:一年中有一段时期与 UTC 的偏移量为 -3 小时(-180 分钟),其他时期的偏移量为 -4 小时(-240 分钟) 从图形上看: |-----
在哪里可以找到有关 DrRacket 中 #:when 构造的文档? 这是完整的示例: (define (problem_9 sum) (for*/first ([c (in-range 3 (-
有人知道在网站上查找最相关的联系信息的脚本/食谱/库吗? 一些可能的情况: 在个人网页上查找联系电话号码 在博客上查找所有者电子邮件地址 查找联系页面的网址 最佳答案 查看WSO2's Mashup
你们如何管理信息溢出?你们都用什么工具?有用的工具之一是 RSS 提要阅读器。是否有任何机构使用任何其他工具或任何其他方式来有效管理信息? 最佳答案 做一个信息势利小人。 如果该博客没有绝对震撼您的世
我最近根据 Artima Inside the JVM 2-nd Ed 阅读了有关 JVM 规范的内容。其中一章提到了 Java 运行时中的类型存储,内容如下: An instance of clas
我已阅读 Permuterm indexes stanford 网站上的页面,但是我仍然无法弄清楚我们如何从以下地址到达:*X*至 X* . 那么$在哪里? ? 我可以得到这些: For X, loo
我是一名优秀的程序员,十分优秀!