作者热门文章
- c - 在位数组中找到第一个零
- linux - Unix 显示有关匹配两种模式之一的文件的信息
- 正则表达式替换多个文件
- linux - 隐藏来自 xtrace 的命令
我正在使用 Orange(在 Python 中)执行一些数据挖掘任务。更具体地说,用于聚类。尽管我已经阅读了教程并阅读了大部分文档,但我仍然遇到问题。文档和教程中的所有示例都假设我有一个制表符分隔的表格,其中包含数据。但是,没有说明如何从头开始创建新表。例如,我想为不同文档中的词频创建一个表。
也许我遗漏了一些东西,所以如果有人有任何见解,我们将不胜感激。
谢谢乔治
这是我创建表格的方式
#First construct the domain object (top row)
vars = []
for var in variables:
vars.append(Orange.data.variable.Continuous(str(var)))
domain = Orange.data.Domain(vars, classed) #The second argument indicated that the last attr must not be a class
#Add data rows assuming we have a matrix
t = Orange.data.Table(domain, matrix)
最佳答案
我花了好几个小时才弄明白。在 python 中,这样做:
Import Orange
List, Of, Column, Variables = [Orange.feature.Discrete(x) for x in ['What','Theyre','Called','AsStrings']]
Domain = Orange.data.Domain([List, Of, Column, Variables])
Table = Orange.data.Table(Domain)
Table.save('NewTable.tab')
我会告诉您每一段代码的作用,但到目前为止我还不确定。有趣的是,如此强大的工具包竟然有如此难以理解的文档,但我怀疑这是因为它的整个用户群都有博士学位。
关于python - 如何在 Orange 中创建新的数据表?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/8986719/
我是一名优秀的程序员,十分优秀!