如何在Orange中创建新数据表?

Geo*_*ous 5 python data-mining orange

我正在使用Orange(在Python中)进行一些数据挖掘任务.更具体地说,用于聚类.虽然我已经阅读了教程并阅读了大部分文档,但我仍然遇到了问题.文档和教程中的所有示例都假设我有一个带有数据的制表符分隔表.但是,没有什么可以说如何从头开始创建新表.例如,我想为不同文档中的单词频率创建一个表.

也许我错过了一些东西,所以如果有人有任何见解,我会很感激.

谢谢乔治

编辑:

这就是我创建表格的方式

#First construct the domain object (top row)
vars = []
for var in variables:
    vars.append(Orange.data.variable.Continuous(str(var)))
domain = Orange.data.Domain(vars, classed) #The second argument indicated that the last attr must not be a class    
#Add data rows assuming we have a matrix 
t = Orange.data.Table(domain, matrix)        
Run Code Online (Sandbox Code Playgroud)

N. *_*cA. 5

这花了我几个小时才弄明白.在python中,执行以下操作:

Import Orange
List, Of, Column, Variables = [Orange.feature.Discrete(x) for x in ['What','Theyre','Called','AsStrings']]
Domain = Orange.data.Domain([List, Of, Column, Variables])
Table = Orange.data.Table(Domain)
Table.save('NewTable.tab')
Run Code Online (Sandbox Code Playgroud)

我会告诉你每一段代码的作用,但截至目前我还不确定.有趣的是,这样一个功能强大的工具包应该有如此难以理解的文档,但我怀疑这是因为它的整个用户群都有博士学位.