小编atl*_*tis的帖子

用于大数据集的最大熵分类器

我一直在寻找一种最大熵分类实现,它可以处理500个类和1000个特征的输出大小.我的训练数据大约有30,000,000行.我尝试过使用MegaM,64位R maxent软件包,这是爱丁堡大学的最大工具,但正如预期的那样,它们都无法处理数据的大小.但是,对于这种性质的nlp任务而言,数据集的大小似乎并不太过分.我应该采用哪些技术?或者我可以使用的工具包的任何建议?我试图在具有8GB RAM的64位Windows机器上运行它,在需要时使用Cygwin.

nlp classification machine-learning

3
推荐指数
1
解决办法
1356
查看次数

导入 oracle 转储时出错

我正在尝试将转储导入到同一个 oracle DB 中的两个模式中。遵循一种解决方法来执行此操作。

我正在尝试使用 INDEXFILE 选项运行 imp 命令,以便能够修改 sql 中的表空间名称。这就是我得到的:

E:\oracle_10_2\BIN>imp atlantis/atlantis@orcl file=ABCD1_EXCLUDE_CLOB_TABS_BAK.dmp indexfile=index.sql full=y log=imp.log

导入:发布 10.2.0.1.0 - 2009 年 3 月 12 日星期四 15:31:44 生产

版权所有 (c) 1982, 2005,甲骨文。版权所有。

连接到:Oracle 数据库 10g 企业版 10.2.0.1.0 版 - 使用分区、OLAP 和数据挖掘选项进行生产

IMP-00002:无法打开 ABCD1_EXCLUDE_CLOB_TABS_BAK.dmp 以读取导入文件:EXPDAT.DMP >

对我来说看起来像是文件权限问题,所以我尝试更改它。

E:\oracle_10_2\BIN>cacls E:\ABCD1_EXCLUDE_CLOB_TABS_BAK.dmp /p atlantis:F

你确定(是/否)?是

处理文件:E:\ABCD1_EXCLUDE_CLOB_TABS_BAK.dmp

E:\oracle_10_2\BIN>cacls E:\ABCD1_EXCLUDE_CLOB_TABS_BAK.dmp

E:\ABCD1_EXCLUDE_CLOB_TABS_BAK.dmp CORP\atlantis:F

但问题仍然存在。

oracle import dump

2
推荐指数
1
解决办法
2万
查看次数

使用Haskell迭代文件

我有一个Haskell函数,它在单个文件上运行以生成映射.我想迭代目录中的所有文件并应用此函数来生成单个映射.

我试图这样做:

perFileFunc :: Int -> FilePath -> IO (Map.Map [Char] Double)

allFilesIn dir =  filter (/= "..")<$>(filter(/= ".")<$>(getDirectoryContents dir)
Run Code Online (Sandbox Code Playgroud)

这给了我一个目录中所有文件名的列表,除了.和..

现在,当我尝试做

myFunc dir n = map (perFileFunc n) <$> allFilesIn dir
Run Code Online (Sandbox Code Playgroud)

它没有做任何事情.我期待一个地图列表,我可能会使用unionWith(+)加入.

这似乎不是正确的方法.

directory haskell file

2
推荐指数
1
解决办法
683
查看次数

如果(b,a)存在,则从元组的python列表中删除(a,b)

从python的元组列表(它本质上是一个列表的笛卡尔积)我想删除(a,b)if(b,a)是否在列表中.只有(a,b)或(b)之一,a)必须保留.列表

[(1,1),(1,2),(1,3),(2,1),(2,2),(2,3),(3,1),(3,2),(3,3)] 
Run Code Online (Sandbox Code Playgroud)

必须减少到

[(1,2),(1,3),(2,3)]
Run Code Online (Sandbox Code Playgroud)

(虽然删除(1,2)和保留(2,1)是好的)

我试过这样做,但我不确定在迭代时从列表中删除.这不起作用.(给我[(1, 2), (2, 1), (2, 3), (3, 1), (3, 3)])

[pairs.remove((a,b)) for (a,b) in pairs if ((b,a) in pairs)]
Run Code Online (Sandbox Code Playgroud)

python list

2
推荐指数
1
解决办法
362
查看次数