小编Osa*_*eed的帖子

查找具有相似文本的文章的算法

我在数据库中有很多文章(标题,文字),我正在寻找一种算法来找到X最相似的文章,比如Stack Overflow的"相关问题",当你提出问题时.

我尝试谷歌搜索,但只找到关于其他"类似文本"问题的页面,比如将每篇文章与所有其他文章进行比较并在某处存储相似性.因此,我只是在我刚输入的文本上"实时"执行此操作.

怎么样?

language-agnostic string algorithm text similarity

60
推荐指数
3
解决办法
3万
查看次数

无论使用OleDb的工作表名称,从Excel文档获取第一张工作表

我有用户将他们的表单命名为各种疯狂的东西,但我希望能够获得Excel文档的第一张表,无论它的名称是什么.

我目前使用:

OleDbDataAdapter adapter = new OleDbDataAdapter(
"SELECT * FROM [sheetName$]", connString);
Run Code Online (Sandbox Code Playgroud)

无论它的名字是什么,我如何获得第一张纸?

谢谢.

.net oledb

30
推荐指数
2
解决办法
6万
查看次数

Subversion Obliterate功能

我只是想编写一个shell脚本来以易于实现的方式实现删除功能(外部,使用建议的方式,但是自动化).

这就是我的想法:

在客户端

  1. svn list -R > file-list.
  2. 过滤文件列表有几种方式,比如grep来创建一个文件"files-to-delete",类似于一组grep XXX file-list>>files-to-delete.
  3. files-to-delete使用scp 传输到服务器.

在服务器上

  1. 转储存储库svnadmin dump /path/to/repos > repos-dumpfile,这也可以作为备份保存.
  2. 过滤转储文件,对于"要删除的文件"中的每个单词,执行: cat repos-dumpfile | svndumpfilter exclude $file > new-dumpfile
  3. 创建一个新的存储库并将新文件加载到该存储库 svnadmin create new-name; svnadmin load new-name < new-dumpfile

这会有用吗?怎么会失败?还有其他想法吗?

svn svndumpfilter svnadmin svndump

22
推荐指数
2
解决办法
1万
查看次数

如何/仅使用表单和数据模块重构Delphi程序

经过多年将Delphi程序编码为表单和数据模块中不可测试的代码(包括全局变量),唯一的类是表单本身,包含表单UI本身所需的所有代码.

我如何将代码转换为一组执行实际工作的类?我是否需要停止使用数据源/数据集并在类中执行所有操作?我需要ORM吗?

通常没有必要在表单中重用代码,所以将逻辑转换为类是否有意义?

delphi oop refactoring unit-testing datamodel

20
推荐指数
3
解决办法
2013
查看次数

在Delphi程序中托管.NET运行时

我正在研究在Delphi程序中使用一些.NET代码,我需要使用.net程序集和预定义函数使我的程序可扩展(我已经支持常规DLL).

经过大量的在线搜索后,我找到了 Managed-VCL,但我还没准备好为我需要支付250美元,我还发现了一些代码不完整但不起作用的新闻组.

我正在使用Delphi 2007 for win32.我可以使用什么来从具有预定义参数的程序集动态执行函数?

就像是:

procedure ExecAssembly(AssemblyFileName:String; Parameters: Variant);
Run Code Online (Sandbox Code Playgroud)

我只想补充一点,我需要能够加载任意程序集(可能是特定文件夹中的所有程序集),因此创建C#包装器可能无法正常工作.

.net delphi com winapi interop

13
推荐指数
3
解决办法
7748
查看次数

使用memcache_mget()Memcached ruby​​gem + Rlibmemcached参数错误

我在使用Evan Weaver的Memcached gem(如Memcached :: Rails.new) - >(http://github.com/fauna/memcached)并调用get_multi()时遇到异常

ArgumentError: wrong # of arguments(2 for 4)
from /usr/local/lib/ruby/gems/1.8/gems/memcache-auth-1.0.1/lib/memcached/memcached.rb:384:in `memcached_mget'
from /usr/local/lib/ruby/gems/1.8/gems/memcache-auth-1.0.1/lib/memcached/memcached.rb:384:in `get_orig'
from /usr/local/lib/ruby/gems/1.8/gems/memcache-auth-1.0.1/lib/memcached/rails.rb:40:in `get_multi'
Run Code Online (Sandbox Code Playgroud)

我注意到memcached_get.h将memcached_mget定义为:

memcached_return memcached_mget(memcached_st *ptr, 
                            const char * const *keys, 
                            const size_t *key_length, 
                            size_t number_of_keys);
Run Code Online (Sandbox Code Playgroud)

所以,似乎缺少key_length和number_of_keys(我的C有点生疏,但我认为那些将是必需的参数).

但是,看起来相关的ruby代码(在rails.rb中)只传递2个args:

def get_multi(keys, raw=false)
  get_orig(keys, !raw)
end
Run Code Online (Sandbox Code Playgroud)

更新:事实证明这是红宝石宝石中的一个错误,现在已经修补了.

c ruby memcached rubygems

13
推荐指数
1
解决办法
501
查看次数

如何更改Oracle XE实例的SID

我需要更改Oracle XE数据库的SID(而不是服务名称)以匹配生产数据库.

当我尝试在线搜索时,大多数页面都是通过tnsnames.ora描述更改或添加服务名称; 那不是我需要做的.

oracle sid oracle-xe service-name

12
推荐指数
1
解决办法
3万
查看次数

测试Delphi应用程序的最佳方法

我有一个Delphi应用程序,它有许多依赖项,并且很难重构它以使用DUnit(它很大),所以我考虑使用像AutomatedQA的TestComplete这样的东西从前端UI进行测试.

我的主要问题是错误修复或新功能有时会破坏之前测试过的旧代码(手动),并且用于工作.

我已经设置了应用程序以使用命令行开关来打开可以测试的特定表单,并且我可以创建一组需要完成的值和点击.

但在我做任何激烈的事情之前我有几个问题......(在购买之前)

  1. 这值得么?
  2. 这是一个很好的测试方法吗?
  3. 测试结果应该在我的数据库(Oracle)中,是否有一种简单的方法可以在testcomplete中检查这些值(多个表中的多个字段)?
  4. 我需要设置一个测试数据库来进行所有自动化测试,是否有一种简单的方法可以自动重新设置测试数据库?除了删除用户级联,创建用户,...,impdp.
  5. testcomplete中是否有一种方法可以为exe指定命令行参数?
  6. 有没有人有类似的经历.

delphi testing oracle testcomplete

12
推荐指数
2
解决办法
3033
查看次数

如何使Perl等待使用system()在后台启动的子进程?

我有一些Perl代码执行多个参数的shell脚本,为了简化,我只是假设我有这样的代码:

for $p (@a){
    system("/path/to/file.sh $p&");
}
Run Code Online (Sandbox Code Playgroud)

之后我想做更多的事情,但是我找不到等待所有子进程完成的方法,然后再继续.

将代码转换为使用fork()会很困难.是不是有更简单的方法?

linux perl wait child-process

10
推荐指数
3
解决办法
3万
查看次数

存储许多日志文件

我有一个系统,它通过http(> 10k生产者,每天10个日志,每个约100行文本)从不同的地方接收日志文件.

我想存储它们以便能够计算misc.每晚统计它们,出口它们(按到达日期或第一行内容排序)......

我的问题是:存储它们的最佳方法是什么?

  • 平面文本文件(具有适当的锁定),每个上传文件一个文件,每天一个目录/生产者
  • 平面文本文件,所有生产者每天一个(大)文件(这里的问题将是索引和锁定)
  • 带有文本的数据库表(由于内部原因,MySQL是首选)(pb与DB清除为删除可能会很长!)
  • 数据库表,每行文本一条记录
  • 具有分片的数据库(每天一个表),允许简单的数据清除.(这是分区.但是我有权访问的mysql版本(即内部支持)不支持它)
  • 基于文档的DBàlacouchdb或mongodb(问题可能与索引/成熟度/摄取速度有关)

有什么建议?

database language-agnostic logging

10
推荐指数
2
解决办法
4575
查看次数