小编Eli*_*sie的帖子

如何从C#中的MS office文档中提取文本

我试图使用C#从MS Word(.doc,.docx),Excel和Powerpoint中提取文本(字符串).我在哪里可以找到一个免费且简单的.Net库来阅读MS Office文档?我尝试使用NPOI,但我没有得到关于如何使用NPOI的样本.

c# text-extraction ms-office

35
推荐指数
6
解决办法
6万
查看次数

Lucene.Net最佳实践

使用Lucene.Net的最佳做法是什么?或者我在哪里可以找到一个好的lucene.net使用样本?

.net lucene indexing lucene.net full-text-indexing

34
推荐指数
2
解决办法
8450
查看次数

如何识别文件夹中是否存在Lucene.Net索引?

我使用Lucene.Net来索引和搜索文档,我使用以下代码创建或打开索引(如果存在):

IndexWriter writer = new IndexWriter(@"C:\index", new StandardAnalyzer(), !IndexExists);

...

private bool IndexExists
{
    get
    {
        return ??
    }
}
Run Code Online (Sandbox Code Playgroud)

现在,如何IndexExists以简单的方式实施?我不需要抛出任何异常.

indexing search lucene.net full-text-search full-text-indexing

21
推荐指数
2
解决办法
6596
查看次数

如何识别拼写不同的相似单词

我想从数据库中筛选出重复的客户名称.单个客户可能有多个具有相同名称的系统条目,但拼写上的差异很小.所以这是一个例子:一个名为Brook的客户可能有三个条目进入系统:

  1. 布鲁克伯塔
  2. 布鲁克伯塔
  3. 比鲁克贝塔

我们假设我们将此名称放在一个数据库列中.我想知道识别此类重复的不同机制,例如100,000条记录.我们可以在C#中使用正则表达式来遍历所有记录或其他一些模式匹配技术,或者我们可以将这些记录导出到最适合此类查询的内容(具有正则表达式功能的SQL)).

这就是我认为的解决方案

  • 编写一个C#代码来遍历每条记录
  • 只按顺序获取辅音字母(在上面的例子中:BrKBrt)
  • 从其他记录中搜索相同的辅音模式,考虑类似的声音字母,如(C,K)(C,S),(F,PH)

所以请转发任何想法.

c# sql pattern-matching linq-to-sql

6
推荐指数
1
解决办法
3959
查看次数

我们用telnet做的所有事情是什么?

我想知道telnet可以完成的所有事情,目前我用它来确定远程机器是否正在监听某个特定端口,如telnet [machine] [port].任何想法,请

networking

4
推荐指数
2
解决办法
5414
查看次数

Actionscript到java源代码转换器

有没有一个工具可以将actionscript3源代码转换为java源?

java flash actionscript converter actionscript-3

4
推荐指数
1
解决办法
8780
查看次数

无法连接到j2me设备模拟器

我在测试Midlet时遇到了麻烦.我正在使用j2me sdk 3,Midlet构建成功,但是当我尝试运行它时,它失败并在日志中显示以下消息:

无法连接到设备{0}!
原因:
仿真器{0}在等待注册时终止!

java-me

3
推荐指数
1
解决办法
8330
查看次数