我读了一些关于Lucene的文件; 我也阅读了这个链接中的文档(http://lucene.sourceforge.net/talks/pisa).
我真的不明白Lucene如何索引文档并且不了解Lucene用于索引的算法?
在上面的链接中,它表示Lucene使用此算法进行索引:
- 增量算法:
- 维护一堆段索引
- 为每个传入文档创建索引
- 将新索引推入堆栈
- 令b = 10为合并因子; M = 8
for (size = 1; size < M; size *= b) {
if (there are b indexes with size docs on top of the stack) {
pop them off the stack;
merge them into a single index;
push the merged index onto the stack;
} else {
break;
}
}
Run Code Online (Sandbox Code Playgroud)
该算法如何提供优化的索引?
Lucene是否使用B树算法或任何其他算法进行索引 - 或者它是否具有特定算法?
我想知道为什么Python不是完全面向对象的.例如,它不支持私有,公共,受保护的访问级别修饰符.
这有什么优缺点?通过这些表达式,Python适用于哪些应用程序(桌面,科学,Web或其他)?
我在C#中有一个三层应用程序.在业务层我有很多线程做同样的工作.我想在UI上显示每个线程的进度,但我没有表示层的引用.
我怎样才能做到这一点 ?最好的方法是什么?
谢谢 .
如果我们想在反向索引结构中搜索像这样的查询“ t1 t2 t3”(t1,t2,t3必须排队),该怎么办?
1-首先,我们搜索“ t1”项,找到包含“ t1”的所有文档,然后对“ t2”然后是“ t3”进行此操作。然后找到位置“ t1”,“ t2”和“ t3”彼此相邻的文档。
2-首先,我们搜索“ t1”项并找到包含“ t1”的所有文档,然后在找到的所有文档中搜索“ t2”,然后在此结果中找到包含“ t3”的文档“。
我有一个完整的倒排索引。我想知道上面的哪些方法是优化的(1)或(2)?
非常感谢。
我想开发与苹果iOS platform.My游戏SpriteKit游戏有一个设置页面包含标签,按钮,表格视图,......和游戏page.In我的测试中,第一页是设置,当玩家按下"开始",游戏将开始.我不知道如何转移到游戏场景,我不知道我的问题在哪里,也许是因为我是SpriteKit的新手.我的设置页面是故事板中的起始页面,默认情况下它连接到GameViewController,当我按下"开始"按钮时,我在最后一行得到错误,程序将停止.我想在新视图中加载我的游戏场景,但我有问题.这是我的代码:
-(IBAction)btn_startGame:(id)sender
{
SKView* skView = (SKView*)self.view;
SKScene* obj_gameScene = [MyScene sceneWithSize:skView.bounds.size];
obj_gameScene.scaleMode = SKSceneScaleModeAspectFill;
SKTransition *transition = [SKTransition flipVerticalWithDuration:0.5];
[skView presentScene:obj_gameScene];
}
Run Code Online (Sandbox Code Playgroud)
这是错误:
2016年1月21日06:06:40.201 test_myGame [605:5321] - [UIView的presentScene:]:无法识别的选择发送到实例0x7fd809fcf570 2016年1月21日06:06:40.207 test_myGame [605:5321]***终止应用程序由于未捕获的异常'NSInvalidArgumentException',原因:' - [UIView presentScene:]:无法识别的选择器发送到实例0x7fd809fcf570'
我想得到Lucene中一个词的偏移量.我怎么才能得到它 ?
我把我的内容描述为
Field.TermVector.WITH_POSITIONS_OFFSETS
Run Code Online (Sandbox Code Playgroud)
Lucene中是否有任何方法可以让我在一个文档中抵消该术语?
我有一个从互联网下载页面的下载程序.每个页面的编码是不同的,有些是UTF-8,有些是Unicode.例如:a显示'a'字符; 这个字符的页面.我们应该将此编码转换为普通文本.
我UnicodeEncoding在c#中使用过这个课程,但是他们没有帮助我.
如何将此编码解码为真实字符?是否有一个类或方法来转换它?
谢谢 .
我有一个爬虫应用程序(使用C#)从Web下载页面.应用程序需要更多的虚拟内存,即使我处理每个对象甚至使用GC.Collect() .
这个,有10个线程,每个线程都有一个下载页面的套接字.在每个线程中,我有一个byte[] buffer存储页面内容,并有一个string str_content我存储在其中,页面内容在字符串中.我有一个Sytem.Timer每3秒钟的一次,如果每个线程都被停止,给它分配新线程并启动它.
我使用dispose方法甚至GC.Collect()在我的应用程序中使用,但是在3小时内,我的应用程序在虚拟内存上占用500 MB(在Process explorer中的私有字节上为500 MB).然后我的系统将挂起,我应该重新启动我的电脑.
会不会很粗鲁,如果我指定我的byte[]并且string为空?
有什么方法可以用来释放虚拟内存吗?
谢谢 .
我从事系统安全工作,我想知道为什么我们需要RPC编程以及RPC和简单套接字编程之间的区别是什么?它们都有客户端和服务器应用程序,基于tcp/ip,IP地址,端口号,...谢谢