问题列表 - 第6059页

如何在两个非常大的文件中找到常用字符串?

我有两个非常大的文件(它们都不适合内存).每个文件在每一行都有一个字符串(其中没有空格,长度为99/100/101个字符).

更新:字符串不是任何排序顺序.
Update2:我在Windows上使用Java.

现在我想弄清楚找出两个文件中出现的所有字符串的最佳方法.

我一直在考虑使用外部合并排序来对两个文件进行排序然后进行比较,但我不确定这是否是最好的方法.由于字符串大多数都是相同的长度,我总是想知道为每个字符串计算某种哈希是否是个好主意,因为这样可以使字符串之间的比较更容易,但那意味着我必须存储哈希值计算我到目前为止从文件中遇到的字符串,以便稍后在将它们与其他字符串进行比较时可以使用它们.我无法确定最佳方式.我在寻找你的建议.

当您提出解决方案时,如果有超过2个文件并且必须计算出所有文件中出现的字符串,请说明解决方案是否有效.

string algorithm file

8
推荐指数
2
解决办法
1万
查看次数

计算前一周的开始和结束日期

在C#中计算前一周的开始和结束日期的最佳方法是什么?即今天3月18日将导致3月9日(上周一)和3月15日(上周日).

我已经看到使用DayOfWeek和switch语句来完成偏移,但是想知道是否有更优雅的方式.

c#

37
推荐指数
3
解决办法
4万
查看次数

PHP rand()...得到真正的50/50结果?

我想运行一个有两种不同结果的函数,但我希望每个结果真正达到50%.我假设兰德(0,1)是要走的路,但我很好奇,如果这可能有利于一个而不是另一个.获得50/50结果的最佳方法是什么?

谢谢.

编辑:谢谢你们,我不希望它是随机的,我希望结果是101010101而不是111001101.也许我应该用最后一个值输出更新数据库然后返回相反的?

EDIT2:好的,对不起,我的上次编辑有误导性.我只是为每个用户调用一次函数,并将该值作为cookie分配给用户.我希望每个访问用户在订单1010101中收到1或0.

php

8
推荐指数
3
解决办法
2万
查看次数

WCF序列化与对象继承?

我有两个对象,一个在我们的企业级别,另一个在我们的服务级别.服务对象继承自企业.这是一个简单的例子:

[DataContract]
public class EnterpriseObject{
     [DataMember]
     int ID{get; set;}

     string InternalUse{get; set;}
}

[DataContract]
public class ServiceObject: EnterpriseBaseObject{
     [DataMember]     
     string Address{get; set;}
}
Run Code Online (Sandbox Code Playgroud)

是否有可能只在序列化中公开ServiceObject(具有EnterpriseObject的继承属性)?我不希望客户端看到列为选项的企业对象?正如您在示例中所看到的,未为InternalUser属性设置DataMember属性.这是唯一的方法吗?谢谢

wcf serialization .net-3.5

5
推荐指数
1
解决办法
2934
查看次数

Java:在排序列表中查找元素的最佳方法是什么?

我有一个

List<Cat>
Run Code Online (Sandbox Code Playgroud)

按猫的生日排序.是否有一种有效的Java Collections方法可以找到1983年1月24日出生的所有猫?或者,一般来说什么是好方法?

java collections list sorted findall

4
推荐指数
2
解决办法
2万
查看次数

.Net二进制序列化 - 如何限制对象图?

我有一个对象,我希望尽可能高效地在进程之间进行序列化和分发.对象本身具有对另一个对象的引用,如下所示:

public class Foo
{
    // Unique Identifier:
    public int Id;
    public Bar Bar;
}

public class Bar
{
    // Unique Identifier:
    public int Id;
}
Run Code Online (Sandbox Code Playgroud)

问题是我只想序列化Foo并通过线路运行它.我宁愿不把Bar包含在我通过电线发送的内容中,因为它在另一边是已知的并且发送它会浪费我的"带宽".

我想做的是这样的:

  1. 在序列化时,我将对Bar(Foo.Bar)的引用序列化为包含以下内容的int:Bar.Id(这是Bar实例的唯一标识符)

  2. 只有Foo才会通过网络发送(包含int而不是Bar属性).

  3. 在反序列化时,我得到int,从存储库中获取正确的Bar并将其放入Foo.Bar属性中.

这是限制序列化对象图的任务的有效方法吗?有没有更好的方法呢?

.net serialization

1
推荐指数
1
解决办法
712
查看次数

查找表中的列数

可以在表中找到行数:

select count(*) from tablename
Run Code Online (Sandbox Code Playgroud)

是否可以找到表中的列数?

mysql sql

115
推荐指数
7
解决办法
33万
查看次数

你将如何实现一个基本的事件循环?

如果你使用过gui工具包,你就知道有一个事件循环/主循环应该在一切完成后执行,这将使应用程序保持活跃并响应不同的事件.例如,对于Qt,您可以在main()中执行此操作:

int main() {
    QApplication app(argc, argv);
    // init code
    return app.exec();
}
Run Code Online (Sandbox Code Playgroud)

在这种情况下,app.exec()是应用程序的主循环.

实现这种循环的显而易见的方法是:

void exec() {
    while (1) {
        process_events(); // create a thread for each new event (possibly?)
    }
}
Run Code Online (Sandbox Code Playgroud)

但是这会将CPU限制在100%并且实际上是无用的.现在,我如何实现这样一个响应的事件循环,而不必完全占用CPU?

回答在Python和/或C++中受到赞赏.谢谢.

脚注:为了学习,我将实现自己的信号/插槽,我会用它们来生成自定义事件(例如go_forward_event(steps)).但是如果你知道如何手动使用系统事件,我也想知道这一点.

c++ python event-loop blocking

56
推荐指数
5
解决办法
3万
查看次数

如果它们的类没有成员变量,那么所有方法都应该是静态的

我和我合作过的人发生过争吵,这真的让我烦恼.如果你有一个只有calculateRiskor或和方法calculatePrice的类,那么这个类是不可变的并且没有成员变量,那么这些方法应该是静态的,这样就不必每次都创建一个类的实例.我使用以下示例:

public class CalcService {
  public int calcPrice(Trade trade, Date date) {
    ...
  }
  public double calcRisk(Trade trace, Date date) {
    ...
  }
}
Run Code Online (Sandbox Code Playgroud)

这些方法应该是static吗?

java static

31
推荐指数
5
解决办法
4304
查看次数

/ proc/meminfo中的条目

我可以理解/ proc/meminfo中包含的大部分信息,如总内存,缓冲区,缓存等.你能告诉我,下面列出的那些不太明显的是什么意思?

  • AnonPages
  • 映射
  • NFS_Unstable
  • 弹跳
  • VmallocTotal
  • VmallocUsed
  • VmallocChunk

如果有人想知道,我在谈论linux命令cat/proc/meminfo的输出

linux memory procfs

21
推荐指数
2
解决办法
5万
查看次数

标签 统计

java ×2

serialization ×2

.net ×1

.net-3.5 ×1

algorithm ×1

blocking ×1

c# ×1

c++ ×1

collections ×1

event-loop ×1

file ×1

findall ×1

linux ×1

list ×1

memory ×1

mysql ×1

php ×1

procfs ×1

python ×1

sorted ×1

sql ×1

static ×1

string ×1

wcf ×1