小编tzo*_*zot的帖子

是否有一个仅适用于一个人的准系统Windows版本控制系统?

我正在尝试为自己的个人使用找到一个尽可能简单的源代码控件.我需要的主要功能是能够读取/拉取我的代码的过去版本.我是唯一的开发人员.我看过很多不同的版本控制系统,但它们看起来都比我需要的更复杂.我需要一个简单的,在Windows下运行,并且不会将自己暴露给网络.

具体来说,版本控制系统应该要求暴露的HTTP接口,它应该只与本地文件系统交互.它只需要是一个版本控制系统,仅适用于一个人和一个人.图形用户界面是一个加号.

有谁知道软件能满足我的要求吗?

谢谢!

-麦克风

windows version-control

31
推荐指数
5
解决办法
2万
查看次数

sql语句中的[]括号

括号在sql语句中做了什么?

例如,在声明中:

insert into table1 ([columnname1], columnname2) values (val1, val2)

另外,如果表名在括号中,它会怎么做?

sql ms-access

27
推荐指数
3
解决办法
4万
查看次数

如何从磁盘获得良好的并发读取性能

我想问一个问题,然后用我自己的答案跟进,但也看看其他人有什么答案.

我们有两个大文件,我们想同时从两个独立的线程中读取.一个线程将顺序读取fileA,而另一个线程将顺序读取fileB.线程之间没有锁定或通信,两者都按顺序读取,并且两者都立即丢弃它们读取的数据.

我们在Windows上使用此设置的经验非常差.两个线程的组合吞吐量大约为2-3 MiB/sec.驱动器似乎花费大部分时间在两个文件之间寻找后退和前进,大概在每次搜索后读取很少.

如果我们禁用其中一个线程并暂时查看单个线程的性能,那么我们可以获得更好的带宽(此机器约为45 MiB /秒).很明显,糟糕的双线程性能是操作系统磁盘调度程序的假象.

我们可以做些什么来改善并发线程读取性能? 也许通过使用不同的API或以某种方式调整操作系统磁盘调度程序参数.

一些细节:

在具有2GiB RAM的机器上,文件大小为2 GiB.出于这个问题的目的,我们认为它们不会被缓存并完美地进行碎片整理.我们使用了碎片整理工具并重新启动以确保这种情况.

我们没有使用特殊的API来读取这些文件.这种行为可以在各种沼泽标准API中重复,例如Win32的CreateFile,C的fopen,C++的std :: ifstream,Java的FileInputStream等.

每个线程在一个循环中旋转,调用read函数.我们改变了每次迭代从API请求的字节数,从1KiB到128MiB之间的值.改变这一点没有任何影响,因此在每次磁盘搜索之后,OS实际读取的数量不是由这个数字决定的.这正是应该期待的.

单线程和双线程性能之间的巨大差异在Windows 2000,Windows XP(32位和64位),Windows Server 2003以及使用和不使用硬件RAID5时都是可重复的.

windows file-io multithreading

26
推荐指数
2
解决办法
7099
查看次数

Python多处理 - 如何在进程完成后释放内存?

我在使用python多处理库时遇到了一个奇怪的问题.

我的代码概述如下:我为每个"符号,日期"元组生成一个进程.我之后结合了结果.

我希望当一个进程完成"符号,日期"元组的计算时,它应该释放它的内存吗?显然情况并非如此.我看到几十个进程(虽然我将进程池设置为大小为7),这些进程在机器中被挂起¹.它们不消耗CPU,也不释放内存.

在完成计算后,如何让进程释放其内存?

谢谢!

¹"暂停"我的意思是他们在ps命令中的状态显示为"S +"

def do_one_symbol( symbol, all_date_strings ):
    pool = Pool(processes=7)
    results = [];
    for date in all_date_strings:
        res = pool.apply_async(work, [symbol, date])
        results.append(res);

    gg = mm = ss = 0;
    for res in results:
        g, m, s = res.get()
        gg += g; 
        mm += m; 
        ss += s;
Run Code Online (Sandbox Code Playgroud)

python memory multiprocessing

24
推荐指数
2
解决办法
1万
查看次数

标记层次结构和处理

这是一个真正的问题,一般适用于标记项目(是的,这也适用于StackOverflow,不,这不是关于StackOverflow的问题).

整个标记问题有助于聚类类似的项目,无论它们是什么项目(笑话,博客帖子,所以问题等).但是,(通常但不严格)是标签的层次结构,这意味着某些标签也暗示其他标签.使用一个熟悉的例子,"c#"so标签也暗示".net"; 另一个例子,在笑话数据库中,"blondes"标签暗示"嘲弄"标签,类似于"爱尔兰"或"belge"或"加拿大"等,取决于笑话的国家来源.

你是如何在项目中处理这个问题的?我将提供一个答案,描述我在两个不同的情况下使用的两种不同的方法(实际上,相同的机制,但在两个不同的环境中实现),但我不仅对类似机制感兴趣,而且对您对层次结构问题的看法感兴趣.

tags tagging hierarchical-clustering

20
推荐指数
2
解决办法
3135
查看次数

python打开文本文件,每个字符之间有一个空格

每当我尝试使用python命令打开.csv文件时, fread = open('input.csv', 'r') 它总是打开文件,每个字符之间都有空格.我猜这是文本文件有问题,因为我可以使用相同的命令打开其他文本文件并正确加载它们.有谁知道为什么文本文件会在python中像这样加载?

谢谢.

更新

好吧,我是在Jarret Hardie的帖子的帮助下得到的

这是我用来将文件转换为ascii的代码

fread = open('input.csv', 'rb').read()
mytext = fread.decode('utf-16')
mytext = mytext.encode('ascii', 'ignore')
fwrite = open('input-ascii.csv', 'wb')
fwrite.write(mytext)
Run Code Online (Sandbox Code Playgroud)

谢谢!

python csv text-files

18
推荐指数
2
解决办法
1万
查看次数

django在我的机器上很慢

我有一个全新安装的django 1.0,并提供一个简单的页面加载需要5秒.在我同事的电脑上几乎没时间.

我使用启动服务器

python manage.py testserver

我可以看到每个GET请求(PNG和样式表)大约需要半秒钟.

另一个奇怪的事情,我认为是相关的,应用程序的功能测试在我的机器上使用MySQL运行得慢得多(比我同事的机器慢100倍).当我将应用程序设置为使用sqlite时,它们运行得非常快.我想感叹sqlite并没有太多改变加载页面所需的时间,但它确实加快了服务器的启动速度.

它看起来像IO问题,但我没有看到我的机器上的一般性能问题,除了django至少.

Django在python2.4上运行,我正在运行Vista.我也检查了python2.5.

谢谢ΤΖΩΤΖΙΟΥ,它必须完全是一个DNS问题,因为页面加载快速而不是http:// localhost:8000/app我去http://127.0.0.1:8000/app.

但它可能是由什么引起的?我的主机文件只有两个条目:

127.0.0.1   localhost
::1         localhost

python django dns

16
推荐指数
2
解决办法
2万
查看次数

在Perforce中,您是否可以将文件夹重命名为相同的名称,但是以不同的方式添加?

我可以将Perforce中的文件夹从// depot/FooBar /重命名为// depot/Foobar /

我通过从// depot/FooBar /重命名到// depot/Temp /// Depot/Foobar /来尝试这个,但最终结果与// depot/FooBar /相同.

perforce

14
推荐指数
3
解决办法
9817
查看次数

从Microsoft Access创建表DDL

有没有简单的方法从Microsoft Access(2007)检索表创建DDL或我是否必须使用VBA自己编写代码来读取表结构?

我有大约30个表,我们正在移植到Oracle,如果我们可以从Access定义创建表,它将使生活更轻松.

sql ms-access

14
推荐指数
2
解决办法
2万
查看次数

线读取阻塞在0x1A上

我有以下文件:

abcde
kwakwa
<0x1A>
line3
linllll
Run Code Online (Sandbox Code Playgroud)

其中,<0x1A>表示十六进制值为0x1A的字节.尝试在Python中读取此文件时:

for line in open('t.txt'):
    print line,
Run Code Online (Sandbox Code Playgroud)

它只读取前两行,并退出循环.

解决方案似乎是以二进制(或通用换行模式)打开文件 - 'rb'或'rU'.你能解释一下这种行为吗?

python windows binary-data

13
推荐指数
2
解决办法
3206
查看次数