我试图将一个大的xml文件拆分成更小的块.我写入输出文件然后检查它的大小,看它是否通过了一个阈值,但我不认为getsize()方法按预期工作.
什么是获取大小变化的文件的文件大小的好方法.
我做过这样的事......
import string
import os
f1 = open('VSERVICE.xml', 'r')
f2 = open('split.xml', 'w')
for line in f1:
if str(line) == '</Service>\n':
break
else:
f2.write(line)
size = os.path.getsize('split.xml')
print('size = ' + str(size))
Run Code Online (Sandbox Code Playgroud)
运行此命令将打印0作为文件大小进行约80次迭代,然后打印4176.在实际输出之前,Python是否将输出存储在缓冲区中?
这是我希望做的事情:
我想向文件发送ajax请求(最好使用jQuery),一旦加载文件,确定所请求文件的大小.
经过一番谷歌搜索,很明显我甚至不知道正确的问题要求弄清楚这一点.任何帮助将不胜感激.
我遇到了一个问题,我没有在StackOverflow上遇到任何人,甚至谷歌也没有.
我的主要目标是能够用另一个字符串替换文件中字符串的出现.有没有办法能够访问文件中的所有行.
问题是,当我尝试读取大文本文件(1-2 gb)的文本时,python只读取它的一个子集.
例如,我会做一个非常简单的命令,例如:
newfile = open("newfile.txt","w")
f = open("filename.txt","r")
for line in f:
replaced = line.replace("string1", "string2")
newfile.write(replaced)
Run Code Online (Sandbox Code Playgroud)
它只写入原始文件的前382 MB.以前有人遇到过这个问题吗?
我尝试了一些不同的解决方案,例如使用:
import fileinput
for i, line in enumerate(fileinput.input("filename.txt", inplace=1)
sys.stdout.write(line.replace("string1", "string2")
Run Code Online (Sandbox Code Playgroud)
但它具有相同的效果.也不会以诸如使用的方式读取文件
f.read(10000)
Run Code Online (Sandbox Code Playgroud)
我把它缩小到很大程度上可能是一个解决问题而不是写作问题,因为它只是简单地打印出来的.我知道还有更多的线条.当我在像Vim这样的全文编辑器中打开它时,我可以看到最后一行应该是什么,并且它不是python打印的最后一行.
任何人都可以提供任何建议或尝试吗?
我目前正在使用32位版本的Windows XP,3.25 GB的ram,并运行Python 2.7
*找到编辑解决方案(谢谢Lattyware).使用迭代器
def read_in_chunks(file, chunk_size=1000):
while True:
data = file.read(chunk_size)
if not data: break
yield data
Run Code Online (Sandbox Code Playgroud) 我正在寻找对于从HDV转码的1小时H.264编码高清视频(MiniDV磁带上的HD)的预期磁盘文件大小的一个数量级估计.我想存档大约100个小时的这样的内容,并想知道我是在看大硬盘,像Drobo这样的多驱动器单元,还是企业级存储系统.
编辑
为了澄清几个好的评论,我正在开发将使用这个存档视频的软件,并且还将管理从HDV到压缩格式的转码(在OS X上使用QuickTime).这个问题是为了收集硬件要求.视频来自HDV,转码不必实时发生.我不会流式传输视频,所以我正在寻找能够从HDV内容中保留尽可能多的信息的压缩.原始的HDV视频是隔行扫描的,但是如果这有助于文件大小或H264压缩输出的质量,我可以去隔行扫描.
我如何从PHP中的字符串中获取"filesize"?
我将字符串作为blob放在mysql数据库中,我需要存储blob的大小.我的解决方案是创建一个临时文件并将字符串放入临时文件中.现在我可以从"字符串"中获取文件大小.但那解决方案并不好......
问候
我目前正在研究一个涉及存储多项研究及其内容细节的系统(一项研究通常可以包含1 <X <~2000个图像).我和我的同事正在讨论在数据库中存储文件大小(特别是图像大小)的最佳方法.
文件大小通常从<1kB到> 20MB.
我们目前正在讨论将图像大小存储为:
# of kilobytes (as an integer value)
# of bytes (as a large integer value)
# of megabytes (possibly as a decimal value)
Other Options...
Run Code Online (Sandbox Code Playgroud)
我没有处理过大量存储文件的问题,并且想知道实现这个目的的最有效/最实用的方法是什么?
我想知道PHP和Apache的最大上传大小是多少?我可以通过网络浏览器上传超过2GB的文件吗?
我有一个 800kb *.json 文件,全部压缩为一行。
内置的 JSON 格式化程序似乎拒绝格式化和标记文件,经过一段时间的搜索后我没有找到任何解决方案。我怎样才能做到这一点?
我在Windows Vista上的Safari 5.1中遇到多个文件上传时遇到了不一致(没有尝试过其他平台).input元素具有multiple允许选择多个文件的标志.当用户确实选择多个文件时,会出现问题.在这种情况下,每个File都具有size属性0.如果(仍然带有multiple标志),用户只选择一个文件,则该size属性正确包含文件大小.
在以下示例中可以看到该问题.测试并查看单个文件选择和多个文件选择的输出.(您需要在测试之间重置). JsFiddle测试
有没有人知道一个解决方法?