这就是我所拥有的:
glob(os.path.join('src','*.c'))
Run Code Online (Sandbox Code Playgroud)
但我想搜索src的子文件夹.像这样的东西会起作用:
glob(os.path.join('src','*.c'))
glob(os.path.join('src','*','*.c'))
glob(os.path.join('src','*','*','*.c'))
glob(os.path.join('src','*','*','*','*.c'))
Run Code Online (Sandbox Code Playgroud)
但这显然是有限和笨重的.
我试图.c使用Python 查找目录中的所有文件.
我写了这个,但它只是将所有文件归还给我 - 而不仅仅是.c文件.
import os
import re
results = []
for folder in gamefolders:
for f in os.listdir(folder):
if re.search('.c', f):
results += [f]
print results
Run Code Online (Sandbox Code Playgroud)
我怎样才能获得.c文件?
我是python语言的初学者
如何使用.txtpython语言列出目录中的所有文件?
例如获取列表文件:
['1.txt','2.txt','3.txt','4.txt','5.txt','6.txt']
Run Code Online (Sandbox Code Playgroud) 我有一个目录,其中包含以下文件:
apple1.json.gz
apple2.json.gz
banana1.json.gz
melon1.json.gz
melon2.json.gz
Run Code Online (Sandbox Code Playgroud)
我希望能够找到所有的apple,banana和melon文件类型.
从这个SO答案我知道我可以通过文件类型找到:
import glob, os
os.chdir("/mydir")
for file in glob.glob("*.json.gz"):
print(file)
Run Code Online (Sandbox Code Playgroud)
但是,就我而言,我无法通过文件名或文件类型进行匹配.而是一个部分文件名匹配(所有apple的等等)
在这个SO问题中,提出了这个解决方案:
[in] for file in glob.glob('/path/apple*.json.gz'):
print file
Run Code Online (Sandbox Code Playgroud)
但是,这会返回零
[out]
0
Run Code Online (Sandbox Code Playgroud) 我是Python的新手,所以这个问题可能有点基础.我有44个csv文件具有相同的标题和不同的文件名.我想将它们全部合并到一个文件中.
每个文件名为"Votes- [member-name] - (2010-2014) - [download-time] .csv"
标头不包含成员名称的列.我想补充一点,作为第一项.
这是我想要做的部分:如何在Python中合并200个csv文件.我只是不确定如何遍历具有不同名称的文件,并将这些名称添加到csv.
谢谢!
我试图在当前目录中的所有*.txt文件下运行脚本.目前,它将仅处理test.txt文件并基于正则表达式打印文本块.扫描当前目录中*.txt文件并在所有找到的*.txt文件下运行脚本下最快的方法是什么?另外我如何在当前脚本中包含包含'word1'和'word3'的行只打印这两行之间的内容?我想打印整块.
#!/usr/bin/env python
import os, re
file = 'test.txt'
with open(file) as fp:
for result in re.findall('word1(.*?)word3', fp.read(), re.S):
print result
Run Code Online (Sandbox Code Playgroud)
我很感激有关如何改进上述代码的任何建议或建议,例如在大量文本文件上运行时的速度.谢谢.
我正在使用的代码接收一个 .pdf 文件,并输出一个 .txt 文件。我的问题是,如何创建一个循环(可能是 for 循环),该循环在以“.pdf”结尾的文件夹中的所有文件上一遍又一遍地运行代码?此外,如何在每次循环运行时更改输出,以便每次都可以编写一个与输入文件同名的新文件(即 1_pet.pdf > 1_pet.txt、2_pet.pdf > 2_pet.pdf)。 txt等)
这是到目前为止的代码:
path="2_pet.pdf"
content = getPDFContent(path)
encoded = content.encode("utf-8")
text_file = open("Output.txt", "w")
text_file.write(encoded)
text_file.close()
Run Code Online (Sandbox Code Playgroud) 我想改变这一行
files = os.listdir('/Users/milenko/mario/Json_gzips')
Run Code Online (Sandbox Code Playgroud)
在我的代码中,将.gz文件从我的存储桶直接读取到列表中。我试过
>>> import boto3
>>> s3 = boto3.resource('s3')
>>> s3
s3.ServiceResource()
>>> my_bucket = s3.Bucket('cw-dushpica-tests')
>>> for object_summary in my_bucket.objects.filter(Prefix='*.gz'):
... print(object_summary)
Run Code Online (Sandbox Code Playgroud)
没有输出,它不打印任何内容。
for object_summary in my_bucket.objects.filter(Prefix='/'):
... print(object_summary)
Run Code Online (Sandbox Code Playgroud)
一样,什么都没有。
我的前缀应该是什么样子?
我正在寻找一个 python 脚本,它将在当前目录中找到一个现有文件的确切文件名,该文件名将运行该 python 脚本,可以增量命名。
例如,文件可能是:
file1.dat
file2.dat
file3.dat
....
所以我们知道文件名以前缀开头,file我们知道它以 sufix 结尾.dat。
但是,我们不知道它是否会file1.dat还是file1000.dat什么的插图中。
所以我需要一个脚本来检查1-1000从file1.dat到的所有文件名的范围file1000.dat,如果它找到目录中确实存在的文件名,它会返回一条成功消息。
我想在同一目录中打开任何 .txt文件.
在红宝石中我能做到
File.open("*.txt").each do |line|
puts line
end
Run Code Online (Sandbox Code Playgroud)
在python我不能这样做它会给出一个错误
file = open("*.txt","r")
print(file.read())
file.close()
Run Code Online (Sandbox Code Playgroud)
它给出了一个错误无效的参数.
那有什么办法吗?