我需要在列表中找到元素的频率
a = [1,1,1,1,2,2,2,2,3,3,4,5,5]
Run Code Online (Sandbox Code Playgroud)
输出 - >
b = [4,4,2,1,2]
Run Code Online (Sandbox Code Playgroud)
另外我想从a中删除重复项
a = [1,2,3,4,5]
Run Code Online (Sandbox Code Playgroud) 如何使用csv文件中的pandas和matplotlib绘制单词频率直方图(作者列)?我的csv就像:id,作者,标题,语言有时我在作者列中有多个作者用空格分隔
file = 'c:/books.csv'
sheet = open(file)
df = read_csv(sheet)
print df['author']
Run Code Online (Sandbox Code Playgroud) Keras 有没有办法在使用 ImageDataGenerator 时获取每个类别中的图像数量?假设我有一个包含 3 个子文件夹(类)的 train 文件夹,每个子文件夹都包含一定数量的图像。
imagedatagen = ImageDataGenerator(...)
imageflow = imagedatagen.flow_from_directory(
source_dir,
class_mode='categorical', ...)
Run Code Online (Sandbox Code Playgroud)
我可以使用以下命令获取类映射或所有样本的数量:
class_dict = imageflow.class_indices # returns ie. {'aligator': 0, 'cat': 1, 'dog': 2}
sample_count = imageflow.samples # returns sum of all samples, not divided into categories
Run Code Online (Sandbox Code Playgroud)
但是我如何获得信息,类别 0 包含 1000 张图片,类别 1 包含 1500 张图片,类别 2 包含其余所有图片?我知道我可以在os模块的帮助下迭代所有文件,但想知道是否还有其他方法,但我找不到它。
如何绘制以下Counter对象的直方图?
w = collections.Counter()
l = ['a', 'b', 'b', 'b', 'c']
for o in l:
w[o]+=1
Run Code Online (Sandbox Code Playgroud) python ×4
matplotlib ×2
collections ×1
counter ×1
counting ×1
frequency ×1
keras ×1
pandas ×1
tensorflow ×1