我刚刚将值从 .csv 文件导入到列表列表中,现在我需要知道有多少不同的用户。文件本身如下所示:
[['123', 'apple'], ['123', 'banana'], ['345', 'apple'], ['567', 'berry'], ['567', 'banana']]
Run Code Online (Sandbox Code Playgroud)
基本上,我需要知道有多少不同的用户(每个子列表中的第一个值是用户 ID)(3在这种情况下,经过一些 Excel 过滤后超过 6,000),以及食物本身的频率是多少:{'apple': 2, 'banana': 2, 'berry': 1}。
这是我尝试用于不同值计数的代码(使用 Python 2.7):
import csv
with open('food.csv', 'rb') as food:
next(food)
for line in food:
csv_food = csv.reader(food)
result_list = list(csv_follows)
result_distinct = list(x for l in result_list for x in l)
print len(result_distinct)
Run Code Online (Sandbox Code Playgroud) 我需要从我得到的元组列表中构建一个条形图,键名作为 x 轴上显示的每个条的标签,值作为条的高度。这是我的输入的样子:
top20 = [('Blues', 2008), ('Guadeloupe', 1894), ('Yorkshire', 1216), ('Monterrey', 1112), ('Government', 1081), ('Algeria', 972), ('Rotterdam', 920), ('Sardinia', 913), ('Mac OS', 864), ('Coffee', 858), ('Netherlands', 849), ('Oklahoma', 829), ('Tokyo', 817), ('Boating', 801), ('Finland', 765), ('Michigan', 737), ('Tamaulipas', 733), ('Croatia', 722), ('Kagoshima', 701), ('Isuzu', 678)]
Run Code Online (Sandbox Code Playgroud)
这是我目前使用的代码:
plt.bar(range(len(top20)), top20.values(), align='center')
plt.xticks(range(len(top20)), list(top20.keys()))
plt.show()
Run Code Online (Sandbox Code Playgroud)
我知道,逻辑遵循字典作为输入,但我想不出一种方法来完成这项工作。请帮忙,并提前致谢。
我需要以下列格式将当前日期添加到我从 SAS 导出的输出中:filename_YYYYMMDDhhmmss.csv
我正在通过以下方式创建一个宏变量:
%let date_human = %sysfunc(today(), YYYYMMDDn8.);
Run Code Online (Sandbox Code Playgroud)
有人知道如何为我得到的日期创建自定义格式吗?日期时间20。给出一个不正确的。
谢谢你。
我的一些输入值是小写的,有些是高位的.例如,性别为"女性"和"女性".我需要处理一个数据集中的系列,该数据集具有一些不一致的类标签.
如何利用关闭的价值 - 从"女性"到"女性"?