我已经用谷歌搜索了一个小时左右,但没有找到我要找的东西。这是我在代码中所处的位置。
我使用 BS 将信息拉下来并将其保存到 CSV 文件中。CSV 有 x,y 坐标,我可以将其制作成散点图。
与此类似(大约有 1,500 个数据点,显然有 100 个组合)
x,y
0,6
1,2
0,7
4,6
9,9
0,0
4,4
1,2
ETC。
我想做的是使散点图上的点的大小与它们出现的频率相关。
df = pd.read_csv("book8.csv")
df.plot(kind = 'scatter',x='x',y='y')
plt.show()
Run Code Online (Sandbox Code Playgroud)
这些数组只是 0 到 9 之间的数字。我想将大小调整为 0-9 组合出现的频率。
我目前只有这个,显然它并不是很有用。
https://i.stack.imgur.com/daiXF.jpg
我是否需要将 x 和 y 设置到它们自己的数组中来完成此操作,而不是使用数据框(df)?
我有一个地址数据框,包括邮政编码.我试图通过从有效邮政编码的文本文件中导入列表来查看这些邮政编码是否有效.我似乎无法从列表或数据框中获取正确的数据类型.
我的列表在文本文件中看起来像这样
00501, 00544, 00601, 00602, 00603, 00604, 00605, 00606, 00610, 00611, 00612, 00613, 00614, 00616, 00617, 00622, 00623, 00624, 00627, 00631, 00636, 00637, 00638, 00641, 00646, 00647, 00650, 00652, 00653, 00656, 00659, 00660, 00662, 00664, 00667, 00669, 00670, 00674, 00676, 00677, 00678, 00680, 00681, 00682, 00683, 00685, 00687, 00688, 00690, 00692, 00693, 00694, 00698, 00703, 00704, 00705, 00707, 00714, 00715, 00716, 00717, 00718, 00719, 00720, 00721, 00723, 00725, 00726.....
Run Code Online (Sandbox Code Playgroud)
而我正在导入列表......
text_file = open("/C:/valid_zipcodes.txt", "r")
zip_codes = text_file.readlines()
Run Code Online (Sandbox Code Playgroud)
我希望返回一个功能正常的bool.如果我在代码中创建一个非常简单的列表,这是有效的
zip_codes2 …Run Code Online (Sandbox Code Playgroud)