我必须创建一个用户和电视节目的邻接列表,其中行是用户,电视节目是列.如果用户跟随该电视节目,则矩阵中将有1为零.我已经从twitter上收集了这些信息.总共有140个电视节目和大约530000个独立用户.我使用以下代码生成矩阵,使用python:
for i in range(0,NoTvShows):
for every_user in unique_users:
if every_user in collected_users[i]:
matrix.append(1)
else:
matrix.append(0)
main_matrix.append(matrix)
matrix = []
the_matrix = zip(*main_matrix)
simplejson.dump(the_matrix,fwrite)
fwrite.close()
Run Code Online (Sandbox Code Playgroud)
当我尝试在服务器上执行我的程序时,它崩溃了,因为它占用了大量的时间和内存.我知道我可以使用numpy来减小矩阵的大小,然后用它来计算用户之间的相似性.但是,我不确定如何在此代码中编码numpy并生成简化矩阵.
我希望有人可以在这方面指导我
谢谢
Richa
假设我有一个列表列表:
[[1,2,3,4,5], [11,22,33,44,55], [111,222,333,444,555]]
Run Code Online (Sandbox Code Playgroud)
我怎样才能简单地返回相同的列表,其中每行的第i个元素被删除,给定任何i?
例如,如果i = 2,我们得到:
[[1,2,4,5], [11,22,44,55], [111,222,444,555]]
.
我想:
切片,但陷入麻烦之类的东西list[0:i]
,当我= 0未能
获取使用索引值my_list.index(i)
,但由于功能要匹配的字符串失败.
提前致谢.
如何导入没有分隔符的文件?
我有一个名为text.txt
包含2行文本的文件:
00000000011100000000000000000000
00000000011111110000000000000000
我用的时候
f = open("text.txt")
data = np.loadtxt(f)
我明白了
[1.11000000e + 22 1.11111100e + 22]
使用sep=""
并不改变.
我想以许多单个数字整数的形式得到这个结果:
[[00000000011100000000000000000000]
[00000000011111110000000000000000]]
任何帮助表示赞赏.
更新: 谢谢大家的尴尬问题以及许多有效的解决方案.
我有一张美国地图,准备出发:
mygggmap <- get_map(location = "United States", zoom = 4)
g <- ggmap(myggmap)
下一步是绘制一些主要城市.
我知道我可以创建一个图层来绘制我的主要城市的经度和纬度,例如:
g <- g + geom_density2d(data = citydata, aes(x = lon, y = lat))
但我想知道是否有办法按实际名称,城市和州进行策划?由于ggmap是通过Google Map API分层的,这应该是可能的,对吗?
我想在breadcrumb中显示主页标题.我已尝试过该get_the_title()
功能,但它需要页面ID作为参数.我相信当我将首页更改为其他页面时它会中断.是否存在更易发生变化的功能?
我有一个字符串列表,如下所示:
mylist = ["superduperlongstring", "a short string", "the middle"]
Run Code Online (Sandbox Code Playgroud)
我想以这样一种方式对它进行排序,即单词数最多的字符串在前,即,
mylist = ["a short string", "the middle", "superduperlongstring"]
Run Code Online (Sandbox Code Playgroud)
它有点棘手,因为如果我按长度排序
mylist.sort(key = len)
Run Code Online (Sandbox Code Playgroud)
我回到了我开始的地方。
有没有人遇到过一个优雅的解决方案?谢谢。
我想在现有的MySQL列中插入一个图像路径,其中id
max是max.但它没有用.当我提到任何具体的id时,它正在工作.但我想插入id为max的地方.请帮我.我很迷惑.我试过这些命令:
UPDATE mytable SET image='$path' WHERE id=(SELECT max(id) FROM table)
UPDATE mytable SET image='$path' WHERE id=(SELECT max(id) FROM mytable)
Run Code Online (Sandbox Code Playgroud)
没有人工作.
我下载了一个带有以下子文件夹结构的zip文件(20000101 [1] .zip)
\home\ftp\pub\account\lmp\20010101.csv.
Run Code Online (Sandbox Code Playgroud)
你们有任何想法如何提取文件20010101.csv
.
谢谢.