小编Mat*_*ien的帖子

使用numpy来减小矩阵的大小

我必须创建一个用户和电视节目的邻接列表,其中行是用户,电视节目是列.如果用户跟随该电视节目,则矩阵中将有1为零.我已经从twitter上收集了这些信息.总共有140个电视节目和大约530000个独立用户.我使用以下代码生成矩阵,使用python:

  • NoTvShows:电视节目总数(ID)
  • unique_user:所有唯一用户
  • gather_users:这是一个列表列表.子列表对应于电视节目并列出关注者的ID.
for i in range(0,NoTvShows):
    for every_user in unique_users:
        if every_user in collected_users[i]:
            matrix.append(1)
        else:
            matrix.append(0)
    main_matrix.append(matrix)
    matrix = []

the_matrix = zip(*main_matrix)
simplejson.dump(the_matrix,fwrite)
fwrite.close()
Run Code Online (Sandbox Code Playgroud)

当我尝试在服务器上执行我的程序时,它崩溃了,因为它占用了大量的时间和内存.我知道我可以使用numpy来减小矩阵的大小,然后用它来计算用户之间的相似性.但是,我不确定如何在此代码中编码numpy并生成简化矩阵.

我希望有人可以在这方面指导我

谢谢

Richa

python numpy matrix

1
推荐指数
1
解决办法
3404
查看次数

Python:如何返回相同的数组,每行中删除第i个元素?

假设我有一个列表列表:

[[1,2,3,4,5], [11,22,33,44,55], [111,222,333,444,555]] 
Run Code Online (Sandbox Code Playgroud)

我怎样才能简单地返回相同的列表,其中每行的第i个元素被删除,给定任何i?
例如,如果i = 2,我们得到:
[[1,2,4,5], [11,22,44,55], [111,222,444,555]].

我想:
切片,但陷入麻烦之类的东西list[0:i],当我= 0未能
获取使用索引值my_list.index(i),但由于功能要匹配的字符串失败.

提前致谢.

python list

1
推荐指数
1
解决办法
84
查看次数

如何使用numpy在python中导入没有分隔符的文本文件?

如何导入没有分隔符的文件?

我有一个名为text.txt 包含2行文本的文件:

00000000011100000000000000000000
00000000011111110000000000000000

我用的时候

f = open("text.txt")
data = np.loadtxt(f)

我明白了

[1.11000000e + 22 1.11111100e + 22]

使用sep=""并不改变.

我想以许多单个数字整数的形式得到这个结果:

[[00000000011100000000000000000000]
[00000000011111110000000000000000]]

任何帮助表示赞赏.

更新: 谢谢大家的尴尬问题以及许多有效的解决方案.

python import numpy

1
推荐指数
1
解决办法
239
查看次数

使用城市和州绘制ggmap

我有一张美国地图,准备出发:

mygggmap <- get_map(location = "United States", zoom = 4) g <- ggmap(myggmap)

下一步是绘制一些主要城市.

我知道我可以创建一个图层来绘制我的主要城市的经度和纬度,例如:
g <- g + geom_density2d(data = citydata, aes(x = lon, y = lat))

但我想知道是否有办法按实际名称,城市和州进行策划?由于ggmap是通过Google Map API分层的,这应该是可能的,对吗?

google-maps r ggplot2 ggmap

1
推荐指数
1
解决办法
3091
查看次数

如何在Wordpress中获取主页标题

我想在breadcrumb中显示主页标题.我已尝试过该get_the_title()功能,但它需要页面ID作为参数.我相信当我将首页更改为其他页面时它会中断.是否存在更易发生变化的功能?

wordpress

1
推荐指数
2
解决办法
6955
查看次数

按字符串中的单词数对字符串列表进行排序

我有一个字符串列表,如下所示:

mylist = ["superduperlongstring", "a short string", "the middle"]  
Run Code Online (Sandbox Code Playgroud)

我想以这样一种方式对它进行排序,即单词数最多的字符串在前,即,

mylist = ["a short string", "the middle", "superduperlongstring"]  
Run Code Online (Sandbox Code Playgroud)

它有点棘手,因为如果我按长度排序

mylist.sort(key = len)
Run Code Online (Sandbox Code Playgroud)

我回到了我开始的地方。

有没有人遇到过一个优雅的解决方案?谢谢。

python sorting string list

0
推荐指数
1
解决办法
1895
查看次数

MySQL Update列错误

我想在现有的MySQL列中插入一个图像路径,其中idmax是max.但它没有用.当我提到任何具体的id时,它正在工作.但我想插入id为max的地方.请帮我.我很迷惑.我试过这些命令:

UPDATE mytable SET image='$path' WHERE id=(SELECT max(id) FROM table)
UPDATE mytable SET image='$path' WHERE id=(SELECT max(id) FROM mytable)
Run Code Online (Sandbox Code Playgroud)

没有人工作.

mysql

0
推荐指数
1
解决办法
41
查看次数

如何在zip文件夹中提取文件

我下载了一个带有以下子文件夹结构的zip文件(20000101 [1] .zip)

\home\ftp\pub\account\lmp\20010101.csv. 
Run Code Online (Sandbox Code Playgroud)

你们有任何想法如何提取文件20010101.csv.

谢谢.

r unzip

-2
推荐指数
1
解决办法
2055
查看次数

标签 统计

python ×4

list ×2

numpy ×2

r ×2

ggmap ×1

ggplot2 ×1

google-maps ×1

import ×1

matrix ×1

mysql ×1

sorting ×1

string ×1

unzip ×1

wordpress ×1