我有一个数据框,其中一列是列表,如下所示:
>head(movies$genre_list)
[[1]]
[1] "drama" "action" "romance"
[[2]]
[1] "crime" "drama"
[[3]]
[1] "crime" "drama" "mystery"
[[4]]
[1] "thriller" "indie"
[[5]]
[1] "thriller"
[[6]]
[1] "drama" "family"
Run Code Online (Sandbox Code Playgroud)
我想将这一列转换为多列,一列用于列表中的每个唯一元素(在本例中为类型),并将它们作为二进制列.我正在寻找一个优雅的解决方案,它不涉及首先找出有多少类型,然后为每个类型创建一个列,然后检查每个列表元素然后填充流派列.我尝试取消列表,但它不能以我想要的方式使用列表向量.
谢谢!
我有一个大的(~25000 x 1000)矩阵来分解.我基于numpy编写了自己的代码,但它效率低下并且不断引发内存错误.
我一直在尝试安装和使用nimfa(http://nimfa.biolab.si/)和安装过程(尝试easy_install,pip,下载并运行git)没有显示任何错误.但是当我尝试使用它时,import nimfa我得到以下错误.我检查了nimfa先决条件,除了numpy和scipy之外没有提到任何东西.
我在Windows 8上,使用安装了numpy和scipy的Python 2.7.5.我也尝试过安装(并随后卸载)minGW并执行此操作.
有任何想法吗?
Traceback (most recent call last):
File "<pyshell#0>", line 1, in <module>
import nimfa
File "C:\Python27\lib\site-packages\nimfa-1.0-py2.7.egg\nimfa\__init__.py", line 18, in <module>
from mf_run import *
File "C:\Python27\lib\site-packages\nimfa-1.0-py2.7.egg\nimfa\mf_run.py", line 26, in <module>
from utils import *
File "C:\Python27\lib\site-packages\nimfa-1.0-py2.7.egg\nimfa\utils\__init__.py", line 8, in <module>
import linalg
File "C:\Python27\lib\site-packages\nimfa-1.0-py2.7.egg\nimfa\utils\linalg.py", line 15, in <module>
import scipy.sparse.linalg as sla
File "C:\Python27\lib\site-packages\scipy\sparse\linalg\__init__.py", line 100, in <module>
from .isolve import *
File "C:\Python27\lib\site-packages\scipy\sparse\linalg\isolve\__init__.py", line 6, in <module> …Run Code Online (Sandbox Code Playgroud)