小编New*_*ore的帖子

将"list"类型的列转换为数据框中的多个列

我有一个数据框,其中一列是列表,如下所示:

>head(movies$genre_list)
[[1]]
[1] "drama"   "action"  "romance"
[[2]]
[1] "crime" "drama"
[[3]]
[1] "crime"   "drama"   "mystery"
[[4]]
[1] "thriller" "indie"  
[[5]]
[1] "thriller"
[[6]]
[1] "drama"  "family"
Run Code Online (Sandbox Code Playgroud)

我想将这一列转换为多列,一列用于列表中的每个唯一元素(在本例中为类型),并将它们作为二进制列.我正在寻找一个优雅的解决方案,它不涉及首先找出有多少类型,然后为每个类型创建一个列,然后检查每个列表元素然后填充流派列.我尝试取消列表,但它不能以我想要的方式使用列表向量.

谢谢!

r list dataframe

8
推荐指数
1
解决办法
5327
查看次数

安装nimfa(Python Matrix Factorization库)的问题

我有一个大的(~25000 x 1000)矩阵来分解.我基于numpy编写了自己的代码,但它效率低下并且不断引发内存错误.

我一直在尝试安装和使用nimfa(http://nimfa.biolab.si/)和安装过程(尝试easy_install,pip,下载并运行git)没有显示任何错误.但是当我尝试使用它时,import nimfa我得到以下错误.我检查了nimfa先决条件,除了numpy和scipy之外没有提到任何东西.

我在Windows 8上,使用安装了numpy和scipy的Python 2.7.5.我也尝试过安装(并随后卸载)minGW并执行此操作.

有任何想法吗?

Traceback (most recent call last):
  File "<pyshell#0>", line 1, in <module>
    import nimfa
  File "C:\Python27\lib\site-packages\nimfa-1.0-py2.7.egg\nimfa\__init__.py", line 18, in    <module>
    from mf_run import *
  File "C:\Python27\lib\site-packages\nimfa-1.0-py2.7.egg\nimfa\mf_run.py", line 26, in <module>
    from utils import *
  File "C:\Python27\lib\site-packages\nimfa-1.0-py2.7.egg\nimfa\utils\__init__.py", line 8, in <module>
    import linalg
  File "C:\Python27\lib\site-packages\nimfa-1.0-py2.7.egg\nimfa\utils\linalg.py", line 15, in <module>
    import scipy.sparse.linalg as sla
  File "C:\Python27\lib\site-packages\scipy\sparse\linalg\__init__.py", line 100, in <module>
    from .isolve import *
  File "C:\Python27\lib\site-packages\scipy\sparse\linalg\isolve\__init__.py", line 6, in <module> …
Run Code Online (Sandbox Code Playgroud)

python numpy matrix scipy matrix-factorization

7
推荐指数
1
解决办法
826
查看次数

标签 统计

dataframe ×1

list ×1

matrix ×1

matrix-factorization ×1

numpy ×1

python ×1

r ×1

scipy ×1