小编DrM*_*sha的帖子

哪些关键词最能区分两组人?

我有一个关键词数据库,供不同群体的人使用.就像是:

group1person1: x, y, z
group1person2: x, z, d
...
group2person1: z, d, l
...
Run Code Online (Sandbox Code Playgroud)

等等

我想看看哪个关键字是特定组的最大特征.我正在尝试做OkCupid在博客中所做的事:http://blog.okcupid.com/index.php/the-real-stuff-white-people-like/

任何人都可以推荐有关此任务的合适算法/术语/建议吗?

(我将在Python中这样做)

提前致谢!

python algorithm statistics machine-learning

7
推荐指数
1
解决办法
416
查看次数

Pandas错误"***ValueError:长度不匹配:预期的轴有0个元素,新值有......"

我在访问Pandas DataFrame df中的数据时遇到错误:

ipdb> df.loc[1988, 'ATTEND']
*** ValueError: Length mismatch: Expected axis has 0 elements, new values have 1481 elements
Run Code Online (Sandbox Code Playgroud)

1988年和'ATTEND'都在df中:

ipdb> 1988 in df.index
True
ipdb> 'ATTEND' in df.columns
True
Run Code Online (Sandbox Code Playgroud)

我不知道这个错误是什么.有什么想法吗?

提前致谢.

例:

ipdb> df.iloc[21875:21880, 277:280]
      FUND  ATTEND  MAATTEND
1988     3       1         4
1988     2       3         0
1988     2       2         2
1988     2       2         7
1988     2       3         2

ipdb> df.loc[1988, 'ATTEND']
*** ValueError: Length mismatch: Expected axis has 0 elements, new values have 1481 elements …
Run Code Online (Sandbox Code Playgroud)

python pandas

6
推荐指数
1
解决办法
8986
查看次数

创建Pandas DataFrame的元素并将其设置为列表

我有一个Pandas DataFrame,我正在逐行创建(我知道,我知道,它不是Pandorable/Pythonic ......).我使用创建元素的.loc像这样

output.loc[row_id, col_id]
Run Code Online (Sandbox Code Playgroud)

我想将此值设置为空列表[].

output.loc[row_id, col_id] = []
Run Code Online (Sandbox Code Playgroud)

不幸的是,我得到一个错误,说我的钥匙和值不匹配的大小(熊猫认为我试图设定值的迭代).

有没有办法做到这一点?

谢谢!

python dataframe pandas

5
推荐指数
2
解决办法
5395
查看次数