小编DrM*_*sha的帖子

哪些关键词最能区分两组人？

我有一个关键词数据库,供不同群体的人使用.就像是:

group1person1: x, y, z
group1person2: x, z, d
...
group2person1: z, d, l
...

Run Code Online (Sandbox Code Playgroud)

等等

我想看看哪个关键字是特定组的最大特征.我正在尝试做OkCupid在博客中所做的事:http://blog.okcupid.com/index.php/the-real-stuff-white-people-like/

任何人都可以推荐有关此任务的合适算法/术语/建议吗？

(我将在Python中这样做)

提前致谢!

python algorithm statistics machine-learning

DrM*_*sha

2014 02-22

7
推荐指数

1
解决办法

416
查看次数

Pandas错误"***ValueError:长度不匹配:预期的轴有0个元素,新值有......"

我在访问Pandas DataFrame df中的数据时遇到错误:

ipdb> df.loc[1988, 'ATTEND']
*** ValueError: Length mismatch: Expected axis has 0 elements, new values have 1481 elements

Run Code Online (Sandbox Code Playgroud)

1988年和'ATTEND'都在df中:

ipdb> 1988 in df.index
True
ipdb> 'ATTEND' in df.columns
True

Run Code Online (Sandbox Code Playgroud)

我不知道这个错误是什么.有什么想法吗？

提前致谢.

例:

ipdb> df.iloc[21875:21880, 277:280]
      FUND  ATTEND  MAATTEND
1988     3       1         4
1988     2       3         0
1988     2       2         2
1988     2       2         7
1988     2       3         2

ipdb> df.loc[1988, 'ATTEND']
*** ValueError: Length mismatch: Expected axis has 0 elements, new values have 1481 elements …

Run Code Online (Sandbox Code Playgroud)

python pandas

DrM*_*sha

2014 08-01

6
推荐指数

1
解决办法

8986
查看次数