我有一个关键词数据库,供不同群体的人使用.就像是:
group1person1: x, y, z
group1person2: x, z, d
...
group2person1: z, d, l
...
Run Code Online (Sandbox Code Playgroud)
等等
我想看看哪个关键字是特定组的最大特征.我正在尝试做OkCupid在博客中所做的事:http://blog.okcupid.com/index.php/the-real-stuff-white-people-like/
任何人都可以推荐有关此任务的合适算法/术语/建议吗?
(我将在Python中这样做)
提前致谢!
我在访问Pandas DataFrame df中的数据时遇到错误:
ipdb> df.loc[1988, 'ATTEND']
*** ValueError: Length mismatch: Expected axis has 0 elements, new values have 1481 elements
Run Code Online (Sandbox Code Playgroud)
1988年和'ATTEND'都在df中:
ipdb> 1988 in df.index
True
ipdb> 'ATTEND' in df.columns
True
Run Code Online (Sandbox Code Playgroud)
我不知道这个错误是什么.有什么想法吗?
提前致谢.
例:
ipdb> df.iloc[21875:21880, 277:280]
FUND ATTEND MAATTEND
1988 3 1 4
1988 2 3 0
1988 2 2 2
1988 2 2 7
1988 2 3 2
ipdb> df.loc[1988, 'ATTEND']
*** ValueError: Length mismatch: Expected axis has 0 elements, new values have 1481 elements …
Run Code Online (Sandbox Code Playgroud) 我有一个Pandas DataFrame,我正在逐行创建(我知道,我知道,它不是Pandorable/Pythonic ......).我使用创建元素的.loc像这样
output.loc[row_id, col_id]
Run Code Online (Sandbox Code Playgroud)
我想将此值设置为空列表[].
output.loc[row_id, col_id] = []
Run Code Online (Sandbox Code Playgroud)
不幸的是,我得到一个错误,说我的钥匙和值不匹配的大小(熊猫认为我试图设定值与不来的迭代).
有没有办法做到这一点?
谢谢!