小编pra*_*een的帖子

ImportError:没有名为'google'的模块

这不是重复的.我的情况有点不同,我在这里找不到类似帖子的解决方案.我安装了Python 3.5.我运行了pip install google命令并验证了模块.谷歌在场.我安装了Anaconda 3.5并尝试运行z示例代码.但是我收到了导入错误.请找到附加的屏幕截图.我错过了什么?我是否必须以某种方式将我的Spyder链接到Python安装目录?为什么Spyder无法使用谷歌模块?

我的Python安装目录:C:\ Users\XXX\AppData\Local\Programs\Python\Python35 在此输入图像描述

在此输入图像描述

python spyder

18
推荐指数
8
解决办法
7万
查看次数

Pandas - AttributeError:“DataFrame”对象没有属性“map”

我试图通过基于现有列创建字典并调用该列上的“映射”函数来在数据框中创建一个新列。它似乎已经工作了相当长一段时间了。然而,笔记本开始抛出

AttributeError:“DataFrame”对象没有属性“map”

我没有更改内核或 python 版本。这是我正在使用的代码。

dict= {1:A,
       2:B,
       3:C,
       4:D,
       5:E}

# Creating an interval-type 
data['new'] = data['old'].map(dict)
Run Code Online (Sandbox Code Playgroud)

如何解决这个问题?

python-3.x pandas

6
推荐指数
2
解决办法
3万
查看次数

LightGBM on Numerical+Categorical+Text Features >> TypeError: 参数类型未知:boosting_type,得到:dict

我正在尝试在由数值、分类和文本数据组成的数据集上训练 lightGBM 模型。但是,在训练阶段,我收到以下错误:

params = {
'num_class':5,
'max_depth':8,
'num_leaves':200,
'learning_rate': 0.05,
'n_estimators':500
}

clf = LGBMClassifier(params)
data_processor = ColumnTransformer([
    ('numerical_processing', numerical_processor, numerical_features),
    ('categorical_processing', categorical_processor, categorical_features),
    ('text_processing_0', text_processor_1, text_features[0]),
    ('text_processing_1', text_processor_1, text_features[1])
                                    ]) 
pipeline = Pipeline([
    ('data_processing', data_processor),
    ('lgbm', clf)
                    ])
pipeline.fit(X_train, y_train)
Run Code Online (Sandbox Code Playgroud)

错误是:

TypeError: Unknown type of parameter:boosting_type, got:dict
Run Code Online (Sandbox Code Playgroud)

这是我的管道: 在此输入图像描述

我基本上有两个文本特征,都是我主要执行词干提取的某种形式的名称。

任何指示将不胜感激。

python nlp machine-learning scikit-learn lightgbm

5
推荐指数
1
解决办法
4712
查看次数

ValueError:检查输入时出错:预期 conv2d_1_input 有 4 个维度,但得到了形状为 (8020, 1) 的数组

我正在尝试构建一个图像分类器,但我遇到了本文标题中提到的错误。下面是我正在处理的代码。我如何将形状为 (8020,) 的 numpy 数组转换为函数 fit() 所需的形状?我试图打印输入形状:train_img_array.shape[1:] 但它给出了一个空形状:()

import numpy as np
img_train.shape
img_valid.shape
img_train.head(5)
img_valid.head(5)

(8020, 4)
(2006, 4)
         ID  index  class                                               data
8030  11596  11596      0  [[[255, 255, 255, 0], [255, 255, 255, 0], [255...
2152  11149  11149      0  [[[255, 255, 255, 0], [255, 255, 255, 0], [255...
550   10015  10015      0  [[[255, 255, 255, 0], [255, 255, 255, 0], [255...
1740   9035   9035      0  [[[255, 255, 255, 0], [255, 255, 255, 0], [255...
9549   8218   8218      1 …
Run Code Online (Sandbox Code Playgroud)

python numpy keras convolutional-neural-network

3
推荐指数
1
解决办法
2552
查看次数

Pandas:如果字符串列表中不存在,则用'other'替换字符串

我有以下数据框,df,列'Class'

    Class
0   Individual
1   Group
2   A
3   B
4   C
5   D
6   Group
Run Code Online (Sandbox Code Playgroud)

我想用"其他"替换除Group和Individual之外的所有内容,所以最终的数据框是

    Class
0   Individual
1   Group
2   Other
3   Other
4   Other
5   Other
6   Group
Run Code Online (Sandbox Code Playgroud)

数据帧很大,超过600 K行.优化查找"组"和"个人"以外的值并用"其他"替换它们的最佳方法是什么?

我见过替换的例子,例如:

df['Class'] = df['Class'].replace({'A':'Other', 'B':'Other'})
Run Code Online (Sandbox Code Playgroud)

但由于我拥有的绝对数量太多,我无法单独做到这一点.我想只使用'Group'和'Individual'的排除子集.

python python-3.x pandas

3
推荐指数
1
解决办法
542
查看次数

如果值计数低于阈值,则将列值映射到“杂项” - 分类列 - Pandas Dataframe

我有一个形状为 ~ [200K, 40] 的熊猫数据框。数据框有一个分类列(众多列之一),有超过 1000 个唯一值。我可以使用以下方法可视化每个此类唯一列的值计数:

df['column_name'].value_counts()
Run Code Online (Sandbox Code Playgroud)

我现在如何将价值观与:

  • value_count 小于阈值,比如 100,并将它们映射到,比如“杂项”?
  • 或基于累积行数 % ?

python pandas

3
推荐指数
1
解决办法
2040
查看次数

并行化java中的循环

我遇到过openMP,它可以用来并行化c,C++中的for循环.当然,OpenMP可以做的远不止这些.但我很好奇我们是否可以在java中并行化for循环以优化程序的性能.假设我在for循环中有n次迭代,有没有办法并行运行这些迭代?

java multithreading openmp

2
推荐指数
1
解决办法
3884
查看次数

在循环内的Highcharts中创建多个系列

我需要根据数组变量为highcharts创建多个系列.如果数组有5个元素则创建5个系列,如果数组有4个元素则创建4个系列,依此类推.我该怎么做呢?我正在使用JQuery创建图表并使用Ajax,我从我的Java类发送和接收JSON数据.

java ajax jquery servlets highcharts

2
推荐指数
1
解决办法
5853
查看次数

Amazon Redshift - 默认加入是什么?

Amazon Redshift中的默认"加入"是什么?当我没有指定任何方向时,Redshift是使用内部还是左或右或外部连接?

join amazon-redshift

2
推荐指数
1
解决办法
2866
查看次数

Pandas:根据与值对应的行数将列中的值替换为“其他”

我有一个形状为 (600,000 * 33) 的数据框,其中一列(我们称之为“名称”)有超过 2000 个唯一值。我使用以下代码对该列进行了排序:

got.groupby('name').size().sort_values(ascending=False)
Run Code Online (Sandbox Code Playgroud)

下面是每个名称以及数据框中的行数的示例

Name       Count
John       90000
Daenerys   50000
Cersei     45000
...        ...
Hound      2000
Joffrey    1500
LittleF    1200
...        ...
Run Code Online (Sandbox Code Playgroud)

我希望能够查看数据框,并将所有少于 2000 行的名称(计数 <2000)替换为“其他”,在本例中为“Joffrey”和“LittleF”。

python python-3.x pandas

2
推荐指数
1
解决办法
3206
查看次数