小编use*_*702的帖子

Cumsum是现有Pandas数据中的新列

我有一个pandas数据框定义为:

A   B   SUM_C      
1   1   10     
1   2   20

Run Code Online (Sandbox Code Playgroud)

我想做一个SUM_C的累积和,并将其作为新列添加到同一个数据帧.换句话说,我的最终目标是拥有如下所示的数据框:

A   B   SUM_C   CUMSUM_C       
1   1   10      10     
1   2   20      30

Run Code Online (Sandbox Code Playgroud)

在group()中使用pandas中的cumsum显示了生成新数据帧的可能性,其中列名SUM_C被累积和替换.但是,我的问题是将累积和作为新列添加到现有数据框中.

谢谢

python dataframe pandas cumsum

use*_*702

2018 08-31

7
推荐指数

1
解决办法

8384
查看次数

熊猫数据框任意两列之间的百分比差异

我想为任意两个 Pandas 列之间的百分比差异计算定义一个函数。假设我的数据框由以下定义：

R1  R2    R3    R4   R5    R6
 A   B     1     2    3     4

Run Code Online (Sandbox Code Playgroud)

我希望我的计算定义为

df['R7'] = df[['R3','R4']].apply( method call to calculate perc diff)

Run Code Online (Sandbox Code Playgroud)

和

df['R8'] = df[['R5','R6']].apply(same method call to calculate perc diff)

Run Code Online (Sandbox Code Playgroud)

怎么做？

我在下面试过

df['perc_cnco_error'] = df[['CumNetChargeOffs_x','CumNetChargeOffs_y']].apply(lambda x,y: percCalc(x,y))

def percCalc(x,y):
    if x<1e-9:
        return 0
    else:
        return (y - x)*100/x

Run Code Online (Sandbox Code Playgroud)

它给了我错误信息

类型错误: ('() 正好需要 2 个参数 (1 给定)', u'occurred at index CumNetChargeOffs_x')

python dataframe pandas

use*_*702

2017 02-08

6
推荐指数

2
解决办法

1万
查看次数

Python scikit-learn 转 JSON

我有一个用 Python scikit-learn 构建的模型。我知道模型可以保存为 Pickle 或 Joblib 格式。是否有任何现有方法可以将作业保存为 JSON 格式？请参阅下面的模型构建代码以供参考：

import pandas
from sklearn import model_selection
from sklearn.linear_model import LogisticRegression
import pickle
url = "https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/pima-indians-diabetes.data"
names =['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
dataframe = pandas.read_csv(url, names=names)
array = dataframe.values
X = array[:,0:8]
Y = array[:,8]
test_size = 0.33
seed = 7
X_train, X_test, Y_train, Y_test = model_selection.train_test_split(X, Y, test_size=test_size, random_state=seed)
# Fit the model on 33%
model = LogisticRegression()
model.fit(X_train, Y_train)
filename = 'finalized_model.sav'
pickle.dump(model, open(filename, 'wb'))

Run Code Online (Sandbox Code Playgroud)

python json scikit-learn logistic-regression

use*_*702

2018 01-19

6
推荐指数

1
解决办法

8409
查看次数

写出Spark DataFrame作为嵌套JSON文档

我有一个火花数据框为：

A      B       val_of_B    val1   val2  val3   val4
"c1"  "MCC"     "cd1"      1      2     1.1    1.05
"c1"  "MCC"     "cd2"      2      3     1.1    1.05
"c1"  "MCC"     "cd3"      3      4     1.1    1.05

Run Code Online (Sandbox Code Playgroud)

val1和val2是通过A，B和val_of_B的分组获得的，其中与val3一样，val4仅是A级信息（例如，与A截然不同，val3仅是“ c1”，1.1）

我想将其写为嵌套JSON，它应如下所示：

对于每个A，JSON格式应类似于

{"val3": 1.1, "val4": 1.05, "MCC":[["cd1",1,2], ["cd2",2,3], ["cd3",3,4]]}

Run Code Online (Sandbox Code Playgroud)

是否可以使用spark api下的现有工具来完成此任务？如果没有，您可以提供准则吗？

json scala spark-dataframe

use*_*702

2018 03-24

2
推荐指数

1
解决办法

2237
查看次数

片段中的吐司不显示

当用户单击活动的FRAGMENT中的按钮时,我希望有一个弹出式上下文帮助.我尝试过使用它Toast来执行此操作但是徒劳无功.弹出对话框未显示(请注意Fragment中使用Toast中的建议没有帮助).

片段类中的代码如下:

            final Button help = (Button) view.findViewById(R.id.help_button);
        del.setOnClickListener(new View.OnClickListener(){
        public void onClick(View v) {
            Context context = (TabsActivity) getActivity().getApplicationContext();
            CharSequence text = "Hello toast!";
            int duration = Toast.LENGTH_LONG;
            Toast toast = Toast.makeText(view.getContext(), text, duration);
            toast.setGravity(Gravity.CENTER_VERTICAL, 0, 0);
            toast.show();
            }
        });

Run Code Online (Sandbox Code Playgroud)

我尝试了几种变体CONTEXT,其中两种显示在代码中.我也试过getActivity(),getView().getContext(),getContext()所有这一切就白费了.您能帮助理解如何在片段中设置CONTEXT吗？

android toast android-fragments

use*_*702

2017 05-23

0
推荐指数

1
解决办法

9974
查看次数