小编J.D*_*J.D的帖子

Conda安装和更新不起作用也解决了环境获取错误

我正在使用anaconda,如下所示:

(base) C:\Users\xxx>conda info

     active environment : base
    active env location : C:\Users\xxx\Documents\ANACONDA
            shell level : 1
       user config file : C:\Users\xxx\.condarc
 populated config files : C:\Users\xxx\.condarc
          conda version : 4.7.11
    conda-build version : 3.18.9
         python version : 3.6.9.final.0
       virtual packages :
       base environment : C:\Users\xxx\Documents\ANACONDA  (writable)
           channel URLs : https://repo.anaconda.com/pkgs/main/win-64
                          https://repo.anaconda.com/pkgs/main/noarch
                          https://repo.anaconda.com/pkgs/free/win-64
                          https://repo.anaconda.com/pkgs/free/noarch
                          https://repo.anaconda.com/pkgs/r/win-64
                          https://repo.anaconda.com/pkgs/r/noarch
                          https://repo.anaconda.com/pkgs/msys2/win-64
                          https://repo.anaconda.com/pkgs/msys2/noarch
          package cache : C:\Users\xxx\Documents\ANACONDA\pkgs
                          C:\Users\xxx\.conda\pkgs
                          C:\Users\xxx\AppData\Local\conda\conda\pkgs
       envs directories : C:\Users\xxx\Documents\ANACONDA\envs
                          C:\Users\xxx\.conda\envs
                          C:\Users\xxx\AppData\Local\conda\conda\envs
               platform : win-64
             user-agent : conda/4.7.11 requests/2.22.0 CPython/3.6.9 Windows/10 Windows/10.0.16299 …
Run Code Online (Sandbox Code Playgroud)

python anaconda conda

19
推荐指数
4
解决办法
1万
查看次数

Python Jupyter笔记本SHAP force_plot,如何更改深色主题中的背景颜色或文本颜色?

在此输入图像描述

有什么方法可以更改深色主题中的形状图背景颜色或文本颜色吗?我需要白色背景或白色文本。

该图是 IPython.core.display.HTML 的对象。

它是由

shap.force_plot(explainer.expected_value[1], shap_values[1][0,:], X_test.iloc[0,:],link="logit")
Run Code Online (Sandbox Code Playgroud)

谢谢您的帮助!

html python node.js jupyter-notebook shap

7
推荐指数
1
解决办法
8692
查看次数

绘制等价的相关矩阵矩阵(分类数据)?和混合类型?

实际上有两个问题,一个问题比另一个问题更高级。

问题1:我正在寻找一种类似于corrplot()但可以处理因素的方法。

我最初尝试使用p值Cramer的V作为相关系数,但是要chisq.test()计算的列太多。因此,有谁能告诉我是否有一种快速的方法来创建“ Corrplot”,即每个单元格都包含Cramer V的值,而颜色是通过p值呈现的。或任何其他类似的情节。

关于Cramer的V,假设tbl是一个二维因子数据帧。

chi2 <- chisq.test(tbl, correct=F)
Cramer_V <- sqrt(chi2$/nrow(tbl)) 
Run Code Online (Sandbox Code Playgroud)

我准备了一个具有以下因素的测试数据框:

df <- data.frame(
group = c('A', 'A', 'A', 'A', 'A', 'B', 'C'),
student = c('01', '01', '01', '02', '02', '01', '02'),
exam_pass = c('Y', 'N', 'Y', 'N', 'Y', 'Y', 'N'),
subject = c('Math', 'Science', 'Japanese', 'Math', 'Science', 'Japanese', 'Math')
) 
Run Code Online (Sandbox Code Playgroud)

Q2:然后我想在混合类型的数据帧上计算相关/关联矩阵,例如:

df <- data.frame(
group = c('A', 'A', 'A', 'A', …
Run Code Online (Sandbox Code Playgroud)

statistics plot r chi-squared correlation

5
推荐指数
3
解决办法
1682
查看次数

如何在不知道列号的情况下将多个字符列合并为一列并删除NA

我想有一个包含不带NA的其他列字符的列。我曾尝试pastestr_c并且unite,也没有得到预期的结果。也许我使用不正确。

实际情况是,我无法提前知道列号,因为每个数据集可以根据年份而变化。

也就是说,有些数据集包含10年,但有些包含20年。

这是输入数据:

input <- tibble(
  id = c('aa', 'ss', 'dd', 'qq'),
  '2017' = c('tv', NA, NA, 'web'),
  '2018' = c(NA, 'web', NA, NA),
  '2019' = c(NA, NA, 'book', 'tv')
)

# A tibble: 4 x 4
  id    `2017` `2018` `2019`
  <chr> <chr>  <chr>  <chr> 
1 aa    tv     NA     NA    
2 ss    NA     web    NA    
3 dd    NA     NA     book  
4 qq    web    NA     tv    
Run Code Online (Sandbox Code Playgroud)

ALL列的期望输出是:

> output
# A tibble: 4 x …
Run Code Online (Sandbox Code Playgroud)

r dplyr

5
推荐指数
1
解决办法
236
查看次数

R-如何在使其他列保持静止的同时对单个列进行热编码?

我有一个像这样的数据框:

group   student exam_passed subject 
A       01      Y           Math
A       01      N           Science
A       01      Y           Japanese
A       02      N           Math
A       02      Y           Science
B       01      Y           Japanese
C       02      N           Math
Run Code Online (Sandbox Code Playgroud)

我想要实现的是以下结果:

group   student exam_passed subject_Math  subject_Science  subject_Japanese   
A       01      Y           1             0                0
A       01      N           0             1                0
A       01      Y           0             0                1
A       02      N           1             0                0           
A       02      Y           0             1                0
B       01      Y           0             0                1
C       02      N           1 …
Run Code Online (Sandbox Code Playgroud)

r one-hot-encoding

3
推荐指数
1
解决办法
872
查看次数

如何从第一行到包含特定值的行对每个组中的行进行切片?

我有一个这样的数据框:

df_1 = pd.DataFrame({
    'ID' : ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C'],
    'VAL' : ['shoes', 'flowers', 'chairs', 'apples', 'dice', 'shoes', 'apples',
             'curtain', 'sand', 'socks', 'necklacs', 'tables', 'dishes', 'apples'],
    'SEQ' : [0, 1, 2, 3, 4, 0, 1, 2, 3, 0, 1, 2, 3, 4]
})

   ID       VAL  SEQ
0   A     shoes    0
1   A   flowers    1
2   A    chairs    2
3   A    apples    3
4   A      dice    4
5   B     shoes    0 …
Run Code Online (Sandbox Code Playgroud)

python pandas

2
推荐指数
1
解决办法
44
查看次数

Pandas:如何使用初始值将 pct_change 恢复为原始值?

通常使用 .pct_change() 来获取时间序列数据的每日变化。

现在我想通过使用 pct_change 结果来获得原始值。

我有一个像这样的数据框:

df = pd.DataFrame({
    'value': [44, 45, 33, 56, 60]
})

df['pct_change'] = df['value'].pct_change() # get changes
initial_value=df['value'].values[0] # store the initial value
Run Code Online (Sandbox Code Playgroud)

我如何使用df['pct_change']initial_value来获取df['value']

python pandas

1
推荐指数
1
解决办法
946
查看次数