我正在使用anaconda,如下所示:
(base) C:\Users\xxx>conda info
active environment : base
active env location : C:\Users\xxx\Documents\ANACONDA
shell level : 1
user config file : C:\Users\xxx\.condarc
populated config files : C:\Users\xxx\.condarc
conda version : 4.7.11
conda-build version : 3.18.9
python version : 3.6.9.final.0
virtual packages :
base environment : C:\Users\xxx\Documents\ANACONDA (writable)
channel URLs : https://repo.anaconda.com/pkgs/main/win-64
https://repo.anaconda.com/pkgs/main/noarch
https://repo.anaconda.com/pkgs/free/win-64
https://repo.anaconda.com/pkgs/free/noarch
https://repo.anaconda.com/pkgs/r/win-64
https://repo.anaconda.com/pkgs/r/noarch
https://repo.anaconda.com/pkgs/msys2/win-64
https://repo.anaconda.com/pkgs/msys2/noarch
package cache : C:\Users\xxx\Documents\ANACONDA\pkgs
C:\Users\xxx\.conda\pkgs
C:\Users\xxx\AppData\Local\conda\conda\pkgs
envs directories : C:\Users\xxx\Documents\ANACONDA\envs
C:\Users\xxx\.conda\envs
C:\Users\xxx\AppData\Local\conda\conda\envs
platform : win-64
user-agent : conda/4.7.11 requests/2.22.0 CPython/3.6.9 Windows/10 Windows/10.0.16299 …Run Code Online (Sandbox Code Playgroud) 有什么方法可以更改深色主题中的形状图背景颜色或文本颜色吗?我需要白色背景或白色文本。
该图是 IPython.core.display.HTML 的对象。
它是由
shap.force_plot(explainer.expected_value[1], shap_values[1][0,:], X_test.iloc[0,:],link="logit")
Run Code Online (Sandbox Code Playgroud)
谢谢您的帮助!
实际上有两个问题,一个问题比另一个问题更高级。
corrplot()但可以处理因素的方法。我最初尝试使用p值和Cramer的V作为相关系数,但是要chisq.test()计算的列太多。因此,有谁能告诉我是否有一种快速的方法来创建“ Corrplot”,即每个单元格都包含Cramer V的值,而颜色是通过p值呈现的。或任何其他类似的情节。
关于Cramer的V,假设tbl是一个二维因子数据帧。
chi2 <- chisq.test(tbl, correct=F)
Cramer_V <- sqrt(chi2$/nrow(tbl))
Run Code Online (Sandbox Code Playgroud)
我准备了一个具有以下因素的测试数据框:
df <- data.frame(
group = c('A', 'A', 'A', 'A', 'A', 'B', 'C'),
student = c('01', '01', '01', '02', '02', '01', '02'),
exam_pass = c('Y', 'N', 'Y', 'N', 'Y', 'Y', 'N'),
subject = c('Math', 'Science', 'Japanese', 'Math', 'Science', 'Japanese', 'Math')
)
Run Code Online (Sandbox Code Playgroud)
df <- data.frame(
group = c('A', 'A', 'A', 'A', …Run Code Online (Sandbox Code Playgroud) 我想有一个包含不带NA的其他列字符的列。我曾尝试paste,str_c并且unite,也没有得到预期的结果。也许我使用不正确。
实际情况是,我无法提前知道列号,因为每个数据集可以根据年份而变化。
也就是说,有些数据集包含10年,但有些包含20年。
这是输入数据:
input <- tibble(
id = c('aa', 'ss', 'dd', 'qq'),
'2017' = c('tv', NA, NA, 'web'),
'2018' = c(NA, 'web', NA, NA),
'2019' = c(NA, NA, 'book', 'tv')
)
# A tibble: 4 x 4
id `2017` `2018` `2019`
<chr> <chr> <chr> <chr>
1 aa tv NA NA
2 ss NA web NA
3 dd NA NA book
4 qq web NA tv
Run Code Online (Sandbox Code Playgroud)
ALL列的期望输出是:
> output
# A tibble: 4 x …Run Code Online (Sandbox Code Playgroud) 我有一个像这样的数据框:
group student exam_passed subject
A 01 Y Math
A 01 N Science
A 01 Y Japanese
A 02 N Math
A 02 Y Science
B 01 Y Japanese
C 02 N Math
Run Code Online (Sandbox Code Playgroud)
我想要实现的是以下结果:
group student exam_passed subject_Math subject_Science subject_Japanese
A 01 Y 1 0 0
A 01 N 0 1 0
A 01 Y 0 0 1
A 02 N 1 0 0
A 02 Y 0 1 0
B 01 Y 0 0 1
C 02 N 1 …Run Code Online (Sandbox Code Playgroud) 我有一个这样的数据框:
df_1 = pd.DataFrame({
'ID' : ['A', 'A', 'A', 'A', 'A', 'B', 'B', 'B', 'B', 'C', 'C', 'C', 'C', 'C'],
'VAL' : ['shoes', 'flowers', 'chairs', 'apples', 'dice', 'shoes', 'apples',
'curtain', 'sand', 'socks', 'necklacs', 'tables', 'dishes', 'apples'],
'SEQ' : [0, 1, 2, 3, 4, 0, 1, 2, 3, 0, 1, 2, 3, 4]
})
ID VAL SEQ
0 A shoes 0
1 A flowers 1
2 A chairs 2
3 A apples 3
4 A dice 4
5 B shoes 0 …Run Code Online (Sandbox Code Playgroud) 通常使用 .pct_change() 来获取时间序列数据的每日变化。
现在我想通过使用 pct_change 结果来获得原始值。
我有一个像这样的数据框:
df = pd.DataFrame({
'value': [44, 45, 33, 56, 60]
})
df['pct_change'] = df['value'].pct_change() # get changes
initial_value=df['value'].values[0] # store the initial value
Run Code Online (Sandbox Code Playgroud)
我如何使用df['pct_change']和initial_value来获取df['value']?
python ×4
r ×3
pandas ×2
anaconda ×1
chi-squared ×1
conda ×1
correlation ×1
dplyr ×1
html ×1
node.js ×1
plot ×1
shap ×1
statistics ×1