每当我必须重新编码一组变量时,我都会考虑SPSS重新编码功能.我必须承认这很简单.包中有一个类似的recode功能car,它可以解决这个问题,但我们假设我希望完成任务factor.
我有data.frame几个变量值,范围从1到7.我想"反转"变量值,因此用7s替换1s,用6s替换2s,用5s替换3s等.我可以使用factor函数:
# create dummy factor
set.seed(100)
x <- as.factor(round(runif(100,1,7)))
y <- factor(x, levels = rev(levels(x)))
Run Code Online (Sandbox Code Playgroud)
如果我跑:
> levels(x)
[1] "1" "2" "3" "4" "5" "6" "7"
> levels(y)
[1] "7" "6" "5" "4" "3" "2" "1"
Run Code Online (Sandbox Code Playgroud)
当我想重新编码没有相同级别的因子时,问题就开始了.如果某个因子z有水平c("1", "3", "4", "6", "7"),是否有可能通过利用factor函数来"反转"水平,所以1 = 7,2 = 6,3 = 5等?
其他有效的重新编码功能就足够了!
我认为这已经提前了,但无法找到任何答案.如果已经回答,请通过链接指向正确的方向.
我有一个数组,我不想删除第一级标识符.我认为这有一个功能吗?
它是如何形成的例子:
[0] => Array
(
[8] => Röd
)
[1] => Array
(
[8] => Blå
)
[2] => Array
(
[6] => Bobo
)
[3] => Array
(
[8] => Grön
)
[4] => Array
(
[7] => Sten
)
[5] => Array
(
[8] => Vit
)
[6] => Array
(
[7] => Guld
)
[7] => Array
(
[6] => Lyxig
)
Run Code Online (Sandbox Code Playgroud)
我想要的是
[8] => Röd
[8] => Blå
[6] => Bobo
[8] => Grön …Run Code Online (Sandbox Code Playgroud) 我在Windows 7上对完整性级别和icacls进行了一些实验.我设置了强制完整性级别,以便我得到如下所示的内容:
C:\Debug>icacls test.exe
test.exe Everyone:(I)(RX)
BUILTIN\Administrators:(I)(F)
NT AUTHORITY\SYSTEM:(I)(F)
Mandatory Label\Low Mandatory Level:(NW)
Successfully processed 1 files; Failed processing 0 files
Run Code Online (Sandbox Code Playgroud)
但是,我现在似乎无法删除强制标签,因为它已被明确设置.最初,输出看起来像这样:
C:\Debug>icacls wdbp.exe
wdbp.exe Everyone:(I)(RX)
BUILTIN\Administrators:(I)(F)
NT AUTHORITY\SYSTEM:(I)(F)
Successfully processed 1 files; Failed processing 0 files
Run Code Online (Sandbox Code Playgroud)
默认情况下,它只是从没有强制标签的目录继承.我尝试使用icacls的继承选项,并尝试删除与Label对应的SID,其中没有一个显示错误,但实际上并没有删除强制标签.
有人有主意吗?
我从.csv文件导入数据,并附加了数据集.
我的问题:一个变量是整数形式,有295个级别.我需要使用这个变量来创建其他变量,但我不知道如何处理这些变量.
这些是什么,我该如何处理它们?
我知道这是一个非常基本的问题,但我不明白R中的含义是什么意思.
作为参考,我做了一个简单的脚本来读取CSV表,过滤其中一个字段,将其传递给一个新变量并清除为第一个变量分配的内存.如果我在我过滤的字段上调用unique(),我会看到结果确实被过滤了,但是还有一行显示与原始数据集中的数据相对应的"级别".
例:
df = read.csv(path, sep=",", header=TRUE)
df_intrate = df[df$AssetClass == "ASSET CLASS A", ]
rm(df)
gc()
unique(df_intrate$AssetClass)
Run Code Online (Sandbox Code Playgroud)
结果:
[1] ASSET CLASS A
Levels: ASSET CLASS E ASSET CLASS D ASSET CLASS C ASSET CLASS B ASSET CLASS A
Run Code Online (Sandbox Code Playgroud)
df尽管R studio显示df_intrate确实是预期的行数,但结构信息是否以某种方式保留在df_intrate中ASSET CLASS A?
我有一个数据框,有几个变量有5个因子级别.我想只删除其中一个级别.首先,我将该级别的所有实例分配给NA,然后使用该droplevels命令消除空白级别.
但是对于我的数据框中的一个变量,我不想丢弃的其中一个级别没有任何观察结果.有没有办法只删除一个特定的因子级别,而不仅仅是空的.
这是一个可重复的例子
df <- data.frame(var1=rep(letters[1:5],2),var2=rep(letters[5:1],2),var3=c("a","c","d","e","a","c","d","e","a","c"))
levels(df$var3)<-c("a","c","d","e","b")
Run Code Online (Sandbox Code Playgroud)
这会像我一样设置一个数据框.现在我想删除级别e的所有实例,然后将其作为可能的级别删除.我使用下面的代码执行此操作.
df2<-replace(df, df=="e",NA)
df2<-droplevels(df2)
Run Code Online (Sandbox Code Playgroud)
问题是当我使用droplevels它时也从var3中降低了b级.我不想从所有变量中删除级别b只是级别e.我已经找到了一种方法来删除一个特定的级别,但还没有找到答案.任何人都可以告诉我如何删除一个特定的因子水平?我理想的是一个droplevels命令,我只能删除级别e.这样的功能存在吗?
我有一个白色背景的png图像,我想将其变为透明。这是相当简单的用这个命令:
$ convert image.png -transparent white image-trans.png
Run Code Online (Sandbox Code Playgroud)
但是,如果白色背景不完全是白色的(即#FFFFFF,rgb(255,255,255)等等),那么这并不能很好的工作。
有没有办法将所有颜色降低到一定阈值以下才能完成白色处理?谢谢。
我有一个变量COLOR的数据集(称之为DATA).COLOR的模式是数字,类是因子.首先,我对"数字"感到有点困惑 - 打印出来时,COLOR的数据不是数字 - 它们都是字符值,如白色或蓝色或黑色等.任何对此的澄清都表示赞赏.
此外,我需要编写R代码来返回COLOR变量的级别,然后确定此变量的当前参考级别,最后将此变量的参考级别设置为白色.我尝试使用因子,但完全不成功.
感谢您抽出宝贵时间提供帮助.
我有一个带有 ID 和日期的 MultiIndex,其形式为:
MultiIndex(levels=[[196003, 196005, 196007, 196009, 196012, 196103, 196105, 196107, 196109, 196112, 196203, 196205, 196207, 196209, 196212, 196303, 196305, 196307, 196309, 196312, 196403, 196405, 196407, 196409, 196412, 201705, 201707, 201709, 201712, 201803, 201805, 201807, 201809, 201812], ['1959-07-01', '1959-07-02', '1959-07-06', '1959-07-07', '1959-07-08', '1959-07-09', '1959-07-10', '1959-07-13', '1959-07-14', '1959-07-15', '1959-07-16', '1959-07-17', '1959-07-20', '1959-07-21', '1959-07-22', '1959-07-23', ...]])
Run Code Online (Sandbox Code Playgroud)
ID 和日期都需要唯一指定一行。
我想要做的是提取索引的第一级。
当我这样做时df.index[0],我得到一个形式的元组(196003, '1959-07-01')
我想要的是一系列[196003, 196005, ...]0 级形式的键。
我设法得到它:
list(df[~df['ID'].duplicated()]['ID'].sort_values().reset_index()['ID'])
但我认为这是一个混乱且缓慢的解决方案。
熊猫之路是什么?
从这个问题跟进
像这样旋转后我得到了一个数据框。
AVG GrossProfit AVG PMV Loss% Sales ParentAuction Copart IAA Copart IAA Copart IAA Copart IAA 制作 讴歌 112.99 NaN -15.53 NaN 36.46 NaN 96.0 NaN
如何将列级别更改为这种列格式?
ParentAuction Copart IAA
AVG GrossProfit AVG PMV 损失% 销售额 AVG GrossProfit AVG PMV 损失% 销售额
制作
讴歌 112.99 -15.53 36.46 96.0 NaN NaN NaN NaN
levels ×10
r ×5
dataframe ×2
pandas ×2
acl ×1
arrays ×1
explicit ×1
identifier ×1
imagemagick ×1
integrity ×1
multi-index ×1
php ×1
pivot-table ×1
python ×1
python-3.x ×1
threshold ×1
transparent ×1
windows ×1