我需要添加一个平均线和模式的值,例如这种情节:
我用这个来计算垃圾箱的数量:
bw <- diff(range(cars$lenght)) / (2 * IQR(cars$lenght) / length(cars$lenght)^(1/3))
Run Code Online (Sandbox Code Playgroud)
情节:
ggplot(data=cars, aes(cars$lenght)) +
geom_histogram(aes(y =..density..),
col="red",
binwidth = bw,
fill="green",
alpha=1) +
geom_density(col=4) +
labs(title='Lenght Plot', x='Lenght', y='Times')
cars$lenght
Run Code Online (Sandbox Code Playgroud)
168.8 168.8 171.2 176.6 176.6 177.3 192.7 192.7 192.7 178.2 176.8 176.8 176.8 176.8 189.0 189.0 193.8 197.0 141.1 155.9 158.8 157.3 157.3 157.3 157.3 157.3 157.3 157.3 174.6 173.2
提前致谢.
我有一个看起来像这样的数据框:
k = pd.DataFrame({'A':[1,2,3,4], 'B':['a','b','c','d']})
Run Code Online (Sandbox Code Playgroud)
我想插入一个看起来像这样的 mongoDB:
dic = {1:'a', 2:'b',3:'c',4:'d'}
Run Code Online (Sandbox Code Playgroud)
我怎么能做到?
我已经检查过这样的事情,但它们似乎对我的 df 不起作用:
提前致谢!
我正在将 2 个数据帧导出为 csv,如下所示:
data1 = {'isin':['isin1','isin2','isin3'],'ticker_QF':['ticker1','ticker3','ticker3']}
df_QF = pd.DataFrame(data1)
data2 = {'isin':['isin1','isin1','isin2','isin3'],'ticker_BBG':['ticker1','ticker3','ticker4','ticker5']}
df_BBG = pd.DataFrame(data2)
Run Code Online (Sandbox Code Playgroud)
如果我想创建一个包含两个 csv 的 zip 文件夹,我该怎么做?提前致谢
我正在尝试将一些连续变量转换为类别变量,以便对其应用某些ML算法,并且我想将类别从6:00更改为12:00->“ Morning”或以ddMM格式将日期设置为“夏天”之类的。这些变量已经转换为整数。recode我认为像R中的函数一样。
+----------+
|CRSDepTime|
+----------+
| 745|
| 1053|
| 1915|
| 1755|
| 832|
| 630|
| 820|
| 945|
| 1245|
| 1645|
| 620|
| 1125|
| 2045|
| 1340|
| 1540|
| 730|
| 1145|
| 525|
| 630|
| 1520|
+----------+
Run Code Online (Sandbox Code Playgroud)
我用这句话解决了这个问题!
df = df.withColumn("Season", when(df("Month") >= 12 and df("Month") <=3, "Fall")
.when(df("Month") >= 4 and df("Month") <= 6, "Spring")
.when(df("Month") >= 7 and df("Month") <= 9, "Summer").otherwise("Autumm"))
Run Code Online (Sandbox Code Playgroud)