小编Bor*_*042的帖子

如何在ggplot直方图中添加均值和模式?

我需要添加一个平均线和模式的值,例如这种情节:

我用这个来计算垃圾箱的数量:

bw <- diff(range(cars$lenght)) / (2 * IQR(cars$lenght) / length(cars$lenght)^(1/3))
Run Code Online (Sandbox Code Playgroud)

情节:

ggplot(data=cars, aes(cars$lenght)) + 
  geom_histogram(aes(y =..density..), 
                 col="red",
                 binwidth = bw,
                 fill="green", 
                 alpha=1) + 
  geom_density(col=4) + 
  labs(title='Lenght Plot', x='Lenght', y='Times')

cars$lenght
Run Code Online (Sandbox Code Playgroud)

168.8 168.8 171.2 176.6 176.6 177.3 192.7 192.7 192.7 178.2 176.8 176.8 176.8 176.8 189.0 189.0 193.8 197.0 141.1 155.9 158.8 157.3 157.3 157.3 157.3 157.3 157.3 157.3 174.6 173.2

提前致谢.

r mode histogram mean ggplot2

8
推荐指数
1
解决办法
1万
查看次数

使用第一个 Col 作为键和第二个作为值的数据帧到 Json

我有一个看起来像这样的数据框:

k = pd.DataFrame({'A':[1,2,3,4], 'B':['a','b','c','d']})
Run Code Online (Sandbox Code Playgroud)

我想插入一个看起来像这样的 mongoDB:

dic = {1:'a', 2:'b',3:'c',4:'d'}
Run Code Online (Sandbox Code Playgroud)

我怎么能做到?

我已经检查过这样的事情,但它们似乎对我的 df 不起作用:

将熊猫数据帧转换为 json 对象 - 熊猫

提前致谢!

python json mongodb dataframe pandas

6
推荐指数
1
解决办法
4211
查看次数

创建一个包含 2 个 CSV 的 Zip

我正在将 2 个数据帧导出为 csv,如下所示:

data1 = {'isin':['isin1','isin2','isin3'],'ticker_QF':['ticker1','ticker3','ticker3']}

df_QF = pd.DataFrame(data1)

data2 = {'isin':['isin1','isin1','isin2','isin3'],'ticker_BBG':['ticker1','ticker3','ticker4','ticker5']}
df_BBG = pd.DataFrame(data2)
Run Code Online (Sandbox Code Playgroud)

如果我想创建一个包含两个 csv 的 zip 文件夹,我该怎么做?提前致谢

python csv zip pandas

4
推荐指数
1
解决办法
2467
查看次数

在Spark中将连续变量转换为分类

我正在尝试将一些连续变量转换为类别变量,以便对其应用某些ML算法,并且我想将类别从6:00更改为12:00->“ Morning”或以ddMM格式将日期设置为“夏天”之类的。这些变量已经转换为整数。recode我认为像R中的函数一样。

+----------+
|CRSDepTime|
+----------+
|       745|
|      1053|
|      1915|
|      1755|
|       832|
|       630|
|       820|
|       945|
|      1245|
|      1645|
|       620|
|      1125|
|      2045|
|      1340|
|      1540|
|       730|
|      1145|
|       525|
|       630|
|      1520|
+----------+
Run Code Online (Sandbox Code Playgroud)

我用这句话解决了这个问题!

df = df.withColumn("Season", when(df("Month") >= 12 and df("Month") <=3, "Fall")
  .when(df("Month") >= 4 and df("Month") <= 6, "Spring")
  .when(df("Month") >= 7 and df("Month") <= 9, "Summer").otherwise("Autumm"))
Run Code Online (Sandbox Code Playgroud)

scala apache-spark recode

2
推荐指数
1
解决办法
707
查看次数

标签 统计

pandas ×2

python ×2

apache-spark ×1

csv ×1

dataframe ×1

ggplot2 ×1

histogram ×1

json ×1

mean ×1

mode ×1

mongodb ×1

r ×1

recode ×1

scala ×1

zip ×1