小编dag*_*g3r的帖子

Pandas根据条件交换列

我有一个像下面这样的pandas数据帧:

    Col1  Col2  Col3
0   A     7     NaN
1   B     16    NaN
1   B     16    15
Run Code Online (Sandbox Code Playgroud)

我想要做的是将Col2与Col3交换Col3的值NaN.根据SO上的其他帖子和答案,到目前为止我有这个代码:

df[['Col2', 'Col3']] = df[['Col3', 'Col2']].where(df[['Col3']].isnull())
Run Code Online (Sandbox Code Playgroud)

但这似乎没有正常工作,并给我以下内容:

    Col1  Col2  Col3
0   A     NaN   NaN
1   B     NaN   NaN
1   B     NaN   NaN
Run Code Online (Sandbox Code Playgroud)

有什么我可能会在这里失踪?

更新:我想要的输出如下:

    Col1  Col2  Col3
0   A     NaN   7
1   B     NaN   16
1   B     16    15
Run Code Online (Sandbox Code Playgroud)

谢谢

python swap pandas

8
推荐指数
2
解决办法
2439
查看次数

Pandas基于拆分另一列添加新列

我有一个像下面这样的pandas数据帧:

A              B
US,65,AMAZON   2016
US,65,EBAY     2016
Run Code Online (Sandbox Code Playgroud)

我的目标是看起来像这样:

A              B      country    code    com
US.65.AMAZON   2016   US         65      AMAZON
US.65.AMAZON   2016   US         65      EBAY
Run Code Online (Sandbox Code Playgroud)

我知道在这里这里之前已经问过这个问题,但它们都不适合我.我试过了:

df['country','code','com'] = df.Field.str.split('.')
Run Code Online (Sandbox Code Playgroud)

df2 = pd.DataFrame(df.Field.str.split('.').tolist(),columns = ['country','code','com','A','B'])
Run Code Online (Sandbox Code Playgroud)

我错过了什么吗?任何帮助深表感谢.

python split multiple-columns dataframe pandas

5
推荐指数
1
解决办法
6174
查看次数

pyspark通过特定键加入rdds

我有两个rdds,需要将它们一起加入。它们如下所示:

RDD1

[(u'2', u'100', 2),
 (u'1', u'300', 1),
 (u'1', u'200', 1)]
Run Code Online (Sandbox Code Playgroud)

RDD2

[(u'1', u'2'), (u'1', u'3')]
Run Code Online (Sandbox Code Playgroud)

我想要的输出是:

[(u'1', u'2', u'100', 2)]
Run Code Online (Sandbox Code Playgroud)

因此,我想从RDD2中选择具有相同RDD1第二个值的那些。我尝试了加入,也尝试了笛卡尔,但没有一个正在工作,甚至没有接近我想要的东西。我是Spark的新手,非常感谢你们的任何帮助。

谢谢

join rdd pyspark

3
推荐指数
2
解决办法
1万
查看次数

r shiny - 获取单选按钮值作为变量

我是新的r闪亮,我试图将单选按钮的选定值作为变量,然后将其与其他东西连接.这是我的代码:

ui.R

library(shiny)
shinyUI(fluidPage(
  titlePanel("This is test app"),

  sidebarLayout(
    sidebarPanel(
      radioButtons("rd",
                   label="Select window size:",
                   choices=list("100","200","500","1000"),
                   selected="100")
    ),
    mainPanel(
         //Something
    )
  )
))  
Run Code Online (Sandbox Code Playgroud)

server.R

library(shiny)

shinyServer(function(input, output) {


  ncount <- reactive({input$rd})
  print(ncount)
  my_var <- paste(ncount,"100",sep="_")

})
Run Code Online (Sandbox Code Playgroud)

现在,当我打印时ncount,打印出"ncount"而不是存储在变量中的值.这里有什么我想念的吗?

谢谢

r radio-button shiny

2
推荐指数
1
解决办法
6736
查看次数

标签 统计

pandas ×2

python ×2

dataframe ×1

join ×1

multiple-columns ×1

pyspark ×1

r ×1

radio-button ×1

rdd ×1

shiny ×1

split ×1

swap ×1