小编Pyt*_*ark的帖子

熊猫按两列值过滤行，不区分大小写

我有一个简单的数据框，如下所示：

Last Known Date ConfigredValue  ReferenceValue
0   24-Jun-17   False   FALSE
1   25-Jun-17   FALSE   FALSE
2   26-Jun-17   TRUE    FALSE
3   27-Jun-17   FALSE   FALSE
4   28-Jun-17   false   FALSE

Run Code Online (Sandbox Code Playgroud)

如果我执行以下命令

df=df[df['ConfigredValue']!=dfs['ReferenceValue']]

然后我得到如下

0   24-Jun-17   False   FALSE
2   26-Jun-17   TRUE    FALSE
4   28-Jun-17   false   FALSE

Run Code Online (Sandbox Code Playgroud)

但我想要不区分大小写的过滤器（case = False）

我想要以下输出：

2   26-Jun-17   TRUE    FALSE

Run Code Online (Sandbox Code Playgroud)

请建议，如何过滤不区分大小写的数据（case=false）

python pandas

Pyt*_*ark

2018 05-22

4
推荐指数

1
解决办法

4269
查看次数

如何在PySpark中获取数据帧的最常见值

我熟悉Pandas数据框,我使用函数"mode"和"groupby"来获取最常见的值,如下所示

df3=df5.groupby(['band']).apply(lambda x: x.mode())

Run Code Online (Sandbox Code Playgroud)

但是我在PySpark中遇到了一些困难.

我有一个火花数据框如下:

band      A3    A5  status
4G_band1800 12  18  TRUE
4G_band1800 12  18  FALSE
4G_band1800 10  18  TRUE
4G_band1800 12  12  TRUE
4g_band2300 6   24  FALSE
4g_band2300 6   22  FALSE
4g_band2300 6   24  FALSE
4g_band2300 3   24  TRUE

Run Code Online (Sandbox Code Playgroud)

上面的截图

我想要的是如下:

band      A3    A5  status
4G_band1800 12  18  TRUE
4g_band2300 6   24  FALSE

Run Code Online (Sandbox Code Playgroud)

上面的截图

我尝试了所有可能的组合,但没有任何合理的输出.请建议一个方法.

python mode apache-spark pyspark

Pyt*_*ark

2017 08-25

2
推荐指数

1
解决办法

3501
查看次数

Fiona python中的导入问题

我已经使用whl发行版安装了fiona ..但是在导入时出现以下错误：

---------------------------------------------------------------------------
ImportError                               Traceback (most recent call last)
<ipython-input-1-b0161244e1be> in <module>()
----> 1 import fiona
      2 with fiona.open(r'C:\Users\harish.padi\Downloads\BSP\BSP\BSP_default_pred.shp', 'r') as input:
      3     with open(r'C:\Users\harish.padi\Downloads\BSP\BSP\output.txt', 'w') as output:
      4        for pt in input:
      5            id = pt['properties']['id']

c:\program files\python36\lib\site-packages\fiona\__init__.py in <module>()
     75     pass
     76 
---> 77 from fiona.collection import Collection, BytesCollection, vsi_path
     78 from fiona._drivers import driver_count, GDALEnv
     79 from fiona.drvsupport import supported_drivers

c:\program files\python36\lib\site-packages\fiona\collection.py in <module>()
      7 
      8 from fiona import compat
----> 9 from fiona.ogrext import Iterator, ItemsIterator, …

Run Code Online (Sandbox Code Playgroud)

python gdal fiona

Pyt*_*ark

lucky-day

2
推荐指数

1
解决办法

3888
查看次数