小编Pyt*_*ark的帖子

熊猫按两列值过滤行,不区分大小写

我有一个简单的数据框,如下所示:

Last Known Date ConfigredValue  ReferenceValue
0   24-Jun-17   False   FALSE
1   25-Jun-17   FALSE   FALSE
2   26-Jun-17   TRUE    FALSE
3   27-Jun-17   FALSE   FALSE
4   28-Jun-17   false   FALSE
Run Code Online (Sandbox Code Playgroud)

如果我执行以下命令

df=df[df['ConfigredValue']!=dfs['ReferenceValue']]

然后我得到如下

0   24-Jun-17   False   FALSE
2   26-Jun-17   TRUE    FALSE
4   28-Jun-17   false   FALSE
Run Code Online (Sandbox Code Playgroud)

但我想要不区分大小写的过滤器(case = False)

我想要以下输出:

2   26-Jun-17   TRUE    FALSE
Run Code Online (Sandbox Code Playgroud)

请建议,如何过滤不区分大小写的数据(case=false)

python pandas

4
推荐指数
1
解决办法
4269
查看次数

如何在PySpark中获取数据帧的最常见值

我熟悉Pandas数据框,我使用函数"mode"和"groupby"来获取最常见的值,如下所示

df3=df5.groupby(['band']).apply(lambda x: x.mode())
Run Code Online (Sandbox Code Playgroud)

但是我在PySpark中遇到了一些困难.

我有一个火花数据框如下:

band      A3    A5  status
4G_band1800 12  18  TRUE
4G_band1800 12  18  FALSE
4G_band1800 10  18  TRUE
4G_band1800 12  12  TRUE
4g_band2300 6   24  FALSE
4g_band2300 6   22  FALSE
4g_band2300 6   24  FALSE
4g_band2300 3   24  TRUE
Run Code Online (Sandbox Code Playgroud)

上面的截图

我想要的是如下:

band      A3    A5  status
4G_band1800 12  18  TRUE
4g_band2300 6   24  FALSE
Run Code Online (Sandbox Code Playgroud)

上面的截图

我尝试了所有可能的组合,但没有任何合理的输出.请建议一个方法.

python mode apache-spark pyspark

2
推荐指数
1
解决办法
3501
查看次数

Fiona python中的导入问题

我已经使用whl发行版安装了fiona ..但是在导入时出现以下错误:

---------------------------------------------------------------------------
ImportError                               Traceback (most recent call last)
<ipython-input-1-b0161244e1be> in <module>()
----> 1 import fiona
      2 with fiona.open(r'C:\Users\harish.padi\Downloads\BSP\BSP\BSP_default_pred.shp', 'r') as input:
      3     with open(r'C:\Users\harish.padi\Downloads\BSP\BSP\output.txt', 'w') as output:
      4        for pt in input:
      5            id = pt['properties']['id']

c:\program files\python36\lib\site-packages\fiona\__init__.py in <module>()
     75     pass
     76 
---> 77 from fiona.collection import Collection, BytesCollection, vsi_path
     78 from fiona._drivers import driver_count, GDALEnv
     79 from fiona.drvsupport import supported_drivers

c:\program files\python36\lib\site-packages\fiona\collection.py in <module>()
      7 
      8 from fiona import compat
----> 9 from fiona.ogrext import Iterator, ItemsIterator, …
Run Code Online (Sandbox Code Playgroud)

python gdal fiona

2
推荐指数
1
解决办法
3888
查看次数

标签 统计

python ×3

apache-spark ×1

fiona ×1

gdal ×1

mode ×1

pandas ×1

pyspark ×1