我有一个简单的数据框,如下所示:
Last Known Date ConfigredValue ReferenceValue
0 24-Jun-17 False FALSE
1 25-Jun-17 FALSE FALSE
2 26-Jun-17 TRUE FALSE
3 27-Jun-17 FALSE FALSE
4 28-Jun-17 false FALSE
Run Code Online (Sandbox Code Playgroud)
如果我执行以下命令
df=df[df['ConfigredValue']!=dfs['ReferenceValue']]
然后我得到如下
0 24-Jun-17 False FALSE
2 26-Jun-17 TRUE FALSE
4 28-Jun-17 false FALSE
Run Code Online (Sandbox Code Playgroud)
但我想要不区分大小写的过滤器(case = False)
我想要以下输出:
2 26-Jun-17 TRUE FALSE
Run Code Online (Sandbox Code Playgroud)
请建议,如何过滤不区分大小写的数据(case=false)
我熟悉Pandas数据框,我使用函数"mode"和"groupby"来获取最常见的值,如下所示
df3=df5.groupby(['band']).apply(lambda x: x.mode())
Run Code Online (Sandbox Code Playgroud)
但是我在PySpark中遇到了一些困难.
我有一个火花数据框如下:
band A3 A5 status
4G_band1800 12 18 TRUE
4G_band1800 12 18 FALSE
4G_band1800 10 18 TRUE
4G_band1800 12 12 TRUE
4g_band2300 6 24 FALSE
4g_band2300 6 22 FALSE
4g_band2300 6 24 FALSE
4g_band2300 3 24 TRUE
Run Code Online (Sandbox Code Playgroud)
我想要的是如下:
band A3 A5 status
4G_band1800 12 18 TRUE
4g_band2300 6 24 FALSE
Run Code Online (Sandbox Code Playgroud)
我尝试了所有可能的组合,但没有任何合理的输出.请建议一个方法.
我已经使用whl发行版安装了fiona ..但是在导入时出现以下错误:
---------------------------------------------------------------------------
ImportError Traceback (most recent call last)
<ipython-input-1-b0161244e1be> in <module>()
----> 1 import fiona
2 with fiona.open(r'C:\Users\harish.padi\Downloads\BSP\BSP\BSP_default_pred.shp', 'r') as input:
3 with open(r'C:\Users\harish.padi\Downloads\BSP\BSP\output.txt', 'w') as output:
4 for pt in input:
5 id = pt['properties']['id']
c:\program files\python36\lib\site-packages\fiona\__init__.py in <module>()
75 pass
76
---> 77 from fiona.collection import Collection, BytesCollection, vsi_path
78 from fiona._drivers import driver_count, GDALEnv
79 from fiona.drvsupport import supported_drivers
c:\program files\python36\lib\site-packages\fiona\collection.py in <module>()
7
8 from fiona import compat
----> 9 from fiona.ogrext import Iterator, ItemsIterator, …Run Code Online (Sandbox Code Playgroud)