我的所有数据都在.txt文件中,字段分隔符是逗号和换行符.所以我使用"Var.File"组件作为Source组件.
我试图弄清楚如何删除包含空值的行,然后获取输出以进行进一步处理.
我最初有一个未排序的 np 数组数组
test = np.array([['A', 'A', 'B', 'E', 'A'],
['B', 'E', 'A', 'E', 'B'],
['C', 'D', 'D', 'A', 'C'],
['B', 'D', 'A', 'C', 'A'],
['B', 'A', 'E', 'A', 'E'],
['C', 'D', 'C', 'E', 'D']])
Run Code Online (Sandbox Code Playgroud)
要根据第一列对数组进行排序:
argsortTest = test[:,0].argsort()
test_sorted = test[argsortTest]
test_sorted:
[['A' 'A' 'B' 'E' 'A']
['B' 'E' 'A' 'E' 'B']
['B' 'D' 'A' 'C' 'A']
['B' 'A' 'E' 'A' 'E']
['C' 'D' 'D' 'A' 'C']
['C' 'D' 'C' 'E' 'D']]
Run Code Online (Sandbox Code Playgroud)
我对test_sorted
数组进行了一些处理,更改了一些值(第一列保持不变,行数不变)。最后,我想检索保留更改值的原始数组数组。所以我需要根据第一列再次“取消排序”
到目前为止我的解决方案:
argsortTestList = argsortTest.tolist() …
Run Code Online (Sandbox Code Playgroud) 我试图找到将字典列表转换为numpy数组的最佳方法(用NULL填充缺失值).我还需要相反的方法:将numpy数组数组转换为字典列表(给定键的标题).
问题: Python字典没有排序.在处理大量行时,理解列表不是最佳选择.
例:
listOfDicts = [{'key1': 10, 'key2': 15, 'key3': 19},
{'key1': 20, 'key2': 25, 'key3': 29},
{'key1': 30, 'key2': 35, 'key3': 39},
{'key1': 40, 'key2': 45, 'key3': 49}]
Run Code Online (Sandbox Code Playgroud)
预期产量:
[[10 15 19]
[20 25 29]
[30 35 39]
[40 45 49]]
Run Code Online (Sandbox Code Playgroud)
为什么我需要这个:我需要这个,因为我正在将Python脚本集成到Splunk搜索中.Splunk的输入是一个字典列表,由返回splunk.Intersplunk.getOrganizedResults()
.并显示我们需要调用的输出,splunk.Intersplunk.outputResults(results)
其中results
也是一个字典列表