我想编写一个函数,该函数可以查看数据帧,在指定的列中找到最大值或最小值,然后返回整个数据帧,并在底部包含包含最大值或最小值的行。
我这样做是为了使仅具有最大值或最小值的行被返回。
def findAggregate(df, transType, columnName=None):
if transType == 'max1Column':
return df[df[columnName] == df[columnName].max()]
elif transType == 'min1Column':
return df[df[columnName] == df[columnName].min()]
Run Code Online (Sandbox Code Playgroud)
给定下面的数据框,我想检查col2的MIN值
原始数据框:
col1 col2 col3
blue 2 dog
orange 18 cat
black 6 fish
Run Code Online (Sandbox Code Playgroud)
预期产量:
col1 col2 col3
blue 2 dog
orange 18 cat
black 6 fish
blue 2 dog
Run Code Online (Sandbox Code Playgroud)
实际输出:
col1 col2 col3
blue 2 dog
Run Code Online (Sandbox Code Playgroud) 我希望能够将 maven 依赖树作为输入并通过它进行解析以确定每个依赖项的 groupId、artifactId 和版本及其子(ren)(如果有)和子(ren)的 groupId 、artifactId 和 version(以及任何额外的 child(ren) 等等)。我不确定在为 neo4j 准备数据之前通过 mvn 依赖关系树解析并将信息存储为嵌套字典是否最有意义。
我也不确定解析整个 mvn 依赖树的最佳方法。下面的代码是我在尝试解析、删除前面不必要的信息和标记孩子或父母方面取得的最大进展。
tree=
[INFO] +- org.antlr:antlr4:jar:4.7.1:compile
[INFO] | +- org.antlr:antlr4-runtime:jar:4.7.1:compile
[INFO] | +- org.antlr:antlr-runtime:jar:3.5.2:compile
[INFO] | \- com.ibm.icu:icu4j:jar:58.2:compile
[INFO] +- commons-io:commons-io:jar:1.3.2:compile
[INFO] +- brs:dxprog-lang:jar:3.3-SNAPSHOT:compile
[INFO] | +- brs:libutil:jar:2.51:compile
[INFO] | | +- commons-collections:commons-collections:jar:3.2.2:compile
[INFO] | | +- org.apache.commons:commons-collections4:jar:4.1:compile
[INFO] | | | +- com.fasterxml.jackson.core:jackson-annotations:jar:2.9.0:compile
[INFO] | | | \- com.fasterxml.jackson.core:jackson-core:jar:2.9.5:compile
.
.
.
fileObj = open("tree", "r")
for line in fileObj.readlines():
for word in …Run Code Online (Sandbox Code Playgroud)