我正在使用R并且需要选择年龄(死亡年龄)小于或等于laclen(哺乳期长度)的行.我试图创建一个新的数据框,只包含行/ ids,其中column'aged'的值小于其对应的'laclength'值.
df:
id1 id2 laclen aged
9830 64526 26 6
7609 64547 28 0
9925 64551 3 0
9922 64551 3 5
9916 64551 3 8
9917 64551 3 8
9914 64551 3 2
Run Code Online (Sandbox Code Playgroud)
新数据框应如下所示:
dfnew:
id1 id2 laclen aged
9830 64526 26 6
7609 64547 28 0
9925 64551 3 0
9914 64551 3 2
Run Code Online (Sandbox Code Playgroud)
任何帮助,将不胜感激!
Bazon
最近我经常发现自己在问Pandas我依赖于我正在使用的数据的问题,到目前为止我需要花很长时间来创建一个与我的数据相似的数据框(可重复的数据框),以便SO用户可以轻松复制它到他们的机器.
我宁愿找到一个方便的方法,所以我可以在我的问题中打印我的小DF,其他用户可以轻松地收集它,因此用最小的努力创建它.
在R我习惯dput在控制台的函数中打印我的数据的一小部分样本,然后在我的问题中打印输出(示例):
运行for循环时获取错误"级别因素集是不同的"
我已经注意到了这个解释,但我认为它不适合为其他SO用户打印数据样本: Python相当于R的dput()函数
在Pandas中是否有相同的方法来做到这一点?
提前致谢!
我正在尝试用R读取一个csv文件.我可以读取该文件,但是当我调用一个变量时我有级别.这些级别是什么?如何删除它们?该文件可以在这里下载文件
> data=read.csv("Documents/bet/I1.csv",sep=",")
> data$HomeTeam
[1] Sampdoria Verona Cagliari Inter Lazio Livorno Napoli Parma
[9] Torino Fiorentina Chievo Juventus Atalanta Bologna Catania Genoa
[17] Milan Roma Sassuolo Udinese Inter Napoli Torino Fiorentina
[25] Lazio Livorno Sampdoria Udinese Verona Parma Cagliari Chievo
[33] Genoa Atalanta Bologna Catania Juventus Milan Roma Sassuolo
[41] Udinese Bologna Chievo Lazio Livorno Napoli Parma Sampdoria
[49] Torino Inter Genoa Milan Atalanta Cagliari Catania Roma
[57] Sassuolo Torino Verona Fiorentina Bologna Catania Napoli Parma
[65] Sampdoria …Run Code Online (Sandbox Code Playgroud)