我有一个包含许多列的数据集,我必须选择它们的一部分并重命名它们以便偶尔进行分析.我select从包中使用的那一刻dplyr.但是,每次为许多属性进行设置都很复杂.有更好的方法吗?
例如,我使用数据集 mtcars
> head(mtcars)
mpg cyl disp hp drat wt qsec vs am gear carb
Mazda RX4 21.0 6 160 110 3.90 2.620 16.46 0 1 4 4
Mazda RX4 Wag 21.0 6 160 110 3.90 2.875 17.02 0 1 4 4
Datsun 710 22.8 4 108 93 3.85 2.320 18.61 1 1 4 1
Hornet 4 Drive 21.4 6 258 110 3.08 3.215 19.44 1 0 3 1
Hornet Sportabout 18.7 8 360 175 …Run Code Online (Sandbox Code Playgroud) 我使用Jupyter Notebook编写一个小程序。因此,我想将一些单元格写入.py文件。
我用这种魔法%%writefile -a myfile.py。它可以工作,但是问题是内容没有新行添加。因此,我必须myfile.py在运行单元格后手动向其中添加换行符。
如何避免这个问题?
我发现,在jupyter笔记本中,单元格上有一个标记工具,可以通过"View - Cell Toolbar - Tags"激活.但我无法弄清楚,为什么我们需要这些标签.有人可以提供一些建议或用法示例吗?
我正在阅读numpy.where(condition[, x, y]) 文档,但我无法理解这个小例子:
>>> x = np.arange(9.).reshape(3, 3)
>>> np.where( x > 5 )
Out: (array([2, 2, 2]), array([0, 1, 2]))
Run Code Online (Sandbox Code Playgroud)
有人可以解释一下结果如何?
我在R中学习绘图直方图,但是我对单个数字的参数"break"有一些问题.在帮助中,它说:
中断:一个数字给出直方图的单元格数
我做了以下实验:
data("women")
hist(women$weight, breaks = 7)
Run Code Online (Sandbox Code Playgroud)
我猜,它应该给我7个箱子,但结果不是我的预期!它给了我10个箱子.
你知道breaks = 7吗,是什么意思?什么意思在帮助"细胞数量"?
对于排序列表,如何找到接近给定数字的最小数字?
例如,
mysortedList = [37, 72, 235, 645, 715, 767, 847, 905, 908, 960]
Run Code Online (Sandbox Code Playgroud)
我怎样才能找到这是小于或等于700的最大元素迅速?(如果我有1000万个元素,那么线性搜索会很慢).在这个例子中,答案是645.
我从 DataFrame 中选择了一列,然后得到了一个系列。如何对系列进行排序?我使用了 Series.sort(),但它不起作用。
df = pd.DataFrame({'A': [5,0,3,8],
'B': ['B8', 'B9', 'B10', 'B11']})
df
A B
0 5 B8
1 0 B9
2 3 B10
3 8 B11
Run Code Online (Sandbox Code Playgroud)
然后我选择了“A”列
df['A']
A
0 5
1 0
2 3
3 8
Run Code Online (Sandbox Code Playgroud)
选择“A”列后,我得到了一个系列,但使用 Series.sort() 时,它不起作用。
df['A'].sort()
Run Code Online (Sandbox Code Playgroud)
它显示错误:
“ValueError:该系列是其他数组的视图,要就地排序,您必须创建一个副本”
所以我使用Series.copy()函数复制该系列,然后对系列进行排序,但没有结果。
df['A'].copy().sort()
Run Code Online (Sandbox Code Playgroud)
但没有返回结果。
我该如何解决这个问题?
我使用conda创建了一个名为testEnv并激活它的环境,之后我使用该命令jupyter notebook来调用 jupyter 编辑器。它有效,但问题是,我只能在根环境中创建文件。如何在testEnv环境中创建文件?
以下是我所做的步骤:
$ conda create -n testEnv python=3.5 # create environmet
$ source activate testEnv # activate the environmet
(testEnv)$ jupyter notebook # start the jupyter notebook
Run Code Online (Sandbox Code Playgroud)
这是结果,它表明我只能在“root”中创建文件,而不能在“testEnv”中创建文件(只有Root,但没有testEnv):
在 Tab 中Conda,我可以看到testEnv,但如何切换到它?
我有一个 excel 表,它看起来像
然后,我在 Sex 列上创建了一个过滤器来获取所有女性数据,它看起来像:
然后,我想将过滤后的数据导入python。我使用了以下熊猫命令:
df = pd.read_excel(io="test.xlsx", sheetname="Sheet1")
print(df)
Run Code Online (Sandbox Code Playgroud)
问题是我得到了整个数据:
Id Name Age Sex
0 1 Tom 12 M
1 2 Silke 33 F
2 3 Olga 22 F
3 4 Tom 33 M
Run Code Online (Sandbox Code Playgroud)
但是,这不是我想要的,我只想要过滤后的数据:
Id Name Age Sex
1 2 Silke 33 F
2 3 Olga 22 F
Run Code Online (Sandbox Code Playgroud)
我怎么能用python做到这一点?
注意:我之所以要在python中导入过滤后的数据而不是过滤数据,是因为原始excel数据。excel表格中的过滤器非常复杂。它不仅基于许多列,还基于数千个不同的值。如果我在python中过滤数据将是一个大问题。
如何关闭<Button>Material UI 5中的自动大写功能?
<Button variant="contained">Hello</Button>
Run Code Online (Sandbox Code Playgroud)
它会自动将文本变成HELLO,但我只想保留原来的Hello。我怎样才能做到这一点?