我有一个Pandas DataFrame -
>>> import numpy as np
>>> import pandas as pd
>>> data = pd.DataFrame(np.random.randint(low=0, high=2,size=(5,3)),
... columns=['A', 'B', 'C'])
>>> data
A B C
0 0 1 0
1 1 0 1
2 1 0 1
3 0 1 1
4 1 1 0
Run Code Online (Sandbox Code Playgroud)
现在我用它来获取仅A列的行数
>>> data.ix[:, 'A'].value_counts()
1 3
0 2
dtype: int64
Run Code Online (Sandbox Code Playgroud)
获得A列和B列的行数最有效的方法是什么,例如以下输出 -
0 0 0
0 1 2
1 0 2
1 1 1
Run Code Online (Sandbox Code Playgroud)
然后最后我怎么能把它转换成一个numpy数组,如 -
array([[0, 2],
[2, 1]])
Run Code Online (Sandbox Code Playgroud)
请给出一个与之一致的解决方案
>>>> data …Run Code Online (Sandbox Code Playgroud) 为了运行 python2,我所做的就是激活所需的 conda 环境并输入 idle。它会自动为 python 2.7 打开 IDLE。但我不知道如何为 Python 3 做到这一点。我的环境中安装了 python 3.5。我用于conda create -n py35 anaconda安装安装 python 3.5 。
我正在划分两个numpy数组:
>>> import numpy as np
>>> a1 = np.array([[ 0, 3],
[ 0, 2]])
>>> a2 = np.array([[ 0, 3],
[ 0, 1]])
>>> d = a1/a2
>>> d
array([[ nan, 1.],
[ nan, 2.]])
>>> where_are_NaNs = np.isnan(d)
>>> d[where_are_NaNs] = 0
>>> d
>>> array([[ 0., 1.],
[ 0., 2.]])
Run Code Online (Sandbox Code Playgroud)
我正在寻找一种方法来获得0而不是使用for循环的Nan?
numpy fillna()和pandas 有类似的功能吗?
我有一个42 GB的jsonl文件。该文件的每个元素都是一个json对象。我从每个json对象创建训练样本。但是我提取的每个json对象的训练样本数量可以在0到5个样本之间变化。在不读取内存中整个jsonl文件的情况下创建自定义PyTorch数据集的最佳方法是什么?
这是我正在谈论的数据集-Google 自然问题。
我安装了IPython 4.0.1.我无法弄清楚以下错误的原因 -
>>> from IPython.html import widgets
>>> k = widgets.Box
Traceback (most recent call last):
File "C:\Python34\lib\site-packages\IPython\utils\shimmodule.py", line 90, in __getattr__
return import_item(name)
File "C:\Python34\lib\site-packages\IPython\utils\importstring.py", line 31, in import_item
module = __import__(package, fromlist=[obj])
ImportError: No module named 'ipywidgets'
During handling of the above exception, another exception occurred:
Traceback (most recent call last):
File "<pyshell#8>", line 1, in <module>
k = widgets.Box
File "C:\Python34\lib\site-packages\IPython\utils\shimmodule.py", line 92, in __getattr__
raise AttributeError(key)
AttributeError: Box
Run Code Online (Sandbox Code Playgroud)
我怎样才能解决这个问题?
li1 = [['a','b','c'], ['c','d','e']]
li2 = [['c','a','b'], ['c','e','d']]
c = 1
for i in range(len(l11)):
if (sorted[li1[i]]!=sorted(li2[i]):
c = 0
if(c): k = True
else: k = False
Run Code Online (Sandbox Code Playgroud)
如何在一行中写这个?另外如何使用zip()来完成这个?怎么li2 = [['a','c','b']]办?使用zip会返回True但它应该给出一个False.