小编Yas*_*eth的帖子

获取pandas数据帧中所有唯一行的计数

我有一个Pandas DataFrame -

>>> import numpy as np
>>> import pandas as pd
>>> data = pd.DataFrame(np.random.randint(low=0, high=2,size=(5,3)),
...                       columns=['A', 'B', 'C'])
>>> data
   A  B  C
0  0  1  0
1  1  0  1
2  1  0  1
3  0  1  1
4  1  1  0
Run Code Online (Sandbox Code Playgroud)

现在我用它来获取仅A列的行数

>>> data.ix[:, 'A'].value_counts()
1    3
0    2
dtype: int64
Run Code Online (Sandbox Code Playgroud)

获得A列和B列的行数最有效的方法是什么,例如以下输出 -

0    0    0
0    1    2
1    0    2
1    1    1
Run Code Online (Sandbox Code Playgroud)

然后最后我怎么能把它转换成一个numpy数组,如 -

array([[0, 2],
       [2, 1]])
Run Code Online (Sandbox Code Playgroud)

请给出一个与之一致的解决方案

>>>> data …
Run Code Online (Sandbox Code Playgroud)

python numpy pandas

9
推荐指数
1
解决办法
7828
查看次数

如何在 conda 环境中为 python 3 运行 IDLE?

为了运行 python2,我所做的就是激活所需的 conda 环境并输入 idle。它会自动为 python 2.7 打开 IDLE。但我不知道如何为 Python 3 做到这一点。我的环境中安装了 python 3.5。我用于conda create -n py35 anaconda安装安装 python 3.5 。

python-idle python-3.x anaconda conda

6
推荐指数
3
解决办法
1万
查看次数

除以0后,在numpy数组中将NaN替换为0

我正在划分两个numpy数组:

>>> import numpy as np
>>> a1 = np.array([[ 0,  3],
                   [ 0,  2]])
>>> a2 = np.array([[ 0,  3],
                   [ 0,  1]])
>>> d = a1/a2
>>> d
array([[ nan,   1.],
       [ nan,   2.]])
>>> where_are_NaNs = np.isnan(d)
>>> d[where_are_NaNs] = 0
>>> d
>>> array([[ 0.,  1.],
           [ 0.,  2.]])
Run Code Online (Sandbox Code Playgroud)

我正在寻找一种方法来获得0而不是使用for循环的Nan?

numpy fillna()和pandas 有类似的功能吗?

python arrays numpy divide-by-zero

5
推荐指数
2
解决办法
6697
查看次数

如果事先不知道训练样本的顺序和总数,如何创建自定义PyTorch数据集?

我有一个42 GB的jsonl文件。该文件的每个元素都是一个json对象。我从每个json对象创建训练样本。但是我提取的每个json对象的训练样本数量可以在0到5个样本之间变化。在不读取内存中整个jsonl文件的情况下创建自定义PyTorch数据集的最佳方法是什么?

这是我正在谈论的数据集-Google 自然问题

deep-learning pytorch

3
推荐指数
1
解决办法
518
查看次数

运行IPyhon.widgets时没有名为"ipywidgets"的模块错误

我安装了IPython 4.0.1.我无法弄清楚以下错误的原因 -

>>> from IPython.html import widgets
>>> k = widgets.Box
Traceback (most recent call last):
  File "C:\Python34\lib\site-packages\IPython\utils\shimmodule.py", line 90, in __getattr__
    return import_item(name)
  File "C:\Python34\lib\site-packages\IPython\utils\importstring.py", line 31, in import_item
    module = __import__(package, fromlist=[obj])
ImportError: No module named 'ipywidgets'

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "<pyshell#8>", line 1, in <module>
    k = widgets.Box
  File "C:\Python34\lib\site-packages\IPython\utils\shimmodule.py", line 92, in __getattr__
    raise AttributeError(key)
AttributeError: Box
Run Code Online (Sandbox Code Playgroud)

我怎样才能解决这个问题?

python ipython ipython-notebook

2
推荐指数
2
解决办法
7523
查看次数

如何在一行中编写并行循环迭代(列表具有不等长度)

li1 = [['a','b','c'], ['c','d','e']]
li2 = [['c','a','b'], ['c','e','d']]
c = 1
for i in range(len(l11)):
    if (sorted[li1[i]]!=sorted(li2[i]):
        c = 0
if(c): k = True
else: k = False
Run Code Online (Sandbox Code Playgroud)

如何在一行中写这个?另外如何使用zip()来完成这个?怎么li2 = [['a','c','b']]办?使用zip会返回True但它应该给出一个False.

python list python-3.x

1
推荐指数
1
解决办法
64
查看次数