小编can*_*289的帖子

Pandas中的示例数据集

使用R时,使用它可以方便地加载"练习"数据集

data(iris)
Run Code Online (Sandbox Code Playgroud)

要么

data(mtcars)
Run Code Online (Sandbox Code Playgroud)

熊猫有类似的东西吗?我知道我可以使用任何其他方法加载,只是好奇是否内置任何东西

python pandas

56
推荐指数
4
解决办法
3万
查看次数

第三次出现字符python后去掉字符串

我想在第三个字符后删除所有字符,例如 - 比如说.

我在网上发现了这个代码并且它有效,但是我无法学习它是如何工作的并且想要问我所以我能完全理解它.

 def indexList(s, item, i=0):
    """
    Return an index list of all occurrances of 'item' in string/list 's'.
    Optional start search position 'i'
    """
    i_list = []
    while True:
        try:
            i = s.index(item, i)
            i_list.append(i)
            i += 1
        except:
            break
    return i_list

def strip_chrs(s, subs):
    for i in range(indexList(s, subs)[-1], len(s)):
        if s[i+1].isalpha():
            return data[:i+1]

data = '115Z2113-3-777-55789ABC7777'
print strip_chrs(data, '-')
Run Code Online (Sandbox Code Playgroud)

这是我关于while的问题:行什么是真的?另外除了:除了什么?为什么在那里编码?

提前致谢!

python

8
推荐指数
2
解决办法
9962
查看次数

为什么+运算符不会在.append()的情况下更改列表?

我正在通过Udacity和Dave Evans介绍了关于列表属性的练习

list1 = [1,2,3,4]
list2 = [1,2,3,4]

list1=list1+[6]
print(list1)
list2.append(6)
print(list2)

list1 = [1,2,3,4]
list2 = [1,2,3,4]

def proc(mylist):
    mylist = mylist + [6]

def proc2(mylist):
    mylist.append(6)

# Can you explain the results given by the four print statements below? Remove
# the hashes # and run the code to check.

print (list1)
proc(list1)
print (list1)

print (list2)
proc2(list2)
print (list2)
Run Code Online (Sandbox Code Playgroud)

输出是

[1, 2, 3, 4, 6]
[1, 2, 3, 4, 6]
[1, 2, 3, 4]
[1, 2, 3, …
Run Code Online (Sandbox Code Playgroud)

python list concatenation append

7
推荐指数
1
解决办法
1650
查看次数

模数为Python中的负红利

正在查看其他答案,我仍然不理解python中负数的模数

例如df的回答

x == (x/y)*y + (x%y)
Run Code Online (Sandbox Code Playgroud)

所以有意义的是(-2)%5 = -2 - (-2/5)*5 = 3

这不是(-2 - (-2/5)*5)= 0还是我只是疯了? 具有负值的模数运算 - 奇怪的是什么?

python中的这个负数模数相同 他从哪里得到-2?

最后,如果该标志取决于股息,为什么负股息与正面股票的产出不相同?

例如,输出

print([8%5,-8%5,4%5,-4%5])
Run Code Online (Sandbox Code Playgroud)

[3, 2, 4, 1]
Run Code Online (Sandbox Code Playgroud)

python modulo

6
推荐指数
2
解决办法
5910
查看次数

时间序列熊猫的线性回归

我希望得到一个时间序列作为预测器的回归,我试图按照这个答案给出答案(OLS与熊猫:日期时间索引作为预测器)但它似乎不再适用于我的最佳状态知识.

我错过了什么或有新的方法吗?

import pandas as pd

rng = pd.date_range('1/1/2011', periods=4, freq='H')       
s = pd.Series(range(4), index = rng)                                                                      
z = s.reset_index()

pd.ols(x=z["index"], y=z[0]) 
Run Code Online (Sandbox Code Playgroud)

我收到了这个错误.错误是解释性的,但我想知道在重新实现以前有效的解决方案时我缺少什么.

TypeError:不能将[datetime64 [ns]]到[float64]的日期时间类型化

python pandas

6
推荐指数
1
解决办法
6069
查看次数

在Seaborn Factorplot中更改标记大小

我正在尝试更改Seaborn factorplots中的标记大小,但我不确定要通过哪个关键字参数

import seaborn as sns
exercise = sns.load_dataset("exercise")
g = sns.factorplot(x="time", y="pulse", hue="kind", data=exercise, ci= .95)
Run Code Online (Sandbox Code Playgroud)

我尝试传递基于这些StackOverFlow答案的markersizes,但似乎都没有效果

Seaborn_Example

pyplot散点图标记大小

matplotlib seaborn

6
推荐指数
1
解决办法
8325
查看次数

_constructor 在 DataFrame 类中做什么

我正在尝试了解 pandas 库的底层内容,并且对 DataFrame 类中的一段特定代码感到好奇。以下代码出现在类模块中。

@property
def _constructor(self):
    return DataFrame

_constructor_sliced = Series
Run Code Online (Sandbox Code Playgroud)

查看 _constructor 方法。它有什么作用?看起来它所做的只是返回一个 DataFrame,但我并不真正理解其意义。另外下一行 _constructor_sliced 我也不明白。

这几行代码的作用是什么?

https://github.com/pydata/pandas/blob/master/pandas/core/frame.py#L199

python pandas

6
推荐指数
1
解决办法
1567
查看次数

用熊猫绘图时的Matplotlib边距

我正在尝试设置边距,以便在使用matplotlib进行绘制时可以看到所有点,但是似乎没有正确添加它们。下面是我的代码和输出。

我正在将IPython与%matplotlib magic命令配合使用。

我正在做的事情显然是错误的吗?

import matplotlib.pyplot as plt
import pandas as pd


d = pd.DataFrame(pd.Series(range(10))*2)
a = d.plot(style = "o-")
a.set_axis_bgcolor('g') 
a.margins(.05)
Run Code Online (Sandbox Code Playgroud)

Matplotlib输出

python matplotlib pandas

5
推荐指数
1
解决办法
2609
查看次数

在Raymond Hettingers Pycon 2017演讲中,什么是数据库表示

在Raymond Hettinger的谈话中,他展示了数据库索引的表示.显示在它下面

[None, 4, None, 1, None, None, 0, None, 2, None, 3, None, None, None,None]
Run Code Online (Sandbox Code Playgroud)

我认为他后来在演讲中对此进行了解释,但我无法将各个部分组合在一起

虽然我得到它包含表的索引,该数组是什么以及它是如何生成的?它代表什么?具体来说,列表中第一个位置(第二个,如果不是零索引)中的4代表什么?

谈话截图 链接到Pycon视频

database indexing hash flat-file python-3.x

4
推荐指数
1
解决办法
180
查看次数

groupby.first()和groupby.head(1)有什么区别?

两者都返回每个组第一行的DataFrame。在阅读API参考时,它首先说“计算第一组值”,但是当同时查看两个输出时,我看不出主要区别。

我想念什么吗?

df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7],
                    'value'  : ["first","second","second","first",
                                "second","first","third","fourth",
                                "fifth","second","fifth","first",
                                "first","second","third","fourth","fifth"]})
Run Code Online (Sandbox Code Playgroud)

第一个API

python dataframe pandas

3
推荐指数
1
解决办法
2073
查看次数