小编use*_*844的帖子

python请求包中数据和json参数之间的差异

python Requests包中的data和json参数有什么区别?

文档中不清楚

这段代码是:

import requests
import json
d = {'a': 1}
response = requests.post(url, data=json.dumps(d))
Run Code Online (Sandbox Code Playgroud)

做任何不同于:

import requests
import json
d = {'a': 1}
response = requests.post(url, json=d)
Run Code Online (Sandbox Code Playgroud)

如果是这样,什么?后者是否自动将content-type标题设置为application/json

python json python-requests

44
推荐指数
2
解决办法
7370
查看次数

如何使用anacaonda conda命令安装PyPi包

使用Anacoda Python发行版时,安装不能通过Anaconda直接获得的PyPi包的最佳方法是什么?现在我正在使用:

conda pipbuild [pypi_name]
conda install --use-local [package_spec]
Run Code Online (Sandbox Code Playgroud)

但我不清楚这是否是最佳方式,如果conda update --all在更新可用时更新这些包.我也不清楚当PyPi已经存在时binstar的意义何在.

python pip pypi anaconda conda

26
推荐指数
3
解决办法
3万
查看次数

在scikit-learn中结合概率分类器的最佳方法

我有一个逻辑回归和一个随机森林,我想通过取平均值将它们(整体)组合起来进行最终的分类概率计算.

在sci-kit学习中是否有内置的方法可以做到这一点?在某些方面我可以使用两者的集合作为分类器本身?或者我需要滚动自己的分类器?

python classification machine-learning scikit-learn

24
推荐指数
3
解决办法
2万
查看次数

时间python脚本使用IPython魔术

如何使用iPython%time或%% timeit magic命令计时执行Python脚本?例如,我有script.py,我想知道执行需要多长时间.细微差别:script.py需要输入参数.以下似乎不起作用.

%%time script.py input_param1 input_param2
Run Code Online (Sandbox Code Playgroud)

python profiling ipython ipython-magic

17
推荐指数
1
解决办法
1万
查看次数

Floyd-Warshall:所有最短的路径

我实现了弗洛伊德-沃肖尔返回每对节点/顶点和一之间的最短路径的距离,这些对之间的最短路径.

是否有任何方法可以让它返回每条最短路径,即使有多条路径都是最短路径,对于每对节点?(我只是想知道我是否在浪费时间去尝试)

algorithm shortest-path floyd-warshall

12
推荐指数
2
解决办法
7345
查看次数

pandas将字符串转换为浮动数据帧中的多个列

我是pandas的新手,并试图找出如何将格式化为字符串的多列转换为float64的.目前我正在做下面的事情,但似乎apply()或applymap()应该能够更有效地完成这项任务......不幸的是,我有点太过新手了解如何.目前,这些值的格式为字符串,如'15 .5%'

for column in ['field1', 'field2', 'field3']:
    data[column] = data[column].str.rstrip('%').astype('float64') / 100
Run Code Online (Sandbox Code Playgroud)

python pandas

12
推荐指数
1
解决办法
3万
查看次数

对熊猫系列的累积值应用函数

rolling_apply在pandas中是否有相当于将函数应用于一系列的累积值而不是滚动值?我意识到cumsum,cumprod,cummax,以及cummin存在的,但我想申请一个自定义的功能.

python pandas

11
推荐指数
1
解决办法
2536
查看次数

在熊猫中合并两个时间序列

如果在某处明显记录了这一点,我会道歉,但我发现它时遇到了麻烦.我有两个TimeSeries,有一些重叠的日期/索引,我想合并它们.我假设我必须指定两个系列中的哪一个从重叠日期中取出值.为了说明,我有:

s1:
2008-09-15    100
2008-10-15    101

s2:
2008-10-15    101.01
2008-11-15    102.02
Run Code Online (Sandbox Code Playgroud)

而且我要:

s3:
2008-09-15    100
2008-10-15    101
2008-11-15    102.02
Run Code Online (Sandbox Code Playgroud)

要么

s3:
2008-09-15    100
2008-10-15    101.01
2008-11-15    102.02
Run Code Online (Sandbox Code Playgroud)

python time-series pandas

10
推荐指数
1
解决办法
8437
查看次数

熊猫时间序列事件之间的时间

如何计算熊猫时间序列中"事件"之间的时间(天数)?例如,如果我有以下时间序列,我想在系列中的每一天知道自上次以来已经过了多少天TRUE

            event
2010-01-01  False
2010-01-02   True
2010-01-03  False
2010-01-04  False
2010-01-05   True
2010-01-06  False
Run Code Online (Sandbox Code Playgroud)

我做的方式似乎过于复杂,所以我希望有更优雅的东西.显然,迭代遍历行的for循环可行,但我正在寻找理想的矢量化(可扩展)解决方案.我目前的尝试如下:

date_range = pd.date_range('2010-01-01', '2010-01-06')
df = pd.DataFrame([False, True, False, False, True, False], index=date_range, columns=['event'])
event_dates = df.index[df['event']]
df2 = pd.DataFrame(event_dates, index=event_dates, columns=['max_event_date'])
df = df.join(df2)
df['max_event_date'] = df['max_event_date'].cummax(axis=0, skipna=False)
df['days_since_event'] = df.index - df['max_event_date']

            event max_event_date  days_since_event
2010-01-01  False            NaT               NaT
2010-01-02   True     2010-01-02            0 days
2010-01-03  False     2010-01-02            1 days
2010-01-04  False     2010-01-02            2 days
2010-01-05   True     2010-01-05            0 days
2010-01-06  False     2010-01-05 …
Run Code Online (Sandbox Code Playgroud)

python pandas

10
推荐指数
1
解决办法
2896
查看次数

重新校对scikit-learn和/或pandas

在Pandas或Scikit中是否有内置函数 - 根据指定的策略学习重新采样?我想根据分类变量重新采样我的数据.

例如,如果我的数据有75%的男性和25%的女性,但我想训练我的模型50%的男性和50%的女性.(我也希望能够推广到非50/50的案例)

我需要的是根据指定的比例重新采样我的数据.

python pandas scikit-learn

9
推荐指数
1
解决办法
7655
查看次数