小编Rah*_*jan的帖子

如何从熊猫的字符串中提取前 8 个字符

我在数据框中有一列,我正在尝试从字符串中提取 8 位数字。我该怎么做

    Input
 Shipment ID
20180504-S-20000
20180514-S-20537
20180514-S-20541
20180514-S-20644
20180514-S-20644
20180516-S-20009
20180516-S-20009
20180516-S-20009
20180516-S-20009
Run Code Online (Sandbox Code Playgroud)

预期产出

Order_Date
20180504
20180514
20180514
20180514
20180514
20180516
20180516
20180516
20180516
Run Code Online (Sandbox Code Playgroud)

我尝试了下面的代码,但没有用。

data['Order_Date'] = data['Shipment ID'][:8]
Run Code Online (Sandbox Code Playgroud)

python-3.x pandas

16
推荐指数
1
解决办法
4万
查看次数

在熊猫中以分钟计算2个日期的差异

我在数据框中有 2 列。我想在几分钟内计算 2 列的差异并将结果写入新列

Input

Planned Pickup date/time    Actual Pickup date/time      
07/05/2018 09:28:00         07/05/2018 09:33:15               
14/05/2018 17:00:00         15/05/2018 08:44:08               
15/05/2018 17:00:00         15/05/2018 10:52:50              
15/05/2018 17:00:00         15/05/2018 15:03:34             
15/05/2018 17:00:00         15/05/2018 15:03:34              
16/05/2018 17:00:00         16/05/2018 16:00:38   
Run Code Online (Sandbox Code Playgroud)

我想在几分钟内计算实际和计划取货的差异,并将结果写入数据帧中名为 data['time difference']

Expected Output

Planned Pickup date/time    Actual Pickup date/time      Time Difference
07/05/2018 09:28:00         07/05/2018 09:33:15               5
14/05/2018 17:00:00         15/05/2018 08:44:08               944
15/05/2018 17:00:00         15/05/2018 10:52:50              -368
15/05/2018 17:00:00         15/05/2018 15:03:34              -117
15/05/2018 17:00:00         15/05/2018 15:03:34              -117
16/05/2018 17:00:00         16/05/2018 16:00:38              -60
Run Code Online (Sandbox Code Playgroud)

这如何在熊猫中完成

numpy python-3.x pandas

5
推荐指数
1
解决办法
5969
查看次数

如何根据熊猫的条件过滤时间戳

我想根据条件过滤熊猫数据框中的时间戳列。

Input

Pickup date/time      
07/05/2017 09:28:00                     
14/05/2017 15:32:20                     
15/05/2018 17:00:00                    
15/05/2018 11:20:09                    
23/06/2018 22:00:00                   
29/06/2018 16:10:02  
Run Code Online (Sandbox Code Playgroud)

我想基于条件时间戳大于16:00:00在数据框中创建另一列

Expected Output

   Pickup date/time      Pickup  
    07/05/2017 09:28:00      On-time                 
    14/05/2017 15:32:20      On-time             
    15/05/2018 17:00:00      Delayed              
    15/05/2018 11:20:09      On-time              
    23/06/2018 22:00:00      Delayed           
    29/06/2018 16:10:02      Delayed 
Run Code Online (Sandbox Code Playgroud)

python-3.x pandas

5
推荐指数
1
解决办法
1260
查看次数

如何在Python中使用Twitter API提取包含特定关键字的推文位置

我正在尝试提取包含特定关键字及其地理位置的所有推文。

例如,我要下载所有英文的推文,其中包含 来自“ france”“ singapore”的关键字“ iphone

我的密码

import tweepy
import csv
import pandas as pd
import sys

# API credentials here
consumer_key = 'INSERT CONSUMER KEY HERE'
consumer_secret = 'INSERT CONSUMER SECRET HERE'
access_token = 'INSERT ACCESS TOKEN HERE'
access_token_secret = 'INSERT ACCESS TOKEN SECRET HERE'

auth = tweepy.OAuthHandler(consumer_key, consumer_secret)
auth.set_access_token(access_token, access_token_secret)
api = tweepy.API(auth,wait_on_rate_limit=True,wait_on_rate_limit_notify=True)

# Search word/hashtag value 
HashValue = ""

# search start date value. the search will start from this date …
Run Code Online (Sandbox Code Playgroud)

python tweepy python-3.x pandas

5
推荐指数
1
解决办法
769
查看次数

我如何从熊猫的时间戳中提取星期几

我在数据框中有时间戳列,如下所示,我想创建另一个day of week从中调用的列。怎么办

Input

 Pickup date/time    
07/05/2018 09:28:00                     
14/05/2018 17:00:00                      
15/05/2018 17:00:00                      
15/05/2018 17:00:00                     
23/06/2018 17:00:00                     
29/06/2018 17:00:00  
Run Code Online (Sandbox Code Playgroud)

预期产出

Pickup date/time      Day of Week
07/05/2018 09:28:00     Monday                
14/05/2018 17:00:00     Monday                  
15/05/2018 17:00:00     Tuesday                 
15/05/2018 17:00:00     Tuesday               
23/06/2018 17:00:00     Saturday              
29/06/2018 17:00:00     Friday
Run Code Online (Sandbox Code Playgroud)

python-3.x pandas

4
推荐指数
1
解决办法
6988
查看次数

如何将存储在 YYYYMMDD 中的日期转换为 Pandas 中的日期时间格式

我在数据框中有一列 YYYYMMDD 格式,我想转换为日期时间格式。怎么能在熊猫中做到。

    Input

20180504   
20180516   
20180516   
20180517   

**Expected Output**

Date         datetime
20180504   04/5/2018 00:00:00
20180516   16/5/2018 00:00:00
20180516   16/5/2018 00:00:00
20180517   17/5/2018 00:00:00
Run Code Online (Sandbox Code Playgroud)

python-3.x pandas

3
推荐指数
1
解决办法
5084
查看次数

如何根据阈值对多列进行分组并在Python中创建新列

我有如下所示的数据框

输入

Invoice No  Date    Text            Vendor    Days
1000001     1/1/2020    Rent Payment    A   0
1000003     2/1/2020    Rent Payment    A   1
1000005     4/1/2020    Rent Payment    A   2
1000007     6/1/2020    Water payment   A   2
1000008     9/2/2020    Rep Payment     A   34
1000010     9/2/2020    Car Payment     A   0
1000011     10/2/2020   Car Payment     A   1
1000012     15/2/2020   Car Payment     A   5
1000013     16/2/2020   Car Payment     A   1
1000015     17/2/2020   Car Payment     A   1
1000002     1/1/2020    Rent Payment    B   -47
1000004     4/1/2020    Con Payment     B   3 …
Run Code Online (Sandbox Code Playgroud)

python group-by dataframe python-3.x pandas

3
推荐指数
1
解决办法
703
查看次数

如何更新Pandas Dataframe中值列表的列

我有数据帧,我想更新特定数据集的数据帧列的值.怎么做呢.我有大约20000条记录需要更新.

样本输入

Id  Registered
345     Y
678     N
987     N
435     N
2345    Y
123     N
679     N
Run Code Online (Sandbox Code Playgroud)

我想在给出一组ID号时将已注册的列更新为Y. 如何做到这一点我想将678,124,435的Registered列更改为Y. 对于大型列表,如何做到这一点.

python pandas

0
推荐指数
1
解决办法
2626
查看次数

标签 统计

pandas ×8

python-3.x ×7

python ×3

dataframe ×1

group-by ×1

numpy ×1

tweepy ×1