我怎么有一个简单的问题。我需要将字符串格式的日期转换为数字:
time = '2014-03-05 07:22:26.976637+00:00'
type(time)
str
Run Code Online (Sandbox Code Playgroud)
我想将此日期转换为唯一数字
谢谢你。
您好,我有一个数据框,其中包含从出发地到目的地df的不同行程的数据以及开始时间。我想计算特定时间窗口之间和特定时间窗口内的行程,比如说。所以,XYTXY15 min
df:
X Y T
1 2 2015-12-30 22:30:00.0
1 2 2015-12-30 22:35:00.0
1 2 2015-12-30 22:40:00.0
1 2 2015-12-30 23:40:00.0
3 5 2015-11-30 13:40:00.0
3 5 2015-11-30 13:44:00.0
3 5 2015-11-30 19:54:00.0
Run Code Online (Sandbox Code Playgroud)
我想
dfO:
X Y count
1 2 3
3 5 2
Run Code Online (Sandbox Code Playgroud)
为了计算从X到 的所有行程Y,我做了:
tmp = df.groupby(["X", "Y"]).size()
Run Code Online (Sandbox Code Playgroud)
我如何考虑到我只想计算特定时间间隔内的相同行程这一事实dt?
我有两个数据框df1和df2。df1包含人的年龄信息,而df2包含人的性别信息。并非所有人都在里面df1或里面df2
df1
Name Age
0 Tom 34
1 Sara 18
2 Eva 44
3 Jack 27
4 Laura 30
df2
Name Sex
0 Tom M
1 Paul M
2 Eva F
3 Jack M
4 Michelle F
Run Code Online (Sandbox Code Playgroud)
我想有人民的性别的信息df1和设置NaN,如果我没有在这个信息df2。我尝试这样做,df1 = pd.merge(df1, df2, on = 'Name', how = 'outer')但是我保留了一些df2我不想要的信息。
df1
Name Age Sex
0 Tom 34 M
1 Sara 18 NaN …Run Code Online (Sandbox Code Playgroud) 我正在尝试按照此处crs所述设置 geopandas 对象。
import geopandas as gdp
df = pd.read_pickle('myShp.pickle')
Run Code Online (Sandbox Code Playgroud)
我上传屏幕截图以显示坐标值
那么如果我尝试更改crs多边形的值不会改变
tmp = gpd.GeoDataFrame(df, geometry='geometry')
tmp.crs = {'init' :'epsg:32618'}
Run Code Online (Sandbox Code Playgroud)
我再次展示截图
如果我尝试:
import geopandas as gdp
df = pd.read_pickle('myShp.pickle')
df = gpd.GeoDataFrame(df, geometry='geometry')
dfNew=df.to_crs(epsg=32618)
Run Code Online (Sandbox Code Playgroud)
我得到:
ValueError: Cannot transform naive geometries. Please set a crs on the object first.
Run Code Online (Sandbox Code Playgroud) 我有一个 geopandas 数据框 gdf
gdf
ID longitude latitude geometry
0 80 103.619501 1.2810 POINT (103.619500987 1.281)
1 81 103.619501 1.2855 POINT (103.619500987 1.2855)
Run Code Online (Sandbox Code Playgroud)
按照这个建议,我在它周围创建了一个方形缓冲区,其距离bd定义为:
bd = abs((gdf['latitude'][0]-gdf['latitude'][1])/2)
Run Code Online (Sandbox Code Playgroud)
最后我能够得到以下信息:
buffer = gdf.buffer(bd)
envelope = buffer.envelope
f, ax = plt.subplots(figsize=(7.5, 7.5))
envelope.plot(color='white', edgecolor='gray',ax=ax)
gdf.plot(ax=ax)
Run Code Online (Sandbox Code Playgroud)
如何设置bd对应于 500 米的距离?
我有以下数据帧 df
df
a b i
0 1.0 3.0 2.0
1 1.0 3.0 3.0
2 1.0 3.0 1.0
3 1.0 3.0 3.0
4 1.0 3.0 7.0
5 1.0 3.0 8.0
6 1.0 4.0 4.0
7 1.0 4.0 0.0
8 1.0 3.0 2.0
9 1.0 3.0 1.0
10 1.0 3.0 2.0
Run Code Online (Sandbox Code Playgroud)
我要让总和超过i了同一对夫妇a和b,所以
df2
a b i
0 1.0 3.0 31.0
1 1.0 4.0 4.0
2 1.0 3.0 0.0
df2 = df2.groupby(['a', 'b']).sum(['i']).reset_index()
Run Code Online (Sandbox Code Playgroud) 我有一个df如下数据框:
df
A NUM_YYYYMM
0 a 201605
1 b 201602
2 c 201603
3 d 201601
Run Code Online (Sandbox Code Playgroud)
哪里有type(df['NUM_YYYYMM'])回报int.我想计算t0=201612列与列之间的差异df['NUM_YYYYMM'].所以:
df
A NUM_YYYYMM deltaT
0 a 201605 7
1 b 201602 10
2 c 201603 9
3 d 201601 11
Run Code Online (Sandbox Code Playgroud) 我有一个 S3 存储桶
aws s3 ls s3://myBucket/
PRE 2020032600/
PRE 2020032700/
PRE 2020032800/
PRE results_2020011200/
PRE results_2020011300/
PRE results_2020011400/
PRE results_2020011500/
Run Code Online (Sandbox Code Playgroud)
我只想在本地复制以以下开头的文件夹results_
aws s3 cp s3://myBucket/*something /Users/myName/myFolder/ --recursive
Run Code Online (Sandbox Code Playgroud) 我有一个熊猫数据框:
In [8]: test
Out[8]:
Product Price
0 Berlin Stret (E10) 12
1 Paris Ave (C12) 34
2 5th Ave (D30) 56
Run Code Online (Sandbox Code Playgroud)
我正在尝试将列产品拆分为 2 列,例如
Product Room Price
0 Berlin Stret E10 12
1 Paris Ave C12 34
2 5th Ave D30 56
Run Code Online (Sandbox Code Playgroud)
我试着用
df['Product'], df['Room'] = df['Product'].str.split('()', 1).str
Run Code Online (Sandbox Code Playgroud) 我想n从颜色图中获取不同颜色的列表。
假设我们必须绘制n=3线条
plt.plot(x0,y0, color=color[0])
plt.plot(x1,y1, color=color[1])
plt.plot(x2,y2, color=color[2])
Run Code Online (Sandbox Code Playgroud)
color是否可以从颜色图中获取列表?