fig.text(0.6, 0.15,
'Line 1\n'
'Line 2\n'
'Line 3')
Run Code Online (Sandbox Code Playgroud)
在 matplotlib 中,有没有办法增加上面命令中两行之间的行距?我尝试插入一个额外的,\n但这会使行间距太宽。
cat1 cat2 col_a col_b
0 (34.0, 38.0] (15.9, 47.0] 29 10
1 (34.0, 38.0] (15.9, 47.0] 37 22
2 (28.0, 34.0] (47.0, 56.0] 3 13
3 (34.0, 38.0] (47.0, 56.0] 15 7
4 (28.0, 34.0] (56.0, 67.0] 42 20
5 (28.0, 34.0] (47.0, 56.0] 31 23
6 (28.0, 34.0] (56.0, 67.0] 26 17
7 (28.0, 34.0] (56.0, 67.0] 7 1
8 (28.0, 34.0] (56.0, 67.0] 36 19
9 (19.0, 28.0] (56.0, 67.0] 5 7
10 (19.0, 28.0] (56.0, 67.0] 21 …Run Code Online (Sandbox Code Playgroud) 有没有办法将包含年份和年份的字符串转换为熊猫时间戳?
例如
a_str = '2000120' # year 2000, day 120
Run Code Online (Sandbox Code Playgroud)
我试过:
pd.Timestamp(year=a_str[:4], dayofyear=a_str[4:])
Run Code Online (Sandbox Code Playgroud)
但我收到这个错误
*** TypeError: __new__() got an unexpected keyword argument 'dayofyear'
Run Code Online (Sandbox Code Playgroud)
如何解决这个问题?
Pandas groupby 提供first和last来获取组中的第一个和最后一个值。有没有办法以列表的形式获取组中的所有值?我想计算某些列的平均值,但在 pandas groupby 操作中获取其他列的所有值
df_points = df_points.groupby(['field_id', 'Year']).agg({'Added_by': 'first',
'Crop': 'first',
'lat': 'first',
'lon': 'first',
'was': np.nanmean,
'geometry': 'first'})
Run Code Online (Sandbox Code Playgroud)
在此示例中,我想获取was每个组的列的所有值(而不是 nanmean)
我正在迭代pandas数据帧并在文本文件中输出.但是,它看起来确实很慢(数据帧中的行数~80,000).有没有办法加快速度?
for count, row in df.iterrows():
print idx
idx += 1
# Extract data
sid = row['ID']
val = row['VALUE_']
slp = row['Slope']
if(slp <= 20):
out_file.write('{0:10d} "InputFiles//data//{1:d}.sol"\n'.format(sid,val))
Run Code Online (Sandbox Code Playgroud) 如何在以下数据帧(df)中从另一行中减去一行:
RECL_LCC 1 2 3
RECL_LCC 35.107655 36.015210 28.877135
RECL_PI 36.961519 43.499506 19.538975
Run Code Online (Sandbox Code Playgroud)
我想做类似的事情:
df['Difference'] = df['RECL_LCC']-df['RECL_PI']
Run Code Online (Sandbox Code Playgroud)
但这给出了:
*** KeyError: 'RECL_LCC'
Run Code Online (Sandbox Code Playgroud) 我想在R中读入以下矩阵,但随后丢弃行和列名称:
A B C D
A 0 4562 50714 882
B 5718 2302 47 26
C 72055 82 5889 215
D 1930 41 85 396
Run Code Online (Sandbox Code Playgroud)
我这样做:
matrix1 <-read.table("matrix_min.csv", header=T, sep=",")
m <- as.matrix(matrix1)
Run Code Online (Sandbox Code Playgroud)
但是,生成的"m"仍然具有行名和列名.我怎么摆脱他们?
出于某种原因,在阅读文件时使用
matrix1 <-read.table("matrix_min.csv", header=T, sep=",")
m <- as.matrix(matrix1,row.names=0,col.names=0)
rownames(m) <- colnames(m) <- NULL
print(m)
Run Code Online (Sandbox Code Playgroud)
生产:
[,1] [,2] [,3] [,4] [,5]
[1,] "A" " 0" "4562" "50714" "882"
[2,] "B" " 5718" "2302" " 47" " 26"
[3,] "C" "72055" " 82" " 5889" "215"
[4,] "D" …Run Code Online (Sandbox Code Playgroud) 对于数组:
import numpy as np
arr2d = np.array([[1,2,3],[4,5,6],[7,8,9]])
>>> arr2d
array([[1, 2, 3],
[4, 5, 6],
[7, 8, 9]])
>>> arr2d[2].shape
(3,)
>>> arr2d[2:,:].shape
(1, 3)
Run Code Online (Sandbox Code Playgroud)
当两个语句都返回第3行时,为什么我会得到不同的形状?并且在两种情况下结果都不应该是(1,3),因为我们返回一行有3列?
如何以编程方式列出我使用netCDF4和python读取的netCDF文件的所有变量:
import netCDF4
dset = netCDF4.Dataset('test.nc')
Run Code Online (Sandbox Code Playgroud) 我有一个愚蠢的。细绳:
' Y M D PDSW RSPC NPPC NEE'
Run Code Online (Sandbox Code Playgroud)
字符串中的每个元素对应于 csv 文件中的一列。有没有办法(除了 for 循环)从这个字符串中获取每列的宽度?例如,第一列的宽度为 5('Y'),下一列的宽度为 4('M')...
python ×9
pandas ×5
dataframe ×1
matplotlib ×1
matrix ×1
netcdf ×1
numpy ×1
pivot-table ×1
r ×1
string ×1
subtraction ×1