我在pandas中有一个数据帧,我想写一个CSV文件.我这样做使用:
df.to_csv('out.csv')
Run Code Online (Sandbox Code Playgroud)
并得到错误:
UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)
有没有办法轻松解决这个问题(即我的数据框中有unicode字符)?有没有办法使用例如'to-tab'方法(我认为不存在)写入制表符分隔文件而不是CSV?
我有一个沿着下面的数据框:
Type Set
1 A Z
2 B Z
3 B X
4 C Y
Run Code Online (Sandbox Code Playgroud)
我想在数据帧中添加另一列(或生成一系列)与数据帧相同的长度(=相等的记录/行数),如果Set ='Z'则设置颜色为绿色,如果Set =否则设置为'red' .
最好的方法是什么?
我有两个系列s1和s2相同(非连续)索引.如何组合s1和s2成为DataFrame中的两列并将其中一个索引保留为第三列?
我有一个RESTful API,我使用EC2实例上的Elasticsearch实现来公开内容语料库.我可以通过从终端(MacOSX)运行以下命令来查询搜索:
curl -XGET 'http://ES_search_demo.com/document/record/_search?pretty=true' -d '{
"query": {
"bool": {
"must": [
{
"text": {
"record.document": "SOME_JOURNAL"
}
},
{
"text": {
"record.articleTitle": "farmers"
}
}
],
"must_not": [],
"should": []
}
},
"from": 0,
"size": 50,
"sort": [],
"facets": {}
}'
Run Code Online (Sandbox Code Playgroud)
我如何使用python/requests或python/urllib2(不确定要使用哪一个 - 使用urllib2,但听到请求更好......)将上面变成API请求?我是否以标题或其他方式传递?
我正在使用ffmpeg告诉我视频信息.特别:
ffmpeg -i video.ext
Run Code Online (Sandbox Code Playgroud)
我得到输出:
Stream #0.0[0x1e0]: Video: mpeg2video, yuv420p, 704x576 [PAR 12:11 DAR 4:3], 9578 kb/s, 25 tbr, 90k tbn, 50 tbc
Run Code Online (Sandbox Code Playgroud)
有谁知道tbr,tbn和tbc究竟是什么?我看过网上的猜测,但没有确定的?
我有一个Pandas数据框,其中一列包含格式为'YYYY-MM-DD'的日期字符串,例如'2013-10-28'.
目前,列的dtype是'object'.
如何将列值转换为Pandas日期格式?
我正在使用pandas/python,我有两个日期时间系列s1和s2,它们是在包含日期/时间的df字段上使用'to_datetime'函数生成的.
当我从s2中减去s1时
s3 = s2 - s1
我得到了一个类型的系列,s3
timedelta64 [NS]
0 385 days, 04:10:36
1 57 days, 22:54:00
2 642 days, 21:15:23
3 615 days, 00:55:44
4 160 days, 22:13:35
5 196 days, 23:06:49
6 23 days, 22:57:17
7 2 days, 22:17:31
8 622 days, 01:29:25
9 79 days, 20:15:14
10 23 days, 22:46:51
11 268 days, 19:23:04
12 NaT
13 NaT
14 583 days, 03:40:39
Run Code Online (Sandbox Code Playgroud)
我如何看待该系列的1个元素:
S3 [10]
我得到这样的东西:
numpy.timedelta64(20692110亿, 'NS')
如何从s3中提取天数并将它们保持为整数(对小时/分钟等不感兴趣)?
在此先感谢您的帮助.
我在pandas/python中有两个系列s1和s2,并且想要计算交集,即系列的所有值都是常见的.
我如何使用concat函数执行此操作?我一直试图解决它,但一直无法(我不想计算s1和S2的索引上的交集,但是在值上).
提前致谢.
我正在使用IPython,并希望从另一个笔记本中运行功能(不需要在不同的笔记本之间剪切和粘贴).这可能并且相当容易吗?
我正在从Pandas数据帧创建一个矩阵,如下所示:
dense_matrix = np.array(df.as_matrix(columns = None), dtype=bool).astype(np.int)
Run Code Online (Sandbox Code Playgroud)
然后进入稀疏矩阵:
sparse_matrix = scipy.sparse.csr_matrix(dense_matrix)
Run Code Online (Sandbox Code Playgroud)
有没有什么方法可以从df直到稀疏矩阵?
提前致谢.