小编use*_*289的帖子

Pandas将数据帧写入CSV文件

我在pandas中有一个数据帧,我想写一个CSV文件.我这样做使用:

df.to_csv('out.csv')
Run Code Online (Sandbox Code Playgroud)

并得到错误:

UnicodeEncodeError: 'ascii' codec can't encode character u'\u03b1' in position 20: ordinal not in range(128)
Run Code Online (Sandbox Code Playgroud)

有没有办法轻松解决这个问题(即我的数据框中有unicode字符)?有没有办法使用例如'to-tab'方法(我认为不存在)写入制表符分隔文件而不是CSV?

python csv dataframe pandas

612
推荐指数
8
解决办法
122万
查看次数

Pandas有条件地创建一个系列/数据帧列

我有一个沿着下面的数据框:

    Type       Set
1    A          Z
2    B          Z           
3    B          X
4    C          Y
Run Code Online (Sandbox Code Playgroud)

我想在数据帧中添加另一列(或生成一系列)与数据帧相同的长度(=相等的记录/行数),如果Set ='Z'则设置颜色为绿色,如果Set =否则设置为'red' .

最好的方法是什么?

python numpy dataframe pandas

260
推荐指数
7
解决办法
33万
查看次数

将两个Series组合成pandas中的DataFrame

我有两个系列s1s2相同(非连续)索引.如何组合s1s2成为DataFrame中的两列并将其中一个索引保留为第三列?

python series dataframe pandas

241
推荐指数
8
解决办法
27万
查看次数

使用python向RESTful API发出请求

我有一个RESTful API,我使用EC2实例上的Elasticsearch实现来公开内容语料库.我可以通过从终端(MacOSX)运行以下命令来查询搜索:

curl -XGET 'http://ES_search_demo.com/document/record/_search?pretty=true' -d '{
  "query": {
    "bool": {
      "must": [
        {
          "text": {
            "record.document": "SOME_JOURNAL"
          }
        },
        {
          "text": {
            "record.articleTitle": "farmers"
          }
        }
      ],
      "must_not": [],
      "should": []
    }
  },
  "from": 0,
  "size": 50,
  "sort": [],
  "facets": {}
}'
Run Code Online (Sandbox Code Playgroud)

我如何使用python/requestspython/urllib2(不确定要使用哪一个 - 使用urllib2,但听到请求更好......)将上面变成API请求?我是否以标题或其他方式传递?

python api rest elasticsearch

194
推荐指数
4
解决办法
54万
查看次数

ffmpeg输出的含义(tbc,tbn,tbr)

我正在使用ffmpeg告诉我视频信息.特别:

ffmpeg -i video.ext
Run Code Online (Sandbox Code Playgroud)

我得到输出:

Stream #0.0[0x1e0]: Video: mpeg2video, yuv420p, 704x576 [PAR 12:11 DAR 4:3], 9578 kb/s, 25 tbr, 90k tbn, 50 tbc
Run Code Online (Sandbox Code Playgroud)

有谁知道tbr,tbn和tbc究竟是什么?我看过网上的猜测,但没有确定的?

video ffmpeg

157
推荐指数
1
解决办法
7万
查看次数

如何将Pandas数据框中的日期转换为"日期"数据类型?

我有一个Pandas数据框,其中一列包含格式为'YYYY-MM-DD'的日期字符串,例如'2013-10-28'.

目前,列的dtype是'object'.

如何将列值转换为Pandas日期格式?

python date pandas

85
推荐指数
6
解决办法
17万
查看次数

从numpy.timedelta64值中提取天数

我正在使用pandas/python,我有两个日期时间系列s1和s2,它们是在包含日期/时间的df字段上使用'to_datetime'函数生成的.

当我从s2中减去s1时

s3 = s2 - s1

我得到了一个类型的系列,s3

timedelta64 [NS]

0    385 days, 04:10:36
1     57 days, 22:54:00
2    642 days, 21:15:23
3    615 days, 00:55:44
4    160 days, 22:13:35
5    196 days, 23:06:49
6     23 days, 22:57:17
7      2 days, 22:17:31
8    622 days, 01:29:25
9     79 days, 20:15:14
10    23 days, 22:46:51
11   268 days, 19:23:04
12                  NaT
13                  NaT
14   583 days, 03:40:39
Run Code Online (Sandbox Code Playgroud)

我如何看待该系列的1个元素:

S3 [10]

我得到这样的东西:

numpy.timedelta64(20692110亿, 'NS')

如何从s3中提取天数并将它们保持为整数(对小时/分钟等不感兴趣)?

在此先感谢您的帮助.

python numpy pandas

67
推荐指数
3
解决办法
8万
查看次数

寻找熊猫中两个系列的交集

我在pandas/python中有两个系列s1和s2,并且想要计算交集,即系列的所有值都是常见的.

我如何使用concat函数执行此操作?我一直试图解决它,但一直无法(我不想计算s1和S2的索引上的交集,但是在值上).

提前致谢.

python series pandas

51
推荐指数
5
解决办法
7万
查看次数

重用来自不同IPython笔记本的代码

我正在使用IPython,并希望从另一个笔记本中运行功能(不需要在不同的笔记本之间剪切和粘贴).这可能并且相当容易吗?

python ipython ipython-notebook

45
推荐指数
4
解决办法
2万
查看次数

将Pandas数据帧直接转换为Sparse Numpy Matrix

我正在从Pandas数据帧创建一个矩阵,如下所示:

dense_matrix = np.array(df.as_matrix(columns = None), dtype=bool).astype(np.int)
Run Code Online (Sandbox Code Playgroud)

然后进入稀疏矩阵:

sparse_matrix = scipy.sparse.csr_matrix(dense_matrix)
Run Code Online (Sandbox Code Playgroud)

有没有什么方法可以从df直到稀疏矩阵?

提前致谢.

python numpy scipy pandas

33
推荐指数
2
解决办法
3万
查看次数