小编jjj*_*jjj的帖子

熊猫:保存到excel编码问题

我有一个类似于这里提到的问题,但没有一个建议的方法适合我.

我有一个中等大小的utf-8.csv文件,有很多非ascii字符.我正在通过其中一个列中的特定值拆分文件,然后我想将每个获取的数据帧保存为保留字符的.xlsx文件.

这不起作用,因为我收到一个错误:

UnicodeDecodeError: 'ascii' codec can't decode byte 0xff in position 7: ordinal not in range(128)

Run Code Online (Sandbox Code Playgroud)

这是我尝试过的:

xlsxwriter明确使用引擎.这似乎没有任何改变.

定义一个函数(下面)来改变编码并丢弃坏字符.这也没有改变任何东西.

def changeencode(data):
cols = data.columns
for col in cols:
if data[col].dtype == 'O':
    data[col] = data[col].str.decode('utf-8').str.encode('ascii', 'ignore')
return data

Run Code Online (Sandbox Code Playgroud)

用手将所有进攻性的角色改为其他人.仍然没有效果(在此更改后获得引用的错误).
将文件编码为utf-16(我相信,这是正确的编码,因为我希望之后能够从excel中操作文件)也无济于事.

我相信问题出在文件本身(因为2和3),但我不知道如何绕过它.我很感激任何帮助.文件的开头粘贴在下面.

"Submitted","your-name","youremail","phone","miasto","cityCF","innemiasto","languagesCF","morelanguages","wiek","partnerCF","messageCF","acceptance-795","Submitted Login","Submitted From","2015-12-25 14:07:58 +00:00","Zózia kry?","test@tes.pl","4444444","Wroc?aw","","testujemy polskie znaki","Polski","testujemy polskie znaki","44","test","test","1","Justyna","99.111.155.132",

Run Code Online (Sandbox Code Playgroud)

编辑

一些代码(其中一个版本,没有拆分部分):

import pandas as pd
import string
import xlsxwriter

df = pd.read_csv('path-to-file.csv')

with pd.ExcelWriter ('test.xlsx') as writer:
                df.to_excel(writer, sheet_name = …

Run Code Online (Sandbox Code Playgroud)

python excel encoding utf-8 pandas

jjj*_*jjj

2017 05-23

7
推荐指数

1
解决办法

1万
查看次数

Git：有没有办法自动推送子树？

我有一个在本地网络上维护的大型私有存储库。我想自动将该存储库的子树推送到该网络之外。我需要它很简单：

*任务*某人推送到本地远程存储库 --> 子树会自动推送到其他某个存储库

我不确定这是否可以通过服务器端挂钩来实现，因为 AFAIK 没有从裸遥控器推送子树这样的事情。我想出了两个想法：

我可以在服务器上克隆远程并自动拆分克隆远程中的子树。这并没有真正的帮助，因为我不知道如何自动拉取子树（其他人也有这个问题）。
另一个想法是编写一个自定义客户端post-commit-hook并让每个用户都安装它，但这很糟糕，不是吗？Git book 特别指出应该在服务器端强制执行策略。

有没有一种简单的方法可以实现这样的目标？或者这是不可能的，这只是 git 滥用？

git githooks git-subtree

jjj*_*jjj

2017 10-13

5
推荐指数

1
解决办法

1080
查看次数

为什么在定义中使用"或"而不是"xor"？

这可能是一个微不足道的问题,但我真的无法在任何地方找到答案.计算机科学中有一个我认为特殊的惯例.

在haskell中,数据类型可以像这样定义:

data Bool = False | True

Run Code Online (Sandbox Code Playgroud)

在xml中,限定名称的定义如下:

QName   ::=   PrefixedName | UnprefixedName

Run Code Online (Sandbox Code Playgroud)

可能有更多类似的例子,但这应该足够了.

通常但是很好理解的是|(管子或棒钢)应被理解为or.但这似乎很奇怪.A or B当A和B都是真的时也是如此.虽然它使得在第一个例子感(有可能的东西是True和False在同一时间,但我们暗含的假设不矛盾律),它并没有在第二:东西可以是一个PrefixedName或UnprefixedName它可以不是两个.

那为什么经常这样呢？为什么不使用独家或？有任何非常规原因吗？

xml computer-science haskell types definition

jjj*_*jjj

lucky-day

1
推荐指数

1
解决办法

273
查看次数