相关疑难解决方法(0)

使用awk删除字节顺序标记

awk用于删除BOM的脚本(可能是单线程)怎么样？

规格:

在第一个(NR > 1)之后打印每一行
对于第一行:如果以#FE #FF或开头#FF #FE,则删除它们并打印其余部分

unicode awk byte-order-mark

Bol*_*wyn

2017 03-15

102
推荐指数

4
解决办法

8万
查看次数

使用BOM搜索UTF-8文件的优雅方式？

出于调试目的,我需要以递归方式在目录中搜索以UTF-8字节顺序标记(BOM)开头的所有文件.我目前的解决方案是一个简单的shell脚本:

find -type f |
while read file
do
    if [ "`head -c 3 -- "$file"`" == $'\xef\xbb\xbf' ]
    then
        echo "found BOM in: $file"
    fi
done

Run Code Online (Sandbox Code Playgroud)

或者,如果您喜欢简短,不可读的单行:

find -type f|while read file;do [ "`head -c3 -- "$file"`" == $'\xef\xbb\xbf' ] && echo "found BOM in: $file";done

Run Code Online (Sandbox Code Playgroud)

它不适用于包含换行符的文件名,但无论如何都不会出现这样的文件.

是否有更短或更优雅的解决方案？

文本编辑器是否有任何有趣的文本编辑器或宏？

php shell text-editor utf-8

vog*_*vog

2008 11-05

89
推荐指数

6
解决办法

6万
查看次数

如何使记事本在没有BOM的情况下以UTF-8保存文本？

我有一个带有特殊重音的CSV文件,并通过选择UTF-8编码将其保存在记事本中.当我使用Java读取文件时,它也会读取BOM字符.

所以我想以UTF-8格式保存这个文件,而不是最初在记事本中添加BOM.

否则,在Java中是否有任何内置类可以在读取文件中的内容时消除开头出现的BOM字符？

java csv notepad utf-8

use*_*036

2015 05-10

26
推荐指数

4
解决办法

6万
查看次数

为什么我的Python代码在从文本文件中读取时会打印额外的字符"ï»¿"？

try:
    data=open('info.txt')
    for each_line in data:
        try:
            (role,line_spoken)=each_line.split(':',1)
            print(role,end='')
            print(' said: ',end='')
            print(line_spoken,end='')
        except ValueError:
            print(each_line)
    data.close()
except IOError:
     print("File is missing")

Run Code Online (Sandbox Code Playgroud)

当逐行打印文件时,代码往往会在前面添加三个不必要的字符,即"ï»¿".

实际产量:

ï»¿Man said:  Is this the right room for an argument?
Other Man said:  I've told you once.
Man said:  No you haven't!
Other Man said:  Yes I have.

Run Code Online (Sandbox Code Playgroud)

预期产量:

Man said:  Is this the right room for an argument?
Other Man said:  I've told you once.
Man said:  No you haven't!
Other Man said:  Yes I …

Run Code Online (Sandbox Code Playgroud)

python file-handling

vrk*_*esh

2017 06-02

22
推荐指数

1
解决办法

2万
查看次数

读取toad导出的csv文件后,将奇怪的字符添加到第一列名称

每当我读取使用toad导出的csvR(read.csv("file_name.csv"))中的文件时,第一列名称前面都有以下字符" ï.. ".此外,打开excel或notepad ++中的csv文件正确显示(没有前面的字符).这是一个麻烦,因为我的解决方法是在每次读取后重命名该列.感谢您解决此问题!

编辑:
通过右键单击查询的结果集并选择
"快速导出 - >文件 - > CSV文件",在Toad中创建导出

每条评论的更多细节:
head(readLines('test_file.csv'),n=3)
[1] "ï»¿ID,LOCATION" "12021,1204" "12281,1204"

csv toad r

amu*_*gui

2014 04-10

14
推荐指数

3
解决办法

2万
查看次数

fgetcsv 后数组第一行中的奇怪字符

我有一个 CSV 文件，在这种情况下，第一个“单元格”只是一个整数 9。下一行是第一个“单元格”的 10，依此类推。当我做$array = fgetcsv($file);第一行的第一个单元格时，值前面有这些奇怪的字符：??

它搞乱了我的数据库导入，因为这个单元格应该只包含一个整数。它只发生在第一行的第一个单元格上。

关于为什么会发生这种情况以及我可以做些什么来避免这种情况的任何想法？

php csv illegal-characters fgetcsv

CR4*_*R47

lucky-day

5
推荐指数

2
解决办法

2111
查看次数

如何从C++文本文件的开头删除字符"ï»¿"？

我正在尝试读取文本文件,对于每个单词,我会将它们放入二叉搜索树的节点中.但是,第一个字符总是被读作"ï»¿+第一个字".例如,如果我的第一个单词是"This",那么插入我的节点的第一个单词是"ï»¿This".我一直在论坛寻找解决方案来修复它,有一篇文章在Java中提出同样的问题,但是没有人用C++解决它.有人帮我解决了吗？谢谢.

我找到了一个简单的解决方案.我在记事本中打开文件,并将其保存为ANSI.之后,文件正在读取并正确传递到二叉搜索树中

c++ byte

Hoa*_*inh

2016 03-28

5
推荐指数

1
解决办法

1万
查看次数

Shiny中出现意外的输入错误，但无法找到错误源

我在UI.R中收到意外输入错误，如下所示：

ERROR: C:\Users\myApp/ui.R:1:2: unexpected input 
1: ï»

Run Code Online (Sandbox Code Playgroud)

但是，当我尝试在第1行定位错误时，绝对没有任何形式ï»。

要解决此错误，我尝试将UI.R文件另存为文本文件并将编码更改为UTF-8，但这仍然不能删除奇怪的字符。我还尝试删除了前几行并重新编写了代码，但仍然给出了相同的错误！

如何删除该字符？我应该使用其他文本编辑器吗？我正在使用基本R，而不是R Studio。如果需要该信息，我已经从GitHub帐户中粘贴了我的代码...可以在此处查看我文件的代码。

非常感谢。

encoding r character-encoding shiny

inf*_*keR

lucky-day

5
推荐指数

1
解决办法

1555
查看次数

Firefox销毁标题并添加随机字符

我遇到了Firefox最疯狂的问题.我不确定这个问题是来自Firefox本身,还是来自我的自定义Web服务器(内置Delphi)或它可能是什么.这个问题只发生在Firefox(和Opera)中,它既可以将所有内容从头部向下移动到正文,也可以在正文的开头添加随机字符.奇怪的是,它甚至可以使用完全100%空的网页.

我正在测试一个简单的页面:

<html>
<head>
    <title>Test</title>
</head>
<body>

</body>
</html>

Run Code Online (Sandbox Code Playgroud)

至于Web服务器,我正在使用IdHTTPWebBrokerBridge(Indy)在Delphi中构建一个自定义HTTP应用程序,并简单地替换ContentStream(或Content)Request类似的...

procedure TDashModule.DashConsoleHomeAction(Sender: TObject;
  Request: TWebRequest; Response: TWebResponse; var Handled: Boolean);
begin
  Response.ContentType:= 'text/html';
  Response.ContentStream:= TFileStream.Create('C:\SomeDir\SomeFile.html', fmOpenRead or fmShareDenyNone);
end;

Run Code Online (Sandbox Code Playgroud)

... SomeFile.html上面发布的空页面在哪里,该过程是默认请求处理程序的事件处理程序.

在Chrome,IE,Safari等中,一切都与原始代码完全相同.但是,Firefox(和Opera)正在制作这个:

<html>
<head>
</head>
<body>
ï»¿
<title>Test</title>
</body>
</html>

Run Code Online (Sandbox Code Playgroud)

如您所见,title标签已向下移动到body,并且一些随机字符ï»¿出现在正文的开头.在Firefox中查看原始页面作为其原始文件时,它会正确显示.但是当在Delphi中使用我的Web服务器时,Firefox正在销毁这个页面(以及所有页面,就此而言).

有什么可以做到这一点以及如何解决它？

重现步骤

A)仅使用以下内容创建一个新的HTML页面(对我来说,在Visual Studio 2010中):

<html>
<head>
    <title>Test</title>
</head>
<body>

</body>
</html>

Run Code Online (Sandbox Code Playgroud)

B)在Delphi XE2中,启动一个新项目: File > New > Other... > Web Broker > Web …

html delphi firefox cross-browser indy

Jer*_*dge

2012 03-27

1
推荐指数

1
解决办法

451
查看次数

如何从我的页面中删除"ï»¿"

我在php中建立一个网站,并在顶部显示"ï»¿".

我正在搜索这个问题,它是关于ISO-8859-1,但我不想将我的字符集更改为UTF-8,因为当我将我的字符集更改为UTF-8时,所有重音都会消失.

有没有办法隐藏这个""ï»¿"？改变php中的颜色,或使用其他技巧.

我尝试使用UTF-8,但它不起作用,我的数据库表在latin1_swedish_ci中,但是出现所有重音的唯一方法是使用ISO-8859-1.

php

use*_*048

lucky-day

-1
推荐指数

1
解决办法

909
查看次数

标签统计

csv ×3

php ×3

r ×2

utf-8 ×2

awk ×1

byte ×1

byte-order-mark ×1

c++ ×1

character-encoding ×1

cross-browser ×1

delphi ×1

encoding ×1

fgetcsv ×1

file-handling ×1

firefox ×1

html ×1

illegal-characters ×1

indy ×1

java ×1

notepad ×1

python ×1

shell ×1

shiny ×1

text-editor ×1

toad ×1

unicode ×1

标签 统计

标签统计