标签: encoding

HtmlAgilityPack - 如何在加载页面时设置自定义编码

使用以下方法加载页面时是否可以设置自定义编码?

HtmlWeb hwWeb = new HtmlWeb();
HtmlDocument hd = hwWeb.load("myurl");
Run Code Online (Sandbox Code Playgroud)

我想将编码设置为“iso-8859-9”。

我使用 C# 4.0 和 WPF。

编辑:该问题已在 MSDN 上得到解答。

c# wpf encoding load html-agility-pack

0
推荐指数
1
解决办法
1万
查看次数

将范围内的两个浮点数打包成一个浮点数

在 HLSL 中,我将如何以最佳精度将 0-1 范围内的两个浮点数打包成一个浮点数。这对于进一步压缩我的 GBuffer 非常有用。

encoding hlsl decoding

0
推荐指数
1
解决办法
2280
查看次数

平铺地图编辑器中的 base64 编码如何工作

我正在为我的游戏使用平铺地图编辑器,我用 C++ 编程,在我使用原始 XML .tmx 文件(没有 base64 和 zlib 压缩)为我的关卡实现加载方法之后,我想现在用 base64 来做。

这是我的问题/问题:平铺地图编辑器如何转换这样的数据结构:

<tile gid="25"/>
<tile gid="25"/>
<tile gid="25"/>
<tile gid="25"/>
<tile gid="25"/>
Run Code Online (Sandbox Code Playgroud)

到像这样的 base64 编码字符串:

GQAAABkAAAAZAAAAGQAAABkAAAA=
Run Code Online (Sandbox Code Playgroud)

?

我想我需要了解这一点,以便为此实施加载方法。我想知道如何知道另一个磁贴的 ID 开始的位置以及为什么编码字符串与我将 ID 复制到https://www.base64encode.org/时得到的字符串不匹配。

base64 encoding dictionary editor tiled

0
推荐指数
1
解决办法
1129
查看次数

使用 Java 中的特定编码写入文件

可能与我之前的问题有关(关于如何将“för”转换为“för”)

所以我在我的代码中创建了一个文件。现在我通过以下代码创建它:

FileWriter fwOne = new FileWriter(wordIndexPath);
BufferedWriter wordIndex = new BufferedWriter(fwOne);
Run Code Online (Sandbox Code Playgroud)

跟着几个

wordIndex.write(wordBuilder.toString()); //that's a StringBuilder
Run Code Online (Sandbox Code Playgroud)

结束(在while循环之后)

wordIndex.close();
Run Code Online (Sandbox Code Playgroud)

现在问题是这个文件很大,我想(需要)在不遍历整个文件的情况下跳转到它。让我这样做的seek(long pos)方法RandomAccessFile

这是我的问题:我创建的文件中的字符似乎是用 UTF-8 编码的,我寻找时唯一的信息是我想跳转到的字符位置。seek(long pos)另一方面,以字节为单位跳转,因此我不会在正确的位置结束,因为 UTF-8 字符可能超过一个字节。

这是我的问题:当我写文件时,我可以用 ISO-8859-15 来写它吗(其中一个字符是一个字节)?这样,这seek(long pos)将使我处于正确的位置。或者我应该尝试使用替代方法RandomAccessFile(是否有替代方法可以跳转到字符位置?)

java encoding utf-8 iso-8859-15 randomaccessfile

0
推荐指数
1
解决办法
1万
查看次数

仅使用 ffmpeg(以及所有音频流)重新编码视频流

我正在寻找一种方法来仅重新编码电影的视频流并保留所有其他流,因为它们正在使用ffmpeg或更具体streamio/streamio-ffmpegGithub - StreamIO-FFMPEG)。

我已经尝试了-map 0or 的各种组合-map a:0 -map s:0,但在我尝试的所有组合中,要么根本没有编码,要么没有将所有其他流都复制到新文件中。大多数情况下编码后只有一个音频流,而之前有两个,有时字幕流也会丢失。此外,大多数时候流所使用的语言信息会丢失。

因此,当我有一个包含以下流的电影文件 (mkv) 时:

0: video [H.264, 1080p]
1: audio [english, mp3]
2: audio [french, mp3]
3: subtitle [english (forced)]
4: subtitle [english]
Run Code Online (Sandbox Code Playgroud)

应该采取什么ffmpeg参数,如果我想将视频文件编码为H.265720p,并保持所有其他流,因为他们是谁?

如果我还想将音频流编码为,参数应该是什么AAC

提前致谢!

audio video encoding ffmpeg

0
推荐指数
1
解决办法
7465
查看次数

抓取汉字python

我从https://automatetheboringstuff.com学会了如何废弃网站。我想报废http://www.piaotian.net/html/3/3028/1473227.html,里面的内容是中文的,写成.txt文件。但是,.txt 文件包含随机符号,我认为这是编码/解码问题。

我读过这个线程“如何使用 python 解码和编码网页? ”并认为我的网站的编码方法是“gb2312”和“windows-1252”。我尝试在这两种编码方法中解码但失败了。

有人可以向我解释我的代码的问题吗?我对编程很陌生,所以也请让我知道我的误解!

此外,当我从代码中删除“html.parser”时,.txt 文件原来是空的,而不是至少有符号。为什么会这样?

import bs4, requests, sys

reload(sys)
sys.setdefaultencoding("utf-8")

novel = requests.get("http://www.piaotian.net/html/3/3028/1473227.html")
novel.raise_for_status()

novelSoup = bs4.BeautifulSoup(novel.text, "html.parser")

content = novelSoup.select("br")

novelFile = open("novel.txt", "w")
for i in range(len(content)):
    novelFile.write(str(content[i].getText()))
Run Code Online (Sandbox Code Playgroud)

encoding beautifulsoup decoding web-scraping python-2.7

0
推荐指数
1
解决办法
2519
查看次数

TeamCity 记录 UTF8 - Powershell 脚本

我创建了 powershell 脚本以在 TeamCity 上的一个步骤中读取文件。如果我在 Powershell 应用程序中读取文件并放置下一个脚本,它可以正常工作,但是当在运行程序类型“PowerShell”的步骤中执行该文件时,编码不起作用并且某些字符没有编码(例如“áãéí”等,等等)

$userDocuments = [environment]::getfolderpath("mydocuments")
$file= "myfile.txt"
$fullPath = Join-Path $userDocuments -ChildPath $file
Get-Content -Encoding UTF8 $fullPath
Run Code Online (Sandbox Code Playgroud)

有人帮我好吗?

提前致谢

powershell teamcity encoding readfile

0
推荐指数
1
解决办法
1086
查看次数

将文本文件转换为 ANSI 格式

我正在运行两个 Powershell 脚本。一个 Powershell 脚本将主机名添加到文本文件中。其他 Powershell 脚本将机器的 ip 地址附加到同一文件中。因此,.txt 文件如下所示: hostname ipaddress 但是,该文件默认以 Unicode 格式保存。我该怎么做才能使文本文件以 ANSI 格式存储?

我使用 PowerShell v2.0。

[System.Text.Encoding]::Default 

IsSingleByte : True
BodyName : iso-8859-1 
EncodingName : Western European (Windows) 
HeaderName : Windows-1252 
WebName : Windows-1252
WindowsCodePage : 1252
IsBrowserDisplay : True
IsBrowserSave : True
IsMailNewsDisplay : True
IsMailNewsSave : True
EncoderFallback : System.Text.InternalEncoderBestFitFallback
DecoderFallback : System.Text.InternalDecoderBestFitFallback
IsReadOnly : True 
CodePage : 1252 
Run Code Online (Sandbox Code Playgroud)

unicode powershell encoding text ansi

0
推荐指数
1
解决办法
2万
查看次数

使用 UTF-8 正确编码 - java

我在将以下字符串正确写入文件时遇到问题。尤其是“——”这个字。问题出现在我的本地机器 (Windows 7) 和服务器 (Linux) 上

字符串:“Cœurs d'artichauts Grillées”

  1. 是否工作(– 正确显示,而撇号被翻译成问号):

    Files.write(path, content.getBytes(StandardCharsets.ISO_8859_1));
    
    Run Code Online (Sandbox Code Playgroud)
  2. 不起作用(导致文件):

    Files.write(path, content.getBytes(StandardCharsets.UTF_8));
    
    Run Code Online (Sandbox Code Playgroud)

根据这个问题的第一个答案,UTF-8 应该也能正确编码 – 。有谁知道我做错了什么?

java encoding utf-8 iso-8859-1 character-encoding

0
推荐指数
1
解决办法
712
查看次数

Ruby相当于PHP urlencode

我需要在Ruby中转换一个包含字符“ö”的URL。

在PHP中,urlencode为ö返回%F6,这似乎是ISO 8859中“ö”的十六进制值。

我尝试了几种不同的方法,但没有一个返回正确的字符:

  • CGI.escape'ö'->%C3%B6
  • URI.encode'o'->%C3%B6
  • ERB :: Util.url_encode'ö'->%C3%B6
  • 'ö'.force_encoding('iso-8859-1')-> \ xC3 \ xB

我应该使用哪种方法来获得所需的输出?

-e-

附加要求:

我只需要在URL的路径中转换这些字符。冒号,斜杠等应保持不变:

http://example.com/this/is/an/ö

将会

http://example.com/this/is/an/%F6

ruby encoding ruby-on-rails iso-8859-1

0
推荐指数
1
解决办法
49
查看次数