我希望访问者能够直接在我的网页上点击(或复制)电子邮件地址.但是,如果我能够(有点)让机器人和其他爬虫更难获得所述电子邮件地址并将其注册到垃圾邮件列表中,那就太棒了.
我发现了不同的方法(即编码mailto HTML链接),使用JavaScript或纯HTML,但你们推荐什么?JavaScript技术似乎更复杂,但这可能会影响关闭它的用户,以及像Google这样的合法抓取工具.
另一方面,HTML一个看起来有点基础,机器人编写者应该现在已经弄明白了...
我是否应该费心去做这件事,还是垃圾邮件发送者会收到我的电子邮件?我知道反垃圾邮件过滤器越来越好,但如果我能做更多的事情来减缓垃圾邮件发送者的速度,我会的.
我有.txt和.java文件,我不知道如何确定文件的编码表(Unicode,UTF-8,ISO-8525,...).是否存在任何程序来确定文件编码或查看编码?
我的一些脚本使用不同的编码,当我尝试将它们组合时,这就成了一个问题.
但是我不能改变他们使用的编码,而是想要从脚本A更改结果的编码,并将其用作脚本B中的参数.
那么:有没有简单的方法可以在PHP中将字符串从UTF-8更改为ISO-88591?我看过utf_encode和_decode,但是他们没有做我想要的.为什么不存在任何"utf2iso()" - 函数或类似的东西?
我不认为我的字符不能用ISO格式编写,所以这不应该是一个大问题.
如何print("Some text")在UTF-8中使用python 3(3.1)到stdout,或者如何输出原始字节?
TestText = "Test - ??????..šŠ??žŽ" # this is UTF-8
TestText2 = b"Test2 - \xc4\x81\xc4\x80\xc4\x93\xc4\x92\xc4\x8d\xc4\x8c..\xc5\xa1\xc5\xa0\xc5\xab\xc5\xaa\xc5\xbe\xc5\xbd" # just bytes
print(sys.getdefaultencoding())
print(sys.stdout.encoding)
print(TestText)
print(TestText.encode("utf8"))
print(TestText.encode("cp1252","replace"))
print(TestText2)
Run Code Online (Sandbox Code Playgroud)
输出(在CP1257和I中将字符替换为字节值[x00]):
utf-8
cp1257
Test - [xE2][xC2][xE7][C7][xE8][xC8]..[xF0][xD0][xFB][xDB][xFE][xDE]
b'Test - \xc4\x81\xc4\x80\xc4\x93\xc4\x92\xc4\x8d\xc4\x8c..\xc5\xa1\xc5\xa0\xc5\xab\xc5\xaa\xc5\xbe\xc5\xbd'
b'Test - ??????..\x9a\x8a??\x9e\x8e'
b'Test2 - \xc4\x81\xc4\x80\xc4\x93\xc4\x92\xc4\x8d\xc4\x8c..\xc5\xa1\xc5\xa0\xc5\xab\xc5\xaa\xc5\xbe\xc5\xbd'
Run Code Online (Sandbox Code Playgroud)
print太聪明了......:D使用编码文本是没有意义的print(因为它总是只显示字节的表示而不是实际字节)并且根本不可能输出字节,因为无论如何打印并始终对其进行编码sys.stdout.encoding.
例如:print(chr(255))抛出错误:
Run Code Online (Sandbox Code Playgroud)Traceback (most recent call last): File "Test.py", line 1, in <module> print(chr(255)); File "H:\Python31\lib\encodings\cp1257.py", line 19, in encode return codecs.charmap_encode(input,self.errors,encoding_table)[0] UnicodeEncodeError: 'charmap' codec can't encode …
我在python中做一些脚本.我创建了一个保存在文件中的字符串.这个字符串有很多数据,来自目录的树状和文件名.根据convmv,我所有的树状花序都是UTF-8.
我想把所有内容都保存在UTF-8中,因为我之后会把它保存在MySQL中.现在,在UTF-8的MySQL中,我遇到了一些问题(比如é或è - 我是法国人).
我希望python总是使用字符串作为UTF-8.我在互联网上阅读了一些信息,我确实喜欢这个.
我的脚本以此开头:
#!/usr/bin/python
# -*- coding: utf-8 -*-
def createIndex():
import codecs
toUtf8=codecs.getencoder('UTF8')
#lot of operations & building indexSTR the string who matter
findex=open('config/index/music_vibration_'+date+'.index','a')
findex.write(codecs.BOM_UTF8)
findex.write(toUtf8(indexSTR)) #this bugs!
Run Code Online (Sandbox Code Playgroud)
当我执行时,这里是答案: UnicodeDecodeError: 'ascii' codec can't decode byte 0xc3 in position 2171: ordinal not in range(128)
编辑:我看到,在我的文件中,重音很好写.创建此文件后,我将其读取并将其写入MySQL.但我不明白为什么,但我遇到编码问题.我的MySQL数据库是在utf8中,或者似乎是SQL查询SHOW variables LIKE 'char%'只返回utf8或二进制.
我的功能看起来像这样:
#!/usr/bin/python
# -*- coding: utf-8 -*-
def saveIndex(index,date):
import MySQLdb as mdb
import codecs
sql = mdb.connect('localhost','admin','*******','music_vibration')
sql.charset="utf8"
findex=open('config/index/'+index,'r')
lines=findex.readlines()
for line in lines:
if line.find('#artiste') …Run Code Online (Sandbox Code Playgroud) 我是一个Android新手,我刚刚升级到Android Studio 1.2.当我创建一个新项目(API 16:Android 4.1(Jelly Bean))时,我立即收到以下警告:
警告:项目编码(windows-1252)与Gradle构建文件(UTF-8)中指定的编码不匹配.这可能会导致严重的错误.
更多信息...
打开文件编码设置
这是我没有做过任何更改或编写任何代码.我阅读了有关tools.android.com(http://tools.android.com/knownissues/encoding)的更多信息,但它非常含糊,并假设知道发生了什么(这是"更多信息......"带你).自从我更新到Android Studio 1.2后,我的XML文件中的设计和文本选项卡甚至都不会同步; 在XML文件的文本文件可以的情况下,无法编辑设计选项卡.我认为这是一个相关的问题.
为什么默认情况下它与此编码不匹配,我该怎么办呢?我应该使用什么作为默认编码?
谢谢!
我已经阅读了类似的帖子,他们没有回答我的问题.
在C#中,我有一个我从WebClient.DownloadString获取的字符串.我已经尝试将client.Encoding设置为新的UTF8Encoding(false),但这没有任何区别 - 我仍然在结果字符串的开头以UTF-8的字节顺序标记结束.我需要删除它(用LINQ解析生成的XML),并希望在内存中这样做.
所以我有一个以\ x00EF\x00BB\x00BF开头的字符串,如果它存在,我想删除它.现在我正在使用
if (xml.StartsWith(ByteOrderMarkUtf8))
{
xml = xml.Remove(0, ByteOrderMarkUtf8.Length);
}
Run Code Online (Sandbox Code Playgroud)
但这感觉不对.我已尝试过各种带有流,GetBytes和编码的代码,但没有任何作用.任何人都可以提供"正确"算法从字符串中剥离BOM吗?
谢谢!
我已经简化了我的问题并提供了一个赏金:有 什么选项可以将原始PCM音频数据压缩到Android设备上的mp3.
我的原帖: 我正在Android手机上创建一个合成器,我一直在生成PCM数据发送到扬声器.现在我想知道我是否可以将这个PCM数据编码为mp3以保存到SD卡.所述MediaRecorder对象可以编码音频从麦克风成各种格式的到来,但不允许从程序生成的音频数据的编码.
所以我的问题是,是否有用于编码音频的标准Android API?如果没有,那么基于Java或NDK的纯解决方案是什么?你能推荐其中任何一个吗?
如果不这样做,我只需要将生成的音频保存为WAV文件,我可以轻松完成.
我正在尝试使用正则表达式搜索网页,但我收到以下错误:
TypeError:不能在类字节对象上使用字符串模式
我理解为什么,urllib.request.urlopen()返回一个字节流,所以,至少我猜测,重新不知道要使用的编码.在这种情况下我该怎么办?有没有办法在urlrequest中指定编码方法,或者我需要自己重新编码字符串?如果是这样我想要做什么,我假设我应该从头信息或编码类型中读取编码,如果在html中指定,然后重新编码为它?
在编码可能不安全的数据时,是否有编码的理由>?
attr="data",attr='data',<tag>data</tag>)我认为有人会这样做的原因是
<[^>]+>?(罕见)attr=data.:-o(没发生!)我错过了什么吗?