标签: non-ascii-characters

将矩形打印到终端

我正在尝试为 Linux 编写一个看起来像 MS-DOS 的文本编辑器EDIT

但是,我陷入困境,因为我不知道如何在编辑器屏幕和对话框周围绘制细矩形。我知道 Linuxdialog命令可以做类似的事情:

我怎样才能在屏幕周围绘制这样的矩形(最好没有诅咒)?

c linux non-ascii-characters

2
推荐指数
1
解决办法
5580
查看次数

如何声明数据框中所有字符列的编码?

从Windows 机器上的包加载数据,编码很糟糕。

\n\n
require(vegdata)\ntax_dbf <- load.taxlist("GermanSL 1.3", detailed=TRUE)\ntax_dbf[33,"BEGRUEND"]\n
Run Code Online (Sandbox Code Playgroud)\n\n
\n

[1] " "Einf\xc3\x83\xc2\xbcgen einer Zwischenebene""

\n
\n\n

我可以解决这个问题:

\n\n
Encoding(tax_dbf$BEGRUEND) <- "UTF-8"\ntax_dbf[33,"BEGRUEND"]\n
Run Code Online (Sandbox Code Playgroud)\n\n
\n

[1]“Einf\xc3\xbcgen einer Zwischenebene”

\n
\n\n

然而,我没有找到一种简单的方法来声明 df 中所有字符列的编码,而且我的 SO 搜索 foo 今天也很弱。\n这真是令人困惑。

\n\n

tidyverse 中的任何人都可以为我的散文提供单行文字吗?

\n

encoding r character-encoding non-ascii-characters dataframe

2
推荐指数
1
解决办法
2776
查看次数

从 Snowflake 中的字符串中删除非 ASCII 字符

如何从 Snowflake SQL 中的字符串中删除所有非 ASCII 字符?我遇到过使用 T-SQL 等的解决方案,但没有关于如何在雪花中执行此操作的文章。

sql non-ascii-characters snowflake-cloud-data-platform

2
推荐指数
1
解决办法
7608
查看次数

Ada 程序文本的实际字符集在哪里定义?

我正在尝试制作一个树守护者解析器,以便 IDE(在本例中为 Vim)可以解析 Ada 程序文本并进行更高级的操作,例如提取子程序和重命名变量。但定义字符集似乎存在一些问题。

\n

Ada 2012 参考手册中,我发现了一系列模糊的类别描述,其形式为“任何一般类别为 X 的字符”,这意味着,例如,除了下划线之外,所有这些( \xe2\x80\xbf \xe2\x81\x80 \xe2\x81\x94 \xef\xb8\xb3 \xef\xb8\xb4 \xef\xb9\x8d \xef\xb9\x8e \xef\xb9\x8f \xef\xbc\xbf) 是也允许在标识符中使用,这似乎很荒谬,并且 GNAT 会以“非法字符”拒绝。该列表的开头是这样的声明:

\n

“未指定实现 Ada 程序文本的视觉表示所使用的实际图形符号集。”

\n

这是否真的意味着无法知道应该接受哪些字符?

\n

上的两页中,这些示例被明确指定为有效标识符,但 GNAT 2021 拒绝了它们:

\n
procedure Main is\n   \xce\xa0\xce\xbb\xce\xac\xcf\x84\xcf\x89\xce\xbd  : constant := 12;     -- Plato\n   \xd0\xa7\xd0\xb0\xd0\xb9\xd0\xba\xd0\xbe\xd0\xb2\xd1\x81\xd0\xba\xd0\xb8\xd0\xb9 : constant := 12;  -- Tchaikovsky\n   \xce\xb8, \xcf\x86 : constant := 12;        -- Angles\nbegin\n   null;\nend Main;\n
Run Code Online (Sandbox Code Playgroud)\n
$ gprbuild\nusing project file foo.gpr\nCompile\n   [Ada]          main.adb\nmain.adb:2:04: error: declaration expected\nmain.adb:2:05: …
Run Code Online (Sandbox Code Playgroud)

ada non-ascii-characters

2
推荐指数
1
解决办法
301
查看次数

如何将字符串中的“Umlaute”(ü) 转换为“ue”?

我有一个看起来像这样的字符串,例如L\xc3\xbcbeck N\xc3\xbcrnberg \xc3\x96sterreich带有“Umlaute”。

\n

现在我想要split它并在字符串上添加新的“单词”,如下所示L\xc3\xbcbeck N\xc3\xbcrnberg \xc3\x96sterreich Luebeck Nuernberg Oesterreich

\n

\xc3\xa4应该是这样ae\xc3\xb6应该是这样oe\xc3\xbc应该是这样ue

\n

但我不知道如何实现这一目标,谢谢!

\n
DATA: lt_split TYPE TABLE OF char40.\n\nSPLIT string AT space INTO TABLE lt_split.\n
Run Code Online (Sandbox Code Playgroud)\n

string abap replace non-ascii-characters

2
推荐指数
1
解决办法
758
查看次数

如何将字符串中的\ xA0(或非ASCII)字符替换为''?

我有一个包含大量非ASCII字符的excel文件,我想用空格字符替换它.

此文本将输入MySQL数据库,并且不会在字符串中使用这些字符导入.我HY000 Incorrect string value试图发布该行时得到一个.

delphi string non-ascii-characters

1
推荐指数
1
解决办法
3052
查看次数

Google App Engine上的Python中的Unicode

我需要发出一个POST请求,其中的数据可能是非ascii(中文,日文字符).我需要将输入转换为unicode并使用utf-8进行编码.我是这样做的:

foo = unicode(self.request.get('foo'), 'utf-8') #convert to unicode
foo = foo.encode('utf-8')                       #encode with utf-8
data = {'foo': foo}
payload = urllib.urlencode(data)
Run Code Online (Sandbox Code Playgroud)

但是,我在日志中不断收到此错误:

TypeError:不支持解码Unicode

python unicode google-app-engine non-ascii-characters

1
推荐指数
1
解决办法
4424
查看次数

为什么这个字母会停止我的程序?

换行符在c ++中是否具有某种特殊意义?它是非ASCII字符吗?

我正在尝试为更大的文本中的每个唯一的n字符子串构建马尔可夫链.每当我遇到一个新的唯一子字符串时,我将其输入到一个映射中,该映射的值为256个元素的向量(扩展ASCII表中每个字符的一个元素).

打印出文件的全部内容时没有问题("lines"是使用ifstream和getline构建的文本行的向量):

for(int i=0; i<lines.size(); i++) cout << lines[i] << endl;
Run Code Online (Sandbox Code Playgroud)

整个文本文件显示在控制台中.当我尝试将换行符返回到期望char的函数时,会出现问题."moveSpaces"是一个整数常量,用于确定每次迭代时字符串向量中前进多少个字符.

char GetNextChar(int row, int col){
    for (int i=0; i<MOVESPACES; i++) {
        if (col+1<lines[row].size()) {
            col+=1;
        } else {        // If you're not at the end of the line keep going
            row+=1;     // Otherwise, move to the beginning of the next row
            col=0;
        }
    }
    return lines[row].at(col);
}    
Run Code Online (Sandbox Code Playgroud)

我已经使用了调试器,当它到达第二行的第一列时,它就会对我产生影响 - 没有任何错误或任何错误.它在此函数中失败,而不是调用函数.

我正在使用的文件是圣诞颂歌(Project Gutenberg的第一件事).这里有前几行参考:

STAVE I:  MARLEY'S GHOST

MARLEY was dead: to begin with. There is no doubt …
Run Code Online (Sandbox Code Playgroud)

c++ ascii non-ascii-characters

1
推荐指数
1
解决办法
122
查看次数

将法语口音转换为百分比编码

我有一个简单的

String abc = "réunion";
Run Code Online (Sandbox Code Playgroud)

我应该将此字符串转换为URL百分比编码 - 所以我需要:

String abc = "r%c3%a9union";
Run Code Online (Sandbox Code Playgroud)

这有什么简单的解决方案?

java encoding non-ascii-characters

1
推荐指数
1
解决办法
3675
查看次数

如何将非ascii字符打印为\ uXXXX

# what I currently have

print('??')

# ??
Run Code Online (Sandbox Code Playgroud)
# this is what I want

print('??')

# \uXXXX \uXXXX
Run Code Online (Sandbox Code Playgroud)

我该怎么做呢?我想将字符串中的所有非ascii字符打印为unicode escape literals

python unicode non-ascii-characters python-3.x python-3.4

1
推荐指数
1
解决办法
1599
查看次数