标签: string-parsing

是否有所有国际句号标点的字符集?

我试图将utf-8字符串解析成"一口大小"的段.例如,我想将文本分解为"句子".

是否有一个全面的字符集(或正则表达式)对应于所有语言的句子结尾?我正在寻找可以捕捉拉丁时期,感叹号和审讯标记,中国和日本句号等的东西.

像上面这样的东西,但相当于一个逗号也会很棒.

unicode parsing character-encoding punctuation string-parsing

7
推荐指数
2
解决办法
1188
查看次数

从location.host获取根域

有很多SO问题似乎可以解决这个问题的变化.但它们往往是复杂的正则表达式答案,我希望我能找到更简单的东西.

给定location.host值

foo.mysite.com
app.foo.mysite.com
mysite.com
Run Code Online (Sandbox Code Playgroud)

我如何获得根域mysite.com

我可以做一些事情,比如找到倒数第二个.,但这看起来很难看,对任何顶级域名都不行.co.uk.如果jQuery有一个包含这些信息的对象,我很乐意使用它.

我的目标是创建存在于所有子域中的cookie.要做到这一点,我需要找到.mysite.com.我不想硬编码.

javascript jquery string-parsing

7
推荐指数
3
解决办法
6660
查看次数

C# - 如何解析文本文件(空格分隔数字)?

给定一个由空格分隔的数据文件,

10 10 10 10 222 331 
2 3 3 4 45
4 2 2 4
Run Code Online (Sandbox Code Playgroud)

如何读取此文件并加载到Array中

谢谢

.net c# string file string-parsing

6
推荐指数
2
解决办法
1万
查看次数

Perl/regex删除字符串的前3行和后3行

我正在寻找构建一个正则表达式语句,以始终删除字符串的前3行,最后3行的字符串(中间部分可以是任意n行内容).任何干净的正则表达式来实现这个输出?(即总是剥去我们的前3行和最后3行的字符串 - 并保留中间部分,这可能是变量#行)

谢谢.

例如

输入字符串:

"
1
2
3
<1...n # of lines content>
4
5
6
"
Run Code Online (Sandbox Code Playgroud)

到期望的输出字符串:

"<1..n # of lines content>"
Run Code Online (Sandbox Code Playgroud)

regex perl string-parsing

6
推荐指数
2
解决办法
1万
查看次数

将keycode的字符串表示形式转换为Qt :: Key(或任何int)并返回

我想将表示键盘上的键的字符串转换为像Qt :: Key(或其他任何东西)的键码枚举.转换示例如下:

  • "Ctrl"Qt::Key_Control
  • "Up"Qt::Key_Up
  • "a"Qt::Key_A
  • "5"Qt::Key_5

如您所见,上面不仅包括字母数字键,还包括修饰符和特殊键.我没有连接到Qt的键码枚举,但似乎Qt拥有在这个分析功能QKeySequencefromString静态函数(见本直接链接):

QKeySequence fromString(const QString & str, SequenceFormat format);
Run Code Online (Sandbox Code Playgroud)

您可能就像我需要这种转换一样.好吧,我有一个由GhostMouse生成的数据文件.这是我输入内容的日志.这是我输入的一个例子" It ":

{SPACE down}
{Delay 0.08}
{SPACE up}
{Delay 2.25}
{SHIFT down}
{Delay 0.11}
{i down}
{Delay 0.02}
{SHIFT up}
{Delay 0.03}
{i up}
{Delay 0.05}
{t down}
{Delay 0.08}
{t up}
{Delay 0.05}
{SPACE down}
{Delay 0.12}
{SPACE up}
Run Code Online (Sandbox Code Playgroud)

所以我需要一种方法将字符串"SPACE"和表示此数据文件中的键的所有其他字符串转换为唯一的int.

c++ qt keycode type-conversion string-parsing

6
推荐指数
1
解决办法
7376
查看次数

在名称空间std中没有名为stoi的成员

我正在测试std::stoi下面链接中找到的函数:http: //en.cppreference.com/w/cpp/string/basic_string/stol
但是我得到了错误:

在名称空间std中没有名为stoi的成员.

我该怎么办?请指教谢谢.

PS:我正在使用Xcode Ide来做我的c ++.

#include <iostream>
#include <string>

int main()  {
   std::string test = "45";
   int myint = std::stoi(test);
   std::cout << myint << '\n';
}
Run Code Online (Sandbox Code Playgroud)

图片

命名空间'std'中没有名为stoi的成员

错误

c++ string parsing compiler-errors string-parsing

6
推荐指数
2
解决办法
1万
查看次数

如何解析 Google Apps 脚本中的网址?

我有一个 GAS 项目,我需要将一些 URL 解析为它们的hostnamepathname属性,如下所示。

代码.gs
const url = new URL( 'http://www.example.com/cats', );
const { hostname,  pathname, } = url;
Run Code Online (Sandbox Code Playgroud)

以下是有关上述 URL 构造函数方法的一些文档。[1] | [2]

上面的代码产生以下错误。

错误信息:

ReferenceError:未定义 URL(第 64 行,文件“Code”)

我缺少什么?如何使用 GAS 解析我的 URL?

javascript url parsing string-parsing google-apps-script

6
推荐指数
1
解决办法
4116
查看次数

从格式为ddMMMyyyy hhmm的字符串解析日期时间(带月份名称)

我有点陷入一个问题,我无法解析字符串中的日期和时间,我正在从文本文件中读取.我得到的字符串采用以下格式:

05SEP1998 2400

我试图通过以下代码解析字符串:

string dateTimeStr = "05SEP1998 2400"

var provider = CultureInfo.InvariantCulture;

const string Format = "ddMMMyyyy hhmm";

var dateTime = DateTime.ParseExact(dateTimeStr, Format, provider);
Run Code Online (Sandbox Code Playgroud)

但在解析时,上面的代码抛出FormatException:

String was not recognized as a valid DateTime.

有人可以帮我解决这个问题吗?

c# string-parsing

5
推荐指数
1
解决办法
2005
查看次数

优化单词解析器

语境:

我有一个代码/文本编辑器,而不是我想要优化.目前,该程序的瓶颈是语言解析器,而不是扫描所有关键字(有不止一个,但它们的编写方式基本相同).

在我的计算机上,编辑器会在1,000,000代码行周围延迟文件.在像Raspberry Pi这样的低端计算机上,延迟开始得更快(我不记得确切,但我想的10,000是代码行).虽然我从来没有看到比1,000,000代码行更大的文档,但我确信它们在那里,我希望我的程序能够编辑它们.

题:

这引出了一个问题:在大型动态字符串中扫描单词列表的最快方法是什么?

以下是可能影响算法设计的一些信息:

  1. 关键字
  2. 限定字符允许成为关键字的一部分(我称之为限定符)
  3. 大字符串

瓶颈的解决方案:

这(大致)是我目前用于解析字符串的方法:

// this is just an example, not an excerpt
// I haven't compiled this, I'm just writing it to
// illustrate how I'm currently parsing strings

struct tokens * scantokens (char * string, char ** tokens, int tcount){

    int result = 0;
    struct tokens * tks = tokens_init ();

    for (int i = 0; string[i]; i++){

        // qualifiers for C are: …
Run Code Online (Sandbox Code Playgroud)

c parsing string-parsing

5
推荐指数
1
解决办法
989
查看次数

自定义解析字符串

在解析FTX(自由文本)字符串时,我需要使用+分隔符将其拆分,但只有在它没有转义字符(例如,?)之前.所以这个字符串nika ?+ marry = love+sandra ?+ alex = love应解析为两个字符串:nika + marry = lovesandra + alex = love.使用String.Split('+')显然是不够的.我可以以某种方式实现吗?

在我看来,一种方法是?+用一些独特的字符(或一连串的字符)来代替,例如,@#@使用"+"作为分隔符拆分然后替换@#@回来+,但这在任何可能的情况下都是不可靠和错误的我能想到的方式.

?仅作为转义字符使用,:或者+在任何其他情况下,它被视为常规字符.

c# string split string-parsing

5
推荐指数
1
解决办法
165
查看次数