小编She*_*har的帖子

如何优化正则表达式性能?

我有一个很长的正则表达式.我的正则表达式是大约5000或更多短语的组合.

此外,我正在执行正则表达式的文本也很庞大.文字大小约为5kb.

因为正则表达式和输入文本都是巨大的,所以执行正则表达式至少需要2分钟,这在我的项目中是不可接受的.

所以,我想知道如何优化这一点.我能想到的一种方法是拆分正则表达式并使用多个线程来最小化执行时间.这是正确的选择还是有其他方法吗?

我的正则表达式的一部分看起来像这样:

(ACS | ADDR.com Technologies | ADP private limited | ADP | ADP India private limited | AIT Software Services PTE limited | AMK Technologies private limited | ANMSoft Technologies private limited | ANZ Information Technology private limited | ASD Global India private Limited | ASD India private有限公司| ASM Technologies私人有限公司| AXA集团解决方案印度私人有限公司| AXA技术印度有限公司| Aarkay Infonet私人有限公司| AbsolutData研究与分析私人有限公司|埃森哲印度私人有限公司|埃森哲服务印度|埃森哲服务有限公司|埃森哲服务私人有限公司|埃森哲|埃森哲软件私人有限公司| Accurum India私人有限公司| AceTechnologies公司| Aclat公司| AcmeCeeYess Softech私人有限公司| Adaequare印度私人有限公司| Adaequare私人有限公司| Adea International私人有限公司| Adea Technologies | Adeptra | Aditi Technologies | Adob​​e Systems | …

c# regex performance c#-2.0

7
推荐指数
3
解决办法
3611
查看次数

无法从Eclipse中启动JBoss

我无法从eclipse Indigo启动JBoss服务器5.1.0.GA版本.

Eclipse向我显示消息框,说' 本地主机上服务器JBoss v5.0无法在500秒内启动.如果服务器需要更多时间,请尝试在服务器编辑器中增加超时.'但是在控制台窗口中我可以看到JBoss实际上已经启动了.

这是我在日食的控制台窗口中可以看到的日志的一部分:

    SecureDeploymentManager/remote - EJB3.x Default Remote Business Interface
    SecureDeploymentManager/remote-org.jboss.deployers.spi.management.deploy.DeploymentManager - EJB3.x Remote Business Interface

15:14:20,212 INFO  [SessionSpecContainer] Starting jboss.j2ee:jar=profileservice-secured.jar,name=SecureManagementView,service=EJB3
15:14:20,212 INFO  [EJBContainer] STARTED EJB: org.jboss.profileservice.ejb.SecureManagementView ejbName: SecureManagementView
15:14:20,222 INFO  [JndiSessionRegistrarBase] Binding the following Entries in Global JNDI:

    SecureManagementView/remote - EJB3.x Default Remote Business Interface
    SecureManagementView/remote-org.jboss.deployers.spi.management.ManagementView - EJB3.x Remote Business Interface

15:14:20,252 INFO  [SessionSpecContainer] Starting jboss.j2ee:jar=profileservice-secured.jar,name=SecureProfileService,service=EJB3
15:14:20,262 INFO  [EJBContainer] STARTED EJB: org.jboss.profileservice.ejb.SecureProfileServiceBean ejbName: SecureProfileService
15:14:20,272 INFO  [JndiSessionRegistrarBase] Binding the following Entries in …
Run Code Online (Sandbox Code Playgroud)

eclipse jboss

7
推荐指数
1
解决办法
2万
查看次数

为什么这个gradle构建脚本不编译java类?

我想Cascading在我的Hadoop项目中使用.我试图实现Enterprise Data Workflows with Cascading书中给出的第一个例子.我编写了包含Cascading相关代码的java类,我有另一个build.graddle文件,它应该编译该java类并从中构建jar文件.

我的文件夹结构如下:

  • main_folder

    • 不耐烦

      • Main.java
      • 的build.gradle

我的build.gradle文件如下所示:

apply plugin: 'java'
apply plugin: 'idea'
apply plugin: 'eclipse'

archivesBaseName = 'impatient'
repositories {
    mavenLocal()
    mavenCentral()
    mavenRepo name: 'conjars', url: 'http://conjars.org/repo/'
}
ext.cascadingVersion = '2.1.0'
dependencies {
    compile( group: 'cascading', name: 'cascading-core', version: cascadingVersion )
    compile( group: 'cascading', name: 'cascading-hadoop', version: cascadingVersion )
}
jar {
    description = "Assembles a Hadoop ready jar file"
    doFirst {
        into( 'lib' ) …
Run Code Online (Sandbox Code Playgroud)

cascading gradle

7
推荐指数
1
解决办法
6238
查看次数

如何使用Java解压缩COMP-3数字?

我有庞大的主机文件,该文件中有一些打包的数字.我想知道如何使用java解压缩后续数字?

打包数字: ?

我阅读了解包数字的教程,并找到了以下规则来计算解包数字所需的字节数:

total_number_of_bytes = (no. of digits + 1) / 2

我写了以下代码来解压缩数字:

public String unpackData(String packedData, int decimalPointLocation) {
        String unpackedData = "";
        char[] characters = packedData.toCharArray();
        final int impliedPositive = 15;
        final int positiveNumber = 12;
        final int negativeNumber = 13;
        for (int currentCharIndex = 0; currentCharIndex < characters.length; currentCharIndex++) {
            byte[] unpackedDigits = unpackByte((byte) characters[currentCharIndex]);
            if(currentCharIndex == (characters.length - 1)) {
                if(unpackedDigits[1] == impliedPositive || unpackedDigits[1] == positiveNumber) {
                    unpackedData += String.valueOf(unpackedDigits[0]);
                } else if(unpackedDigits[1] == …
Run Code Online (Sandbox Code Playgroud)

ascii mainframe ebcdic packed-decimal

7
推荐指数
1
解决办法
1万
查看次数

当根节点有属性时如何选择xml根节点?

我正在尝试使用 XPath 查询选择 xml 文档根节点的所有子节点。

我的 xml 文件如下所示:

<?xml version="1.0" encoding="UTF-8" ?> 
<root>
    <automotive_industry>
        <automotive /> 
        <rail_global_services /> 
    </automotive_industry>
</root>
Run Code Online (Sandbox Code Playgroud)

<?xml version="1.0" encoding="UTF-8" ?> 
<root xmlns="http://www.my_department.my_company.com/project_name">
    <automotive_industry>
        <automotive /> 
        <rail_global_services /> 
    </automotive_industry>
    </root>
Run Code Online (Sandbox Code Playgroud)

选择根节点的C#代码如下:

XmlDocument gazetteDocument = new XmlDocument();
gazetteDocument.Load(xmlFilePath);
XmlNodeList allNodes = gazetteDocument.SelectNodes("root");
Run Code Online (Sandbox Code Playgroud)

此代码工作正常,当根节点没有任何属性时,它会选择根节点的所有子节点,也就是说,它适用于第一个 xml 文件,但不适用于第二个 xml 文件,因为第二个文件具有 xmlns 属性。

有谁知道当根节点有属性时如何选择根节点的所有子节点?

编辑: 我发现一个 XPath 查询:/*该查询选择根节点,无论它是否有任何属性。一旦选择了根节点,我就可以迭代它的所有子节点。

c# xml xpath

5
推荐指数
1
解决办法
5121
查看次数

如何生成geoJson数据?

我想为一个国家及其所有州生成geoJson数据.在我看到的所有例子中,所有数据都是针对美国的.

我想知道在哪里以及如何获取其他国家及其相应所有州的geoJson数据?它甚至可能吗?

json geojson

5
推荐指数
2
解决办法
1万
查看次数

如何在不使用Compass和SASS的情况下创建ExtJS 4主题?

我想为基于ExtJS 4的应用程序创建自定义主题.我阅读了ExtJS文档,发现我们需要安装Ruby,Compass和SASS来创建自定义主题.

由于我不确定我的客户(以及我的雇主)是否允许我安装这3个工具,我想知道是否可以在不使用这些工具的情况下创建自定义主题?

提前致谢 !

css themes extjs4

5
推荐指数
1
解决办法
1390
查看次数

Eclipse 构建项目“设置类路径容器”需要大量时间

我的 Eclipse Indigo 遇到了奇怪的问题。我有一个 Maven 项目,我想为某些类运行一些 JUnit 测试用例。

每当我尝试运行测试时,eclipse 都会在 35% 处挂起,并且该进度条下方的文本表示它是setting classpath containers.

这一步需要很长时间。我也等了超过 15 分钟,但测试也没有运行。

我无法从 Eclipse 退出,因为setting classpath containers步骤仍在进行中。所以我杀死了 Eclipse 进程并重新启动了 Eclipse,但也出现了同样的问题。

我试图清理项目,更新 Maven 依赖项并刷新项目,但没有任何帮助。

任何人都知道为什么这个问题会出现在 Eclipse 中?以及如何解决这个问题?

eclipse eclipse-indigo

5
推荐指数
1
解决办法
8047
查看次数

来自GATE教程网站的简单JAPE语法不起作用

我正在学习GATE和JAPE语法.这是我第一次使用GATE和JAPE语法.我正在学习教程,其中给出了识别运动的语法.我使用了这个.jape文件和示例文本,但GATE无法识别除人员,组织,日期等之外的任何内容.

我想知道如何.jape在GATE中使用自定义语法?如果有人可以你采取措施,那将是非常好的.

目前我正在做以下步骤:

  1. 启动GATE GUI.

  2. 加载带有默认值的ANNIE系统.

  3. 步骤(2)加载ANNIE POS Tagger,tokenizer,句子分割器等Processing Resources.

  4. 右键单击Processing Resources并选择New -> JAPE Transducer.

  5. .jape文件路径并给出一些名称.

  6. 右键单击Language Resources并选择New -> GATE Corpus.给语料库命名.

  7. 右键单击新创建的语料库并选择Populate.

  8. 选择存在文本文件的目录.我们想在这些文件上运行GATE.

  9. 双击节点ANNIE下方Applications,然后单击Run This Application按钮.

一旦我点击Run This Application按钮,所有处理完成,我打开输入文本文件.

此文件没有任何标记写入.jape文件,它只显示正常标签,如人员,组织等.

在此输入图像描述

我的.jape文件如下所示:

Phase:firstpass
Input:  Lookup  
Options: control = brill

Rule: SportsCategory
Priority: 20
(
{Lookup.majorType == "Sports"} …
Run Code Online (Sandbox Code Playgroud)

grammar gate

5
推荐指数
1
解决办法
3142
查看次数

如何使用 Apache Tika 获取 PDF 中元素的样式信息?

我正在使用 Apache Tika 从 PDF 文件中提取文本。我想知道如何使用 Apache Tika 获取样式信息,例如字体大小、文本颜色、特定文本(几个单词)是否为斜体、粗体等?

是否有可能获得此类信息?

我还想知道是否可以使用 Apache Tika 获取表信息?表格开始、第一行开始、第一个单元格等信息。

pdf pdfbox apache-tika

5
推荐指数
1
解决办法
3527
查看次数