问题列表 - 第9151页

将文本解析成句子?

我试图将PDF页面的文本解析为句子,但这比我预期的要困难得多.有很多特殊情况要考虑,例如首字母,小数,引号等,其中包含句点但不一定结束句子.

我很好奇这里是否有人熟悉用于C或C++的NLP库,可以帮助我完成这项任务或提供任何建议?

感谢您的任何帮助.

c c++ parsing nlp

3
推荐指数
1
解决办法
3270
查看次数

实例化一个新的stl向量

我有一个情况,我有一个指向stl向量的指针

所以喜欢

vector<MyType*>* myvector;
Run Code Online (Sandbox Code Playgroud)

我必须在构造函数中将此指针设置为NULL,然后在触摸属性时延迟加载.

我如何将其实例化为向量的新实例?

c++ stl

4
推荐指数
2
解决办法
4万
查看次数

SQL存储过程设计问题

我最近看到一个数据库,其中有一个Types带有列的表Id,KeyName.

Id只是该类型的ID,是该类型Key的短键名称,例如"啤酒",以及Name可以为用户显示的文本(例如,"我们最棒的啤酒").Id当然是独一无二的,是本表的主要关键.钥匙也很独特.其他表总是使用其Id列与表类型链接,但存储过程始终使用Key进行过滤(例如,"X inner join Types on X.type_Id = Types.Id where Types.Key = 'beer' "而不是"X.type_Id = 3").

我认为这是一种糟糕的做法.我会使用Id而不是Key,即使我知道Key是独特的.我认为Key可能(并且可以)改变但是Id不应该改变,因为它在另一个表中用于链接.有没有做不这样做的规则?我的意思是,如果我们将Key"啤酒"改为"啤酒",一些存储过程将停止正常工作(实际上存在这种情况).对我来说,非常直观的是,如果Id标识表中的行,我们应该始终使用id,因为其他属性可能会在需要时更改,并且不应该导致问题.我对吗?

sql database-design primary-key

2
推荐指数
1
解决办法
267
查看次数

学习Sparx Enterprise Architect的免费Step by Step指南

我刚刚下载了Sparx Enterprise Architect 7.5,但遗憾的是我无法找到入门指南或类似内容.

我已经浏览了Sparx的官方网站,但没有一步一步的指导学习Sparx EA.

我想要一个指南,它将实现一个小项目并逐步提供说明,以便我能够理解并试用Sparx EA.

我确实找到了一些销售分步指南的网站,但在这个时候我不想花钱买它们.

enterprise-architect

15
推荐指数
2
解决办法
4万
查看次数

(U)Ruby Extensions:rb_gc_mark()和实例变量

我正在编写一个定义类的ruby扩展.如果我Data_Wrap_Struct()用来实现我的回调rb_define_alloc_func(),我是否需要手动标记并释放实例变量?或者这仍然是为我处理的?

c ruby mark-and-sweep ruby-c-extension

6
推荐指数
1
解决办法
898
查看次数

在ColdFusion中调用远程API偶尔会导致超时

我在我公司的网站上有一个函数,它使用cgi.remote_host变量调用hostip.info提供的API 并返回orgin的国家/地区.这应该是这样的:

  • 该函数从API中查找国家/地区,
  • 对我们的本地数据库运行查询,以确定我们要将用户转发到哪个站点,以及
  • 将用户重定向到适当的站点.

如果由于任何原因,我们无法将国家/地区与我们的某个地区相关联,我们会将用户重定向到默认网站.

什么实际发生的情况是,偶尔,我们的服务器无法定位API,我们得到一个超时错误.

这是我们要求获得领土的功能的代理:

<cffunction name="getGeoInfo" access="public" output="true" returntype="any" hint="call getGeoIP API and check country against DB">
    <cfargument name="IPAddress" required="yes" type="string" />

    <!--- Calling hostip API to get our Geo IP information --->
    <cfhttp url="http://api.hostip.info/?ip=#arguments.IPAddress#" method="get" result="geoIP" />

    <!--- Try to parse the file, if it can't parse, we don't create the variable --->
    <cftry>
        <cfset geoIPXML = xmlParse(geoIP.fileContent) />
    <cfcatch type="any" />
    </cftry>

    <!--- If variable was …
Run Code Online (Sandbox Code Playgroud)

coldfusion

2
推荐指数
1
解决办法
2015
查看次数

什么是最先进的纯Python,XML解析器?

考虑到我想编写将在Google App Engine上运行的python代码以及jython内部的C代码,C扩展不是一个选项.Amara是一个不错的库,但由于它的C扩展,我不能将它用于这些平台中的任何一个.

python xml google-app-engine jython

5
推荐指数
1
解决办法
1308
查看次数

如何停止单击两次Windows窗体按钮

我在表单上有一个提交Web请求的Windows窗体按钮.我希望能够在第一次单击时禁用该按钮,然后在收到响应时重新启用它.我没有太多控制被调用的代码以及如何调用它所以我可以使用的是Button事件,或者我可以创建自己的按钮,继承自Button,如下所示:

public class SingleClickButton : Button
{
    protected override void OnClick(EventArgs e)
    {
        bool wasEnabled = this.Enabled;
        this.Enabled = false;

        if (wasEnabled)
        {
            base.OnClick(e);
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

我必须最后调用基本OnClick方法,因为在Web请求完成之前按钮不会禁用.

我遇到的问题是,如果用户多次单击,则单击事件似乎会累积并且仍然执行.有没有办法取消所有排队的活动?或者是否有一个更简单的解决方案来解决我的问题?

.net button winforms

1
推荐指数
1
解决办法
5325
查看次数

如何剥离mIRC用户使用的颜色代码?

我正在使用irclib在Python中编写IRC bot,我正在尝试在某些频道上记录消息.
问题是一些mIRC用户和一些Bots使用颜色代码编写.
有关如何剥离这些部分并只留下明确的ascii文本消息的任何想法?

python irc

6
推荐指数
2
解决办法
7692
查看次数

如何找出哪些数据不会被投射?

我有一个SQL表,其日期字段定义为char(8)或20090609,时间字段定义为char(4)或1230.我将此数据移动到另一个表中,我想将两个字段组合在一起将它们放在新表中的smalldatetime字段中.我的查询是这样的:

INSERT NewTable(eventdate) 
SELECT
  CAST((datecol + ' ' + substring(timecol, 1, 2) + ':' + substring(timecol, 3, 2)) as smalldatetime)
FROM OldTable
Run Code Online (Sandbox Code Playgroud)

当我运行它时,我收到一个错误:

将char数据类型转换为smalldatetime数据类型会导致超出范围的smalldatetime值.

我已经尝试检查len(datecol)和len(timecol)以确保它们至少是正确的字符数.我不知道如何找到有问题的数据,有什么建议吗?数据库是SQL2000,我正在使用SMO 2008.

sql t-sql sql-server-2000

2
推荐指数
1
解决办法
369
查看次数