有人可以推荐韩国,印度尼西亚,泰国和越南的开源POS标签吗?
我可以用来标记我目前拥有的语料库数据.(例如stanford-postagger)
如果你是开发者并且愿意分享并让我测试POS标签,我也不介意.
通过输出的一些修改,我用POS用jvntextpro标记越南数据
但我仍然希望在韩国,印度尼西亚和泰国的POS标签上有更多的意见.
我在我的一个ubuntu 10.10主机上编译了gcc,并将其安装在/ c中.我可以在该主机上编译c和c ++程序,但是当我将/ c(包含bin,libexec等)复制到ubuntu 10.04.2主机时,我得到:
/c/libexec/gcc/i686-pc-linux-gnu/4.5.2/cc1: error while loading shared libraries: libmpc.so.2: cannot open shared object file: No such file or directory
Run Code Online (Sandbox Code Playgroud)
编译简单的.c文件时.
我还从源代码安装和编译了gmp,mpfr和mpc(与我在10.10主机上的版本相同)但是它仍然会出现同样的错误.
我不在每台主机上重新编译gcc的原因是因为它需要太长时间,并且不想使用ubuntu附带的gcc(来自build-essential)deb
请帮忙
我正在创建一个(表现良好的)网络蜘蛛,我注意到一些服务器导致Apache HttpClient给我一个SocketException - 具体来说:
java.net.SocketException: Connection reset
Run Code Online (Sandbox Code Playgroud)
导致这种情况的代码是:
// Execute the request
HttpResponse response;
try {
response = httpclient.execute(httpget); //httpclient is of type HttpClient
} catch (NullPointerException e) {
return;//deep down in apache http sometimes throws a null pointer...
}
Run Code Online (Sandbox Code Playgroud)
对于大多数服务器来说,它很好.但对于其他人来说,它会立即抛出SocketException.
导致立即发生SocketException的站点示例:http://www.bhphotovideo.com/
效果很好(和大多数网站一样):http://www.google.com/
现在,正如您所看到的,www.bhphotovideo.com在Web浏览器中加载正常.当我不使用Apache的HTTP客户端时,它也可以正常加载.(像这样的代码:)
HttpURLConnection c = (HttpURLConnection)url.openConnection();
BufferedInputStream in = new BufferedInputStream(c.getInputStream());
Reader r = new InputStreamReader(in);
int i;
while ((i = r.read()) != -1) {
source.append((char) i);
}
Run Code Online (Sandbox Code Playgroud)
那么,为什么我不只是使用这个代码呢?那么我需要使用Apache的HTTP客户端中的一些关键功能.
有谁知道是什么原因导致某些服务器导致此异常?
迄今为止的研究:
我的本地Mac dev计算机和AWS …
我需要在SQL Server 2008中创建一个存储过程,它将根据某个值更新表.这里的技巧是我需要递归搜索表,直到找到我要查找的值,然后更新当前记录.例如,我有一个包含3列的Employees表:
员工ID
经理ID
FAMILYID
对于表中的每个EmployeeId,我想获得它的ManagerId.然后,如果ManagerID!= 0,去获取当前ManagerId的ManagerId(每个ManagerId将指向一个EmployeeId) - 继续执行此操作直到我到达顶级管理器(其中ManagerId == 0).
一旦找到顶级管理器,我想更新原始记录中的FamilyId列,该记录以上述过程的最后一个EmployeeId的值启动该过程.
基本上我需要对表中的每条记录执行此操作.我正在尝试将FamilyId设置为层次结构中所有员工和经理的根管理器的值.
我不确定是否应该使用游标或CTE来完成这项工作 - 或者只是在代码中执行此操作.
任何帮助是极大的赞赏.
谢谢!
鉴于城市列表和每个城市之间的飞行成本,我试图找到访问所有这些城市的最便宜的行程.我目前正在使用MATLAB解决方案找到最便宜的路线,但我现在想修改算法以允许以下内容:
目前,我忽略了航班日期的问题,并假设可以从任何城市前往任何其他城市.
有没有人有任何想法如何解决这个问题?我的第一个想法是使用像GA或ACO这样的进化优化方法来解决第2点,并根据行程中是否包含返程/往返航班来评估目标函数时简单地调整边权重,但也许其他人有更好的理念.
(注意:我使用的是MATLAB,但我不是专门寻找编码解决方案,更多的是关于可以使用哪种算法的高级想法.)
编辑 - 在考虑了这个之后,允许"重复节点"似乎过于松散了约束.我们可以进一步约束问题,以便尽管可以重复访问节点,但每个有向边只能访问一次.忽略任何不止一次包含同一航班的行程似乎是合理的.
我需要分配4字节内存,分配的内存地址应该是4的倍数.例如:400,404,408,40c
如果我使用任何内存分配功能,我会收到可用的内存,地址不一定是4的倍数.
所以任何人都可以建议实现这个设计.
我试图让我的网络服务器正确gzip一个块响应编码的http响应.
我对非gzip响应的理解是它看起来像这样:
<the response headers>
Run Code Online (Sandbox Code Playgroud)
然后对于每个块,
<chunk length in hex>\r\n<chunk>\r\n
Run Code Online (Sandbox Code Playgroud)
最后,一个零长度的块:
0\r\n\r\n
Run Code Online (Sandbox Code Playgroud)
我试图让gzip压缩工作,我可以使用一些帮助找出实际应该返回的内容.此文档暗示整个响应应该被gzip压缩,而不是gzipping每个块:
HTTP servers sometimes use compression (gzip) or deflate methods to optimize transmission.
Chunked transfer encoding can be used to delimit parts of the compressed object.
In this case the chunks are not individually compressed. Instead, the complete payload
is compressed and the output of the compression process is chunk encoded.
Run Code Online (Sandbox Code Playgroud)
我尝试gzip整个事情并返回响应,即使没有分块,它没有工作.我尝试将Content-Encoding标头设置为"gzip".有人可以解释必须对上述方案进行哪些更改才能支持gzipping的大小调整?谢谢.
我正在尝试使用pgAdmin在Postgres 8.4中创建一个函数,我有以下代码
CREATE OR REPLACE FUNCTION spcwriteperson(IN fname varchar(20))
RETURNS VOID AS
$BODY$
INSERT INTO person ("firstName") VALUES(fname);
$BODY$
LANGUAGE sql VOLATILE
COST 100;
Run Code Online (Sandbox Code Playgroud)
当我尝试运行它时,它抱怨VALUES(fname)的fname不是列.我来自于在MySQL和Sql Server中编写sprocs和函数.任何帮助为什么这不起作用,或我做错了什么?
我正在尝试使用apache commons HTTP Client连接到第三方应用程序API.我正在尝试连接的API是http://wiki.kayako.com/display/DEV/REST+API.
API要求我传递API密钥和签名以及用于创建签名的salt.
根据API文档,这些是创建签名的步骤
更新
根据我得到的回复,我更改了一些代码并使用Kayako创建了一个模拟帐户来测试API
我正在使用以下类来生成签名
import java.io.ByteArrayOutputStream;
import java.io.IOException;
import java.io.UnsupportedEncodingException;
import java.net.URLEncoder;
import java.security.GeneralSecurityException;
import javax.crypto.Mac;
import javax.crypto.spec.SecretKeySpec;
import org.bouncycastle.util.encoders.Base64Encoder;
public class GenSign2 {
public static void main(String[] args) throws GeneralSecurityException,
IOException {
String secretKey = "M2Y2YjkxZDEtYmNlOC1mYmI0LTkxZTgtOTNiY2RiMDhmN2E2YjExNGUwYjktNGJkYy1jZTM0LWQ1MWYtZGIwYWRlZTE0NGNh";
String salt = "0123456789";
String generateHmacSHA256Signature = generateHmacSHA256Signature(salt,
secretKey);
System.out.println("Signature: " + generateHmacSHA256Signature);
String urlEncodedSign = URLEncoder.encode(generateHmacSHA256Signature,
"UTF-8");
System.out.println("Url encoded value: " + urlEncodedSign);
}
public static String generateHmacSHA256Signature(String data, String key) …Run Code Online (Sandbox Code Playgroud) 我一次又一次地搜索,但找不到正确的答案.这是情况.我在同一个php文件中有多个表单,下面显示了代码.
当我回声如下
echo count($_FILES["fileUploadPath"] );
Run Code Online (Sandbox Code Playgroud)
它显示0作为计数和
注意:未定义的索引:C:\ wamp中的addProjectFileUploadPath ...
更新:probelm解决.....错误来自第三方jquery插件称为"fileinput"
c ×2
java ×2
algorithm ×1
apache ×1
c++ ×1
cjk ×1
compilation ×1
encryption ×1
file ×1
function ×1
gcc ×1
graph-theory ×1
gzip ×1
http ×1
httpclient ×1
indexing ×1
memory ×1
nlp ×1
nltk ×1
pgadmin ×1
php ×1
pos-tagger ×1
postgresql ×1
recursion ×1
sockets ×1
t-sql ×1
thai ×1
ubuntu ×1
undefined ×1
upload ×1
web-crawler ×1