小编And*_*NER的帖子

理论:"词汇编码"

我使用"Lexical Encoding"这个词来表示我缺少一个更好的词汇.

一句话可以说是通信的基本单位,而不是一封信.Unicode尝试为所有已知字母表的每个字母分配一个数值.什么是一种语言的信,是另一种语言的雕文.Unicode 5.1当前为这些字形分配超过100,000个值.在现代英语中使用的大约180,000个单词中,据说用大约2,000个单词的词汇表,你应该能够以一般的方式进行交谈."Lexical Encoding"会对每个Word进行编码而不是每个Letter,并将它们封装在一个句子中.

// An simplified example of a "Lexical Encoding"
String sentence = "How are you today?";
int[] sentence = { 93, 22, 14, 330, QUERY };
Run Code Online (Sandbox Code Playgroud)

在此示例中,String中的每个Token都被编码为Integer.这里的编码方案根据字使用的广义统​​计排序简单地分配了一个int值,并为问号分配了一个常量.

最终,一个词既有拼写也有意义.任何"词法编码"都会保留句子的意义和意图,而不是语言特定的.英语句子将被编码为"......意义上的语言中性原子元素......",然后可以将其重构为具有结构化句法形式和语法结构的任何语言.

"Lexical Encoding"技术的其他例子是什么?


如果您对单词使用统计信息的来源感兴趣:http:
//www.wordcount.org

theory encoding nlp linguistics

4
推荐指数
1
解决办法
1845
查看次数

C:通过void*返回的函数

来自Java我很困惑使用Void允许返回值如下:

void *emalloc(size_t s) {  
    void *result = malloc(s);  
    if (NULL == result) {  
        fprintf(stderr, "MEMORY ALLOCATION FAILURE\n");  
    exit( EXIT_FAILURE );  
    }  
    return result;  
}  
Run Code Online (Sandbox Code Playgroud)

这会返回指向分配内存的指针吗?

c memory malloc pointers void-pointers

4
推荐指数
3
解决办法
9779
查看次数

Java:三重卷曲支撑

我收到了一些评论代码,不像我以前遇到过的任何代码:

//{{{ Imports
import imports;
//}}}
Run Code Online (Sandbox Code Playgroud)

每个方法块都是一样的,

//{{{ above the code block  
//}}} below the code block
Run Code Online (Sandbox Code Playgroud)

另见:http://en.wikipedia.org/wiki/Folding_editor

java coding-style folding

3
推荐指数
1
解决办法
983
查看次数

系统调用:UNIX,Linux,BSD和Solaris变体

主要*NIX变体中系统调用量之间是否存在差异?

普遍支持哪些系统调用?

unix linux bsd solaris system-calls

3
推荐指数
2
解决办法
2879
查看次数

Java:同步实用程序

我问这纯粹是为了确定在课程中实施课程的有价值的...

您是否知道Java实用程序类采用未同步的实例,使用反射来调查该实例,并在同步调用中返回"包装"的输入实例?

(即:为任何实例创建同步委托类的工厂)

java synchronization utilities

3
推荐指数
2
解决办法
1529
查看次数

C:有效的宏用法

#ifndef MACROS_NULLCHECK_H_
#define MACROS_NULLCHECK_H_

#include <assert.h>

#define NULLCHECK(x) assert(x != (void *) 0);

#endif
Run Code Online (Sandbox Code Playgroud)

如果我使用上面的样式作为声明宏的模板,你会有什么附带条件?

c macros

3
推荐指数
1
解决办法
729
查看次数

散列多个文件

问题规范:

给定一个目录,我想遍历目录及其非隐藏的子目录,
 并在非隐藏文件的名称中添加一个漩涡哈希.
如果脚本重新运行,它将用新的哈希替换旧哈希.

<filename>.<extension>   ==>  <filename>.<a-whirlpool-hash>.<extension>

<filename>.<old-hash>.<extension>   ==>  <filename>.<new-hash>.<extension>


题:

a)你会怎么做?

b)在您可用的所有方法中,是什么让您的方法最合适?


判决:

谢谢大家,我选择了SeigeX的答案,因为它具有速度和便携性.
它在经验上比其他bash变种更快,
 并且它在我的Mac OS X机器上没有改变.

python bash perl hash batch-processing

3
推荐指数
1
解决办法
3516
查看次数

数学:分解

省略计算素数的方法的细节,以及因子分解的方法.

为什么要费心去做?

它的应用是什么?

algorithm math primes methodology

2
推荐指数
1
解决办法
458
查看次数

特定于上下文的拼写引擎

我相信你们中的一些人会看到Google Wave的演示.我特别想知道拼写检查技术.一个拼写检查器是多么具有革命性,它通过弄清楚一个单词在句子中出现在哪里来提出这些建议?

我之前没有见过这种技术,但其他地方有这样的例子吗?
如果有,那么代码示例和文献在其工作中是什么?

spell-checking google-wave

2
推荐指数
1
解决办法
1268
查看次数

通过并行性最大化处理速度

是否存在任何比线性速度增加更多来自并行化算法的情况?

parallel-processing big-o

1
推荐指数
1
解决办法
139
查看次数

个人预处理器指令

作为C新手,我想听听Macro"定义"的开发人员正在使用什么.我一直在考虑将这些放在标题中以跳过我已经习惯的冗长:

#define TS_ typedef struct {  
#define _TS(x) } x;

#define I(x)_ { int i; for ( i = 1; i <= x; i++ ) {  
#define _I } }
Run Code Online (Sandbox Code Playgroud)

我可以在这些宏中添加\n\t等吗?因为我想传递我的源代码减去额外的包括:

#define TS_ typedef struct {\n
#define _TS(x) } x;\n

#define I(x)_ { int i;\n\tfor ( i = 1; i <= x; i++ ) {\n 
#define _I \t}\n}\n
Run Code Online (Sandbox Code Playgroud)

这些会有用吗?

即:我可以使用预处理器将我的源代码替换为我的个人包含格式化源代码而不包含吗?

链接到良好的预处理器提示和技巧也赞赏.

c macros c-preprocessor

1
推荐指数
2
解决办法
421
查看次数