我一直在阅读有关解释器/编译器如何工作的一些内容,而我感到困惑的一个领域是AST和CST之间的区别.我的理解是解析器生成一个CST,将它交给语义分析器,将其转换为AST.但是,我的理解是语义分析器只是确保遵循规则.我真的不明白为什么它会实际做出任何改变,使其变得抽象而不是具体.
有没有关于语义分析器的东西,或者AST和CST之间的差异有点人为?
parsing terminology abstract-syntax-tree semantic-analysis concrete-syntax-tree
是否存在用于编程语言的差异/合并工具,它以语法识别的方式工作(如XML Diff Tool),不仅仅是逐行比较(并且可选地忽略空格).
我对实际遵循语言语法和分隔符的程序感兴趣,建议在不破坏语法正确性的情况下进行更改,或者在多行中分隔语句.示例行为是:
*找到一个if(){
引入额外嵌套级别的自动捆绑闭合支撑}
下面的几行.)
*保持匹配语法元素在一起,避免像删除块往往创建的愚蠢:
int function_A()
{
int ret;
ret = something;
ret += something_else;
Run Code Online (Sandbox Code Playgroud)
return ret;
}
int function_B()
{
if(valid)
{
int ret;
ret = something;
ret += something_else;
Run Code Online (Sandbox Code Playgroud)
return ret;
}
Run Code Online (Sandbox Code Playgroud)
else return -1;
}
Run Code Online (Sandbox Code Playgroud)
就个人而言,我很想找到能够处理C++语法的软件,但了解其他语言的解决方案也会很有趣.
如何找到属性是从语法的产生中合成还是继承?
我想因为必须在问题中预定义属性 - 如果它的值取决于子节点或父节点.但有没有办法分析属性是从语法产生继承还是合成.
compiler-construction parsing abstract-syntax-tree context-free-grammar semantic-analysis
是否有我可以阅读的研究论文/书籍可以告诉我手头的问题哪种特征选择算法最有效.
我试图简单地将twitter消息识别为pos/neg(开头).我开始使用基于频率的功能选择(已经开始使用NLTK书)但很快意识到,对于类似的问题,各个人都选择了不同的算法
虽然我可以尝试基于频率,互信息,信息增益和各种其他算法的列表似乎无穷无尽......并且想知道是否有一种有效的方式然后反复试验.
任何建议
我正在尝试创建自己的简单特征选择算法.我要使用的数据集在这里(非常着名的数据集).有人可以给我一个关于如何这样做的指针吗?
我打算为文本分类编写一个特征等级算法.这是对电影评论的情感分析,将其分类为正面或负面.
所以我的问题是如何为文本数据集编写简单的特征选择.
我正在寻找任何免费的工具/组件/库,这些工具/组件/库允许我在.NET应用程序中利用文本挖掘,事实提取和语义分析.
该GATE项目正是我需要的,但它是用Java编写.在.NET世界中有类似GATE的东西吗?
我的挑战是从网站文本内容中提取某些事实.我打算使用一些NLP算法来实现这样的功能,但我不确定如何实现它们,所以如果可用的话,我将使用任何现有的解决方案.
如果你能给我一些提示,我将不胜感激.我是这方面的新手,所以任何相关的信息对我来说都非常有用.
我的表弟创建了一个语义搜索引擎,他声称他的搜索引擎是最准确的。
我见过很多语义搜索引擎,它们对我来说看起来都一样,因为它们的设计目的不是根据您输入的关键字为您提供结果。
那么如果你正在创建一个语义搜索引擎,如何确定其结果的准确性呢?
首先,语义规则和抽象语法树规则是一样的吗?
现在,如果我有语言规范,并且我有CFG,那么我该如何构建抽象语法树规则.任何来源都表示赞赏.谢谢.
文本挖掘 (NLP) 中的情绪(正面和负面)和情绪有什么区别?例如,愤怒是负面情绪,也是负面情绪,两者似乎是一样的。Vijay Nadadur,SentiRank 的创建者,一种对文本中的情绪进行排名的算法,建议生物情绪可以以一种简单的方式主要以二进制格式(+ve 和 -ve)表示。进一步说,你可能会有不同程度的 +ve 和 -ve 情绪,也许是中性的。然而,情绪有多个维度。愤怒肯定是情绪,悲伤也是,但它们并不完全相同。
更具体地说,关于文本挖掘(基于 NLP),进行情感分析要简单得多,但进行情感分析却非常困难。情感分析的下一个层次是意图分析领域,很少有研究人员致力于从文本块中挖掘意图,这似乎具有很高的商业价值。
nlp ×3
parsing ×3
java ×2
.net ×1
algorithm ×1
c ×1
c++ ×1
cvs ×1
data-mining ×1
diff ×1
emotion ×1
merge ×1
nltk ×1
semantic-web ×1
semantics ×1
terminology ×1
text-mining ×1