我在决定使用哪种方法时遇到了一些麻烦.
我有几个实体"类型",让我们称它们为A,B和C,它们共享一定数量的属性(大约10-15).我创建了一个名为ENTITIES的表,以及每个常用属性的列.
A,B,C也有一些(大部分)唯一属性(所有布尔值,可以是10到30左右).我不确定在对表建模时遵循的最佳方法是什么:
我倾向于使用3,但我想知道是否有更好的解决方案.
我收集了一些"文章",每篇文章长1到10个句子,用嘈杂的非正式英语(即社交媒体风格)写成.我需要从每篇文章中提取一些信息,如可用的日期和时间.我还需要了解文章的内容以及谁是主要的"演员".
举例说明:"从明天早上10点30分开始,每个人都需要出席,讨论公司的财务预测." ,我需要提取:
据我所知,可以在不使用NLP技术的情况下提取日期和时间,但我没有在Python中找到与Natty(http://natty.joestelmach.com/)一样好的东西.
在阅读了NLTK书的一些章节并观看了Coursera上NLP课程的一些视频后,我对如何继续进行的理解如下:
我可以(暂时)跳过1,2和3并产生一个有效但可能具有高错误率的实现吗?我应该使用哪种语料库?
我还在考虑一个预处理步骤,以纠正常见的拼写错误或快捷方式,如"yess","c u"和其他可恶的错误.我已经存在的任何东西都可以利用吗?
简而言之,问题是:我解决这个问题的方法是否正确?如果没有,我做错了什么?
我需要编写一个读取用户输入的谓词。如果输入为“yes”(理想情况下为“yes”或“y”),则必须为参数分配“yes”,如果有任何不同,则必须分配“no”。
askContinue(Answer) :-
write("Would you like to continue ? "), read(Input), nl,
(Input = "yes" -> Answer = true ; Answer = false).
Run Code Online (Sandbox Code Playgroud)
输出是:
?- askContinue(A).
Would you like to continue ? yes.
A = false.
?- askContinue(A).
Would you like to continue ? no.
A = false.
Run Code Online (Sandbox Code Playgroud)
我究竟做错了什么 ?