请指教.我是一名律师,我在法律信息学领域工作.我很长一段时间都是程序员(Basic,RPG,Fortran,Pascal,Cobol,VB.NET,C#).我目前对F#感兴趣,但我想要一些建议.我担心的是F#似乎适合数学应用.而我想要的是需要大量的布尔数学运算和文本的自然语言处理,如果成功,还需要语音.我担心文本处理.
我收到了革命性的PROLOG源代码(法律领域的革命,特别是争议解决).该计划通过评估两个辩论方提出的是 - 否(真假)论点来解决争议.现在,我正在学习PROLOG,所以我可以将程序提升到另一个层次:当它们既不是是或否时,评估论证的强度,但在论证过程中是一个有说服力的元素.
因此,该程序处理论证的辩证法方面,我希望它开始处理论证的修辞方面,或至少某些方面.
目前该程序可以管理形式逻辑.我想要的是开始管理非正式逻辑的某些方面,为此我需要解析字符串(长字符串,可能是ms字文档)来检测文本标记,像"但是""因此""然而"这样的单词"自"等等,只需要在任何语音(口头或书面)和标记中查找一长串单词,然后评估标记的左侧和右侧.根据标记,两侧被视为强或弱.
最初,我想到将Prolog程序移植到C#并使用Prolog库.然后,它对我来说也许它可能在纯F#中更好.
我刚刚发现了Alice和Scratch.我很快就会实施这些.但是,我想知道,对于一年级到第四/第五年级的孩子来说,什么是好材料?
C#和VB.NET中的字符串处理对我来说很容易,但是理解如何在F#中做同样的事情并不那么容易.我正在读两本Apress F#书(基础和专家).大多数样本都是数字运算,而且我认为,字符串操作很少.特别是,seq {sequence-expression}和Lists的样本.
我有一个C#程序,我想转换为F#.这是它的作用:
这是一个简单的例子,说明我在C#中可以做什么,但在F#中还没有.
假设这是一个文本文件:
命令,最高法院,纽约县(Paul G Someone),于2008年3月18日进入,该行为因旅行中遭受的人身伤害而摔倒,据称由于被告城市或联合麦克弗森的疏忽造成了坑洼,联合麦克弗森对其承包商(Mallen)提起的第三方诉讼,就其上诉而言,否认,不合时宜,Mallen的简易判决动议驳回了投诉和第三方投诉,一致肯定,没有任何费用.
通过法院,规定或其他方式,各方可以自由地规划其程序性过程.因此,我们肯定否认Mallen的动议是不合时宜的,因为Mallen没有为迟到的申请提供借口.
我得到这个输出:
2 Paragraphs
3 Lines
109 Words
Found Tokens: 2
Token insofar: ocurrence(s) 1: position(s): 52
Token thus: ocurrence(s) 1: position(s): 91
Run Code Online (Sandbox Code Playgroud)
行应该被称为句子:(
有几个令牌.我会说超过100个按类分组.我必须多次迭代同一文本,试图匹配每个令牌.这是代码的一部分.它显示了我如何分割句子,将它们放在ListBox中,这有助于轻松获取项目数.这适用于段落,句子和标记.它还显示了我依赖和预测的方式.我希望通过使用seq {sequence-expression}和Lists和seq.iter或List.iter以及任何匹配令牌来避免使用这种方法.
/// <summary>
/// split the text into sentences and displays
/// the results in a list box
/// </summary>
private void btnParseText_Click(object sender, EventArgs e)
{
lstLines.Items.Clear();
ArrayList al = SplitLines(richTextBoxParagraphs.Text); …Run Code Online (Sandbox Code Playgroud) 我很好奇,如果有人理解,知道或可以指向我关于谷歌如何创建他们的流行通道块功能的综合文献或源代码.但是,如果您知道任何其他可以执行相同操作的应用程序,请发布您的答案.
如果您不知道我在写什么,这里有一个热门通道示例的链接.当您查看" 信息技术应用程序的法律决策过程建模 "一书的概述时......通过Georgios N. Yannopoulos,您可以看到如下内容:
热门段落
......方向,不确定.我们还没有解决,因为我们没有预料到,这个问题会在未经审理的案件发生时提出; 公园的某种程度的和平是否应该牺牲或捍卫那些使用这些东西的乐趣或兴趣的孩子.当出现未经审查的案件时,我们就会面临利害攸关的问题,然后通过在最能满足我们的方式中选择竞争利益来解决问题.在做什么...... 第86页
这将是适合"机械"法理学的世界.显然,这个世界不是我们的世界; 人类立法者无法了解未来可能带来的所有可能的情况组合.这种无法预测会带来相对不确定性的目标.当我们大胆地进行框架的一些通用规则(例如,没有车辆可能是考虑到公园的规则),在这种情况下所使用的语言修复任何事物必须满足必要的条件... 第86页
它必须是密集的模式匹配过程.我只能想到n-gram模型,文本语料库,自动plagisrism检测.但是,有时n-gram是用于预测序列中的下一个项目的概率模型,并且手动创建文本语料库(据我所知).而且,在这个特殊情况下,流行的段落,可能会有很多单词.
我真的迷路了.如果我想创建这样的功能,我应该如何或在哪里开始?另外,在你的回复中包含哪些编程语言最适合这些东西:F#或任何其他功能性语言,PERL,Python,Java ......(我自己也成为了F#粉丝)
PS:有人可以包含标签自动抄袭检测,因为我不能
text-processing pattern-recognition corpus n-gram plagiarism-detection
我注意到我的代码不像以前那样多.今天我将更多的时间用于分析和设计,然后我将这种设计传达给程序员.然后他们做编码.这影响了我的编码效率,因为我必须参考参考文献并依赖智能感知.事情变得越来越复杂
现在,这是具有讽刺意味的.如果我雇用一名程序员并让他/她坐在电脑前,我可能会要求做一些编码,我会检查能力.我会根据他们对内存与咨询参考的使用来评估它们.也许我更喜欢那个没有过多咨询但是谁知道他们在做什么的程序员.
您有什么看法和经验?
我下载了一个Github项目,在VS 2012中打开它后,进行了自动升级.我收到一个我不明白的错误.它与报价有关.
这是我复制粘贴的文件:https://github.com/dmitry-a-morozov/fsharp-wpf-mvc-series/blob/master/Chapter%2012%20-%20BindingMicroDSL/BindingMicroDSL/StockPricesChart.fs
错误是"引用可能不涉及分配或获取捕获的本地变量的地址"
违规代码是这个关键和价值:
this.Control.DetailsName, <@@ stockProperty.Key @@>
this.Control.DetailsValue, <@@ stockProperty.Value @@>
namespace FSharp.Windows.Sample
open System.Windows.Data
open System.Drawing
open System.Windows.Forms.DataVisualization.Charting
open System.Collections.ObjectModel
open FSharp.Windows
open FSharp.Windows.UIElements
[<AbstractClass>]
type StockPricesChartModel() =
inherit Model()
abstract StocksInfo : ObservableCollection<StockInfoModel> with get, set
abstract SelectedStock : StockInfoModel with get, set
type StockPricesChartView(control) as this =
inherit PartialView<unit, StockPricesChartModel, StockPricesChartControl>(control)
do
let area = new ChartArea()
area.AxisX.MajorGrid.LineColor <- Color.LightGray
area.AxisY.MajorGrid.LineColor <- Color.LightGray
this.Control.StockPricesChart.ChartAreas.Add area
let series =
new Series(
ChartType …Run Code Online (Sandbox Code Playgroud)