正则表达式、捕获组和单元测试的良好设计

glo*_*man 5 c# regex unit-testing moq

在一个项目中,我正在尝试使用正则表达式来区分各种类型的句子,并将它们映射到函数来处理这些句子。

大多数这些句子处理函数从句子本身获取参数,由正则表达式中的捕获组解析出来。

例如:“我为 2 个 cookie 支付了 20 美元”与我的解析树(字典)中的一个正则表达式匹配。正则表达式将匹配提取 $20 作为组“价格”,和 2 作为组“金额”。目前我正在映射到正确的 Handler 函数并按如下方式调用它:

foreach(KeyValuePair<Regex, Type> pair in sentenceTypes)
{
    Match match = pair.Key.Match(text);
    if(match.Success)
    {
        IHandler handler = handlerFactory.CreateHandler(pair.Value);
        output = handler.Handle(match);
    }
}
Run Code Online (Sandbox Code Playgroud)

简单处理程序类的示例。

public class NoteCookiePriceHandler
    {
        public string Handle(Match match)
        {
            double payment = Convert.ToDouble(match.Result("${payment}"));
            int amount = Convert.ToInt32(match.Result("${amount}"));

            double price = payment / amount;
            return "The price is $" + price;
        }
    }
Run Code Online (Sandbox Code Playgroud)

我试图用 Moq 设置一些单元测试来提供帮助,当我意识到我实际上无法模拟 Match 对象或 Regex 时。仔细考虑一下,设计总体上似乎有些缺陷,因为我依赖于正确解析命名组并将其传递给没有良好接口的 Handler 类。

我正在寻找有关更有效设计的建议,以用于将参数正确地传递给映射的处理程序函数/类,因为传递 Match 对象似乎有问题。

如果做不到这一点,任何帮助找出有效模拟 Regex 或 Match 的方法都将不胜感激,至少可以帮助我解决我的短期问题。它们都缺少默认构造函数,所以我很难让 Moq 创建它们的对象。

编辑:我最终通过为我的匹配组传递字符串字典来解决至少模拟问题,而不是(不可起订量)匹配对象本身。我对这个解决方案不是特别满意,因此仍然会感谢您的建议。

foreach(KeyValuePair<Regex, Type> pair in sentenceTypes)
        {
            match = pair.Key.Match(text);
            if(match.Success)
            {
                IHandler handler= handlerFactory.CreateHandler(pair.Value);
                foreach (string groupName in pair.Key.GetGroupNames())
                {
                    matchGroups.Add(groupName, match.Groups[groupName].Value);
                }
                interpretation = handler.Handle(matchGroups);
Run Code Online (Sandbox Code Playgroud)

Lod*_*rds 1

避免不良设计的一种方法是从良好设计的原则开始,而不仅仅是您希望解决的问题。这就是测试驱动开发在改变代码质量方面如此强大的原因之一。这种思维方式早在 TDD 之前就已经存在了,尽管名称是:按契约设计。请允许我演示一下:

您希望理想的处理者是什么样子?这个怎么样:

interface IHandler {
    String handle();
}
Run Code Online (Sandbox Code Playgroud)

执行:

public class NoteCookiePriceHandler : IHandler
{  
    private double payment;
    private int amount;

    public NoteCookiePriceHandler(double payment, int amount) {
        this.payment = payment;
        this.amount = amount;
    }

    public String handle() {
        return "The price is $" + payment / amount;
    }
}
Run Code Online (Sandbox Code Playgroud)

现在从这个理想的设计开始,也许从这个设计的测试开始。我们如何获得要发送给处理程序的句子的句子输入?好吧,计算机科学中的所有问题都可以通过另一层间接解决。假设句子解析器不直接创建处理程序,而是使用工厂来创建处理程序:

interface HandlerFactory<T> where T: IHandler  {
    T getHandler(KeyValuePair<String, String> captureGroups);
}
Run Code Online (Sandbox Code Playgroud)

然后,您可以为每个处理程序创建一个工厂,但很快您就会找到一种创建通用工厂的方法。例如,使用反射,您可以将捕获组名称与构造函数参数相匹配。根据构造函数参数的数据类型,您可以自动让通用处理程序工厂将字符串转换为正确的数据类型。通过创建一些假处理程序并要求工厂使用一些键值对字符串输入来填充它们,这一切都可以轻松测试。