优点./缺点.不变性与可变性

use*_*855 22 functional-programming

好吧,我想我明确指出这个方向的方向很清楚.现在有很多关于不变性(constness)的优点的讨论.Java书中的Concurrent编程也谈到了很多.

然而,这一切正是我所读到的.我个人而言,在功能语言中没有多少编码.对我来说,使用不可变对象可以舒适地工作看起来非常令人惊讶.从理论上讲,这绝对是可能的.但是,从实际的角度来看,是一种非常舒适的体验.或者我必须开发什么样的新推理(对于FP),以便我不需要那么多的可变性.

当你被迫使用不可变对象时,我将不胜感激如何考虑编写程序.

  • 已经把它作为社区维基...为所有有兴趣关闭这个问题或者将其标记为主观......等等...*

Jay*_*rod 26

不变性有几个优点,包括(但不限于):

  • 具有不可变对象的程序不那么复杂,因为您不需要担心对象如何随着时间的推移而发展.
  • 在返回或传递给其他函数时,您不需要创建不可变对象的防御副本,因为不可能在您的背后修改不可变对象.
  • 对象的一个​​副本与另一个副本一样好,因此您可以多次缓存对象或重复使用同一对象.
  • 不可变对象适用于在多线程环境中的线程之间共享信息,因为它们不需要同步.
  • 对不可变对象的操作返回新的不可变对象,而对可变对象造成副作用的操作通常会返回void.这意味着可以将多个操作链接在一起.例如

("foo" + "bar" + "baz").length()

  • 在功能一流的价值语言,如操作map,reduce,filter,等都是对集合的基本操作.这些可以以多种方式组合,并且可以替换程序中的大多数循环.

当然有一些缺点:

  • 诸如图之类的循环数据结构难以构建.如果您有两个在初始化后无法修改的对象,那么如何让它们相互指向?
  • 分配大量小对象而不是修改已有的小对象会对性能产生影响.通常,分配器或垃圾收集器的复杂性取决于堆上的对象数.
  • 不可变数据结构的朴素实现可能导致极差的性能.例如,当最佳算法是O(n)时,连接许多不可变字符串(如在Java中)是O(n 2).可以编写有效的不可变数据结构,只需要多花点心思.

  • map/reduce/filter 上的最后一点如何支持不变性?似乎对于可变对象和不可变对象来说都是如此。 (3认同)
  • 我个人发现不可变数据结构比它们的可变变体更容易编写.关于字符串,它们只是一个糟糕的数据结构.Immutable Ropes(http://en.wikipedia.org/wiki/Rope_(computer_science))提供O(1)concats和log(n)子串. (2认同)

Jul*_*iet 8

但是,从实际的角度来看,是一种非常舒适的体验.

我喜欢在我的大多数函数式编程中使用F#.为了它的价值,你可以用C#编写功能代码,它真的非常讨厌和难看.此外,我发现GU​​I开发抵制功能编程风格.

幸运的是,业务代码似乎很好地适应了功能样式:)那也和Web开发一样 - 想想,每个HTTP请求都是无状态的.每次"修改"状态时,都会将服务器传递给某个状态,然后返回一个全新的页面.

当你被迫使用不可变对象时,我将不胜感激如何考虑编写程序.

不可变对象应该很小

在大多数情况下,当对象具有少于3或4个内在属性时,我发现不可变数据结构最容易使用.例如,红黑树中的每个节点都有4个属性:颜色,值,左子和右子.堆栈有两个属性,一个值和指向下一个堆栈节点的指针.

考虑一下您公司的数据库,您可能拥有包含20,30,50个属性的表.如果您需要在整个应用程序中修改这些对象,那么我肯定会拒绝让这些对象变为不可变的冲动.

C#/ Java/C++不是很好的函数式语言.请改用Haskell,OCaml或F#

根据我自己的经验,不可变对象比类似于C的语言更容易在类似ML的语言中读写1000倍.对不起,但是一旦你有模式匹配和联合类型,你就不能放弃了它们:)此外,一些数据结构可以利用尾调用优化,这是你在某些C-中没有得到的一个特性.喜欢语言.

但只是为了好玩,这是C#中的一个不平衡的二叉树:

class Tree<T> where T : IComparable<T>
{
    public static readonly ITree Empty = new Nil();

    public interface ITree
    {
        ITree Insert(T value);
        bool Exists(T value);
        T Value { get; }
        ITree Left { get; }
        ITree Right { get; }
    }

    public sealed class Node : ITree
    {
        public Node(T value, ITree left, ITree right)
        {
            this.Value = value;
            this.Left = left;
            this.Right = right;
        }

        public ITree Insert(T value)
        {
            switch(value.CompareTo(this.Value))
            {
                case 0 : return this;
                case -1: return new Node(this.Value, this.Left.Insert(value), this.Right);
                case 1: return new Node(this.Value, this.Left, this.Right.Insert(value));
                default: throw new Exception("Invalid comparison");
            }
        }

        public bool Exists(T value)
        {
            switch (value.CompareTo(this.Value))
            {
                case 0: return true;
                case -1: return this.Left.Exists(value);
                case 1: return this.Right.Exists(value);
                default: throw new Exception("Invalid comparison");
            }
        }

        public T Value { get; private set; }
        public ITree Left { get; private set; }
        public ITree Right { get; private set; }
    }

    public sealed class Nil : ITree
    {
        public ITree Insert(T value)
        {
            return new Node(value, new Nil(), new Nil());
        }

        public bool Exists(T value) { return false; }

        public T Value { get { throw new Exception("Empty tree"); } }
        public ITree Left { get { throw new Exception("Empty tree"); } }
        public ITree Right { get { throw new Exception("Empty tree"); } }
    }
}
Run Code Online (Sandbox Code Playgroud)

Nil类代表一棵空树.我更喜欢这种表示而不是null表示,因为null检查是魔鬼的化身:)

每当我们添加节点时,我们都会创建一个插入节点的全新树.这比听起来更有效,因为我们不需要复制树中的所有节点; 我们只需要"在路上"复制节点并重用任何未更改的节点.

假设我们有一棵这样的树:

       e
     /   \
    c     s
   / \   / \
  a   b f   y
Run Code Online (Sandbox Code Playgroud)

好的,现在我们要插入w到列表中.我们将从根开始e,移动到s,然后到y,然后y用一个替换左边的孩子w.我们需要在下来的路上创建节点的副本:

       e                     e[1]
     /   \                 /   \
    c     s      --->     c     s[1]
   / \   / \             / \    /\  
  a   b f   y           a   b  f  y[1]
                                  /
                                 w
Run Code Online (Sandbox Code Playgroud)

好的,现在我们插入一个g:

       e                     e[1]                   e[2]
     /   \                 /   \                   /    \
    c     s      --->     c     s[1]      -->     c      s[2]
   / \   / \             / \    /\               / \     /   \
  a   b f   y           a   b  f  y[1]          a   b  f[1]   y[1]
                                  /                      \    /
                                 w                        g  w
Run Code Online (Sandbox Code Playgroud)

我们重用树中的所有旧节点,因此没有理由从头开始重建整个树.该树具有与其可变对应物相同的计算复杂度.

编写红黑树,AVL树,基于树的堆以及许多其他数据结构的不可变版本也非常容易.


Dir*_*irk 5

例如,不可变性在多线程程序中具有优势.由于不可变对象在构造之后无法更改其状态,因此可以安全地在任意数量的并发运行线程中共享它们,而不会有一个干扰(通过改变其他线程可见的对象的状态)与另一个线程的风险.

另一个优点是,更容易推断以函数式编写的程序的语义(因此,没有副作用).功能编程本质上更具说明性,强调结果应该是什么,而不是更少,如何实现.不可变的数据结构可以帮助您的程序更加实用.

Mark Chu-Carrol有一篇关于该主题的精彩博客文章.


Shu*_*oUk 5

许多函数式语言都是非纯粹的(允许突变和副作用)。

例如,如果您查看集合中的一些非常低级别的构造,您会发现其中一些在幕后使用迭代,并且相当多的使用一些可变状态(如果您想获取集合的前 n 个元素)例如,有一个计数器就更容易)。

诀窍在于,这通常是:

  1. 谨慎使用
  2. 当你这样做时引起注意
    • 请注意,在 f# 中,您必须声明某些内容是可变的

大量的功能代码证明了可以在很大程度上避免状态变化对于使用命令式语言长大的人来说,这有点难以理解,尤其是之前在循环中将代码编写为递归函数。更棘手的是在可能的情况下将它们编写为尾递归。知道如何做到这一点是有益的,并且可以带来更具表现力的解决方案,重点关注逻辑而不是实现。很好的例子是那些处理集合的例子,其中没有、一个或多个元素的“基本情况”被清晰地表达,而不是成为循环逻辑的一部分。

虽然情况更好,但实际上是 2。最好通过一个例子来完成:

获取您的代码库并将每个实例变量更改为只读[1][2]。仅将那些需要它们可变以使代码正常运行的部分改回(如果您只在构造函数外部设置它们一次,请考虑尝试将它们作为构造函数的参数,而不是通过属性之类的东西进行可变。

有一些代码库不能很好地工作,例如 gui/widget 重代码和一些库(特别是可变集合),但我想说,最合理的代码将允许超过 50% 的所有实例字段变为只读。

此时您必须问自己,“为什么默认值是可变的?”。事实上,可变字段是程序的一个复杂方面,因为即使在单线程世界中,它们的交互也有更大的不同行为范围;因此,它们最好被突出显示并吸引编码人员的注意,而不是“赤裸裸”地遭受世界的破坏。

值得注意的是,大多数函数式语言要么没有 null 的概念,要么使其很难使用,因为它们不是与变量一起工作,而是与命名一起工作,这些命名值的值与名称同时定义(井范围)。


  1. 我发现不幸的是,c# 也没有复制 java 的局部变量不变性概念。能够强调断言某些内容不会改变有助于明确意图,即值是在堆栈上还是在对象/结构中。

  2. 如果你有 NDepend 那么你可以找到这些WARN IF Count > 0 IN SELECT FIELDS WHERE IsImmutable AND !IsInitOnly