Mat*_*Sot 21 algorithm editing google-docs collaborative-editing operational-transform
我一直在编写自己的Javascript编辑器,其功能类似于Google Docs(允许多人同时处理它).有一点我不明白:
假设您已将用户A和用户B直接相互连接,网络延迟为10毫秒.我假设编辑器使用diff系统(据我理解Docs),其中编辑表示为"在索引3处插入'文本',并且差异被加时间戳并强制按时间顺序应用于所有客户端.
让我们从包含文本的文档开始:"xyz123"
用户A在时间戳001ms处在文档的开头键入"abc",而用户B在时间戳005ms处在"xyz"和"123"之间键入"hello".
两个用户都希望结果是:"abcxyzhello123",但考虑到网络延迟:
当然," abchello xyz123"与" abc xyz hello 123"不一样
除了字面上为每个角色分配自己的唯一ID之外,我无法想象Google将如何有效地解决这个问题.
我想到的一些可能性:
我正在阅读http://www.waveprotocol.org/whitepapers/operational-transform,但很想听到解决这个问题的所有方法.
Mar*_*ehr 29
实现并发更改副本有不同的可能性,具体取决于场景的拓扑结构和不同的权衡.
最常见的情况是所有客户端都必须与之通信的中央服务器.
服务器可以跟踪每个参与者的文档的外观.然后,A和B都会将更改发送到服务器.然后,服务器将更改应用于相应的跟踪文档.然后它将执行三向合并并将更改应用于主文档.然后,它将主文档和跟踪文档之间的差异发送到相应的客户端.这称为差分同步.
另一种方法称为操作(al)转换,类似于传统版本控制系统中的rebase.它不需要中央服务器,但是如果你有超过2个参与者,那么让它变得更容易(参见OT常见问题解答).要点是您在一次编辑中转换更改,以便编辑假定已经发生了另一次编辑的更改.例如,将变换B的编辑insert(3, hello)针对其编辑insert(0, abc)与结果insert(6, hello).
变基和OT之间的区别在于,如果您在不同的顺序中应用编辑,则变基不能保证一致性(例如,如果B要反过来反对A的编辑,则可能导致文档状态不同).另一方面,OT的承诺是允许任何顺序,如果你做正确的转换.
存在可以处理对等场景的OT算法(在控制层上增加的实现复杂性和增加的存储器使用的权衡).可以使用版本矢量来跟踪编辑所基于的状态,而不是简单的时间戳.然后(取决于OT算法的功能,特别是转换属性2),可以转换传入的编辑以适应它们的接收顺序,或者可以使用版本向量对编辑强加部分顺序 - 在此通过撤消和转换编辑,需要"重写"案例历史记录,以便它们遵守版本向量强加的顺序.
最后,有一组算法称为CRDT,WOOT,treedoc和logoot,它们试图通过特殊设计的数据类型来解决问题,这些数据类型允许操作通勤,因此它们的应用顺序无关紧要(这是类似的你想到每个角色的身份证明.这里的权衡是内存消耗和操作构建的开销.