打破Data.Set完整性而不使用GeneralizedNewtypeDeriving

npo*_*cop 18 security haskell type-safety language-extension

下面的代码使用不安全的GeneralizedNewtypeDeriving扩展来Data.Set通过插入具有不同Ord实例的不同元素来中断:

{-# LANGUAGE GeneralizedNewtypeDeriving #-}
import Data.Set
import System.Random

class AlaInt i where
  fromIntSet :: Set Integer -> Set i
  toIntSet :: Set i -> Set Integer
instance AlaInt Integer where
  fromIntSet = id
  toIntSet = id
newtype I = I Integer deriving (Eq, Show, AlaInt)
instance Ord I where compare (I n1) (I n2) = compare n2 n1 -- sic!  

insert' :: Integer -> Set Integer -> Set Integer
insert' n s = toIntSet $ insert (I n) $ fromIntSet s

randomInput = take 5000 $ zip (randomRs (0,9) gen) (randoms gen) where
    gen = mkStdGen 911

createSet = Prelude.foldr f empty where
    f (e,True) = insert e
    f (e,False) = insert' e

main = print $ toAscList $ createSet randomInput
Run Code Online (Sandbox Code Playgroud)

代码打印[1,3,5,7,8,6,9,6,4,2,0,9].请注意,列表是无序的,并且有9两次.

是否可以使用其他扩展来执行此字典交换攻击,例如ConstraintKinds?如果是,可以Data.Set重新设计以适应此类攻击吗?

Mig*_*Mit 20

我认为这是一个重要的问题,所以我将从其他地方重复我的回答:你可以在Haskell98中为同一类型创建同一类的多个实例,而不需要任何扩展:

$ cat A.hs
module A where
data U = X | Y deriving (Eq, Show)

$ cat B.hs
module B where
import Data.Set
import A
instance Ord U where
    compare X X = EQ
    compare X Y = LT
    compare Y X = GT
    compare Y Y = EQ
ins :: U -> Set U -> Set U
ins = insert

$ cat C.hs
module C where
import Data.Set
import A
instance Ord U where
    compare X X = EQ
    compare X Y = GT
    compare Y X = LT
    compare Y Y = EQ
ins' :: U -> Set U -> Set U
ins' = insert

$ cat D.hs
module D where
import Data.Set
import A
import B
import C
test = ins' X $ ins X $ ins Y $ empty

$ ghci D.hs
Prelude D> test
fromList [X,Y,X]
Run Code Online (Sandbox Code Playgroud)

是的,您可以通过在内部存储字典来防止此类攻击:

data MSet a where MSet :: Ord a => Set a -> MSet a
Run Code Online (Sandbox Code Playgroud)

  • 略有修正.这些模块不会形成有效的Haskell 98程序,因为它们为Ord U定义了冲突的实例.但是,GHC无论如何都接受它们,因为GHC不进行全局实例唯一性检查:它只在需要解决约束时进行检查,在模块B和C中发生,在每个模块中只有一个实例是可见的.这是GHC的已知(并且长期存在)缺陷.(不知道有多少Haskell程序依赖于缺乏全局唯一性检查......) (4认同)
  • 可能.仅使用提供的一个字典与使用外部字典一样糟糕. (2认同)
  • 确实如此.但是,我认为验证全局唯一性的问题一般都不能解决 - 我的意思是,当你启用了一些扩展时,例如`OverlappingInstances`.GHC支持大量扩展. (2认同)