从零开始的Haskell（七）——折叠与幺半群

系列第七篇，介绍了更一般性的折叠以及幺半群。

折叠，又见折叠

我们已经知道怎么折叠一个列表了，但我们也可以将折叠思想更一般性地用于其它数据类型。比如对于下面这个二叉树，考虑一些函数：

data Tree a = Empty
            | Node (Tree a) a (Tree a)
    deriving (Show, Eq)
    
leaf :: a -> Tree a
leaf x = Node Empty x Empty

写一个函数来计算树的节点数：

1
2
3

treeSize :: Tree a -> Integer
treeSize Empty = 0
treeSize (Node l _ r) = 1 + treeSize l + treeSize r

计算一个Tree Integer的数据总和：

1
2
3

treeSum :: Tree Integer -> Integer
treeSum Empty = 0
treeSum (Node l x r) = x + treeSum l + treeSum r

计算树的高度：

1
2
3

treeDepth :: Tree a -> Integer
treeDepth Empty = 0
treeDepth (Node l _ r) = 1 + max (treeDepth l) (treeDepth r)

将树内元素展开成一个列表：

1
2
3

flatten :: Tree a -> [a]
flatten Empty = []
flatten (Node l x r) = flatten l ++ [x] ++ flatten r

你是否从中看出一些相似的模式？对于上述每个函数，有：

接受一个树作为输入
对输入的树进行模式匹配
对于Empty节点，返回一个简单的值
对于Node节点：
1. 递归的处理左右子树
2. 以某种方式组合递归的结果，并生成最终结果

作为一名好的程序员，我们总是希望将抽象出重复的模式。首先需要将各例子中变化的部分作为参数，它们是：

返回类型
空节点的值
组合递归调用的方式

设树处理的类型为a，函数的返回类型为b，有：

1
2
3

treeFold :: b -> (b -> a -> b -> b) -> Tree a -> b
treeFold e _ Empty = e
treeFold e f (Node l x r) = f (treeFold e f l) x (treeFold e f r)

有了这个折叠函数，我们就可以更轻易地定义上面的几个例子了：

treeSize' :: Tree a -> Integer
treeSize' = treeFold 0 (\l _ r -> l + 1 + r)

treeSum' :: Tree Integer -> Integer
treeSum' = treeFold 0 (\l x r -> l + x + r)

treeDepth' :: Tree a -> Integer
treeDepth' = treeFold 0 (\l _ r -> 1 + max l r)

flatten' :: Tree a -> [a]
flatten' = treeFold [] (\l x r -> l ++ [x] ++ r)

我们也可以轻松实现其它的树折叠函数：

1 2	treeMax :: (Ord a, Bounded a) => Tree a -> a treeMax = treeFold minBound (\l x r -> max l $ max x r)

这样感觉就好多了，去除了大量重复模式，非常优雅。

折叠表达式

回想下Homework5中的ExprT类型和相应的eval函数：

data ExprT = Lit Integer
           | Add ExprT ExprT
           | Mul ExprT ExprT

eval :: ExprT -> Integer
eval (Lit i) = i
eval (Add a b) = eval a + eval b
eval (Mul a b) = eval a * eval b

看着就欠抽象！来试试这样写：

exprTFold :: (Integer -> b) -> (b -> b -> b) -> (b -> b -> b) -> ExprT -> b
exprTFold f _ _ (Lit i) = f i
exprTFold f g h (Add a b) = g (exprTFold f g h a) (exprTFold f g h b)
exprTFold f g h (Mul a b) = h (exprTFold f g h a) (exprTFold f g h b)

eval' :: ExprT -> Integer
eval' exprTFold id (+) (*)

现在我们可以做一些别的事，比如计算表达式中数字的个数：

1 2	numLiterals :: ExprT -> Int numLiterals = exprTFold (const 1) (+) (+)

普适的折叠

这里透露的信息是我们可以为很多（并非全部）数据类型创建折叠操作。作用于T类型的折叠操作会为T的每个构造器取一个（高层面的）参数，考虑怎么把构造器中的数据类型转换成返回值的类型——直到所有递归过程被折叠成一个结果。

很多我们可能想为T实现的的函数在折叠操作下会很易于表达。

幺半群（Monoids）

离散数学里接触过幺半群的概念，定义如下：

幺半群是一个带有二元运算`* : M * M -> M的集合M`，其符合以下公理
- 结合律：对任意M内的元素a、b、c，有(a * b) * c = a * (b * c)
- 单位元：存在M内的元素e，使任一存于M内的元素a满足a * e = e * a = a
- 封闭性（内含于二元运算中）：对任意在M内的元素a、b，a*b也在M中

Haskell中幺半群是一种基本类型类，定义在Data.Monoid模块里：

class Monoid m where
    mempty  :: m
    mappend :: m -> m -> m
    
    mconcat :: [m] -> m
    mconcat = foldr mappend mempty

(<>) Monoid m => m -> m -> m
(<>) = mappend

其中mempty相当于单位元的定义，mappend与其符号简写<>为幺半群中的二元运算。mconcat用于将整个列表折叠成一个值，默认使用foldr来实现，但由于对某种特定的Monoid类型可能存在更高效的实现，模块中提供了它的定义供修改。

正如之前提到的幺半群的性质，对任何Monoid类型的值x、y、z有：

1
2
3

mempty <> x = x
x <> mempty = x
(x <> y) <> z = x <> (y <> z)

Monoid 实例

在知道这些概念后就会发现，Monoid无处不在。比如一个列表：

1
2
3

instance Monoid [a] where
    mempty  = []
    mappend = (++)

考虑下会发现这是完美符合Monoid性质的。同理可以发现数值类型的加法和乘法也完美符合Monoid的性质。但要怎样分别实现数值加法和乘法的Monoid呢？我们不能在一个类型类中创建同一个类型的两个不同实例，即以下方法：

instance Num a => Monoid a where
    mempty  = 0
    mappend = (+)

instance Num a => Monoid a where
    mempty  = 0
    mappend = (*)

是非法的，因为有重复定义。为解决这个问题，我们可以创建两个新类型作为数值类型的不同封装：

newtype Sum a = Sum a
    deriving (Eq, Ord, Num, Show)

getSum :: Sum a -> a
getSum (Sum a) = a

instance Num a => Monoid (Sum a) where
    mempty  = Sum 0
    mappend = (+)

newtype Product a = Product a
    deriving (Eq, Ord, Num, Show)

getProduct :: Product a -> a
getProduct (Product a) = a

instance Num a => Monoid (Product a) where
    mempty  = Product 0
    mappend = (*)

类型的定义方式：

data: ADT

newtype: 单构造器的零代价ADT

type: 类型别名

在上述定义后，我们可以使用以下方式计算一个数列中所有元素的乘积：

lst :: [Integer]
lst = [1,5,8,23,423,99]

prod :: Integer
prod = getProduct . mappend . map Product $ lst

当然这个例子显得舍近求远，非常地蠢。但这个模式可以方便的说明Monoid的应用方式。

两个可以作为Monoid实例的类组成的Pair也可以作为Monoid的实例，如下：

1
2
3

instance (Monoid a, Monoid b) => Monoid (a, b) where
    mempty  = (mempty, mempty)
    (a,b) `mappend` (c,d) = (a `mappend` c, b `mappend` d)

试图构造一个Bool类型的Monoid，如下：

newtype Or = Or {getOr :: Bool}
    deriving (Eq, Ord, Show, Read, Bounded)

instance Monoid Or where
    mempty = Or False 
    Or x `mappend` Or y = Or $ x || y

这个定义确实没错，但是无法通过语法检查。原因是No instance for (Semigroup Or)。

补充：半群（Semigroup）

上面的报错信息意为Or类型不是Semigroup类型类的实例，而Semigroup是半群的意思。这是怎么回事呢？

我们知道，幺半群就是有单位元的半群，则半群定义为一个带有符合结合律的二元运算符* : M * M -> M的集合。因此Haskell把幺半群的二元运算符部分抽象出来作为半群类型类，如下：

1 2	class Semigroup a where (<>) :: a -> a -> a

而幺半群的真实定义则为：

class Semigroup a => Monoid a where
    mempty  :: a
    mappend :: a -> a -> a
    mconcat :: foldr mappend mempty
    
(<>) Monoid m => m -> m -> m
(<>) = mappend

关于<>与mappend的关系更准确的说法是，mappend是<>的别名。因而，<>才是主要定义，就是说一个类要成为Monoid的实例就必须也成为Semigroup的实例。则Bool类型的Monoid应定义为：

newtype Or = Or {getOr :: Bool}
    deriving (Eq, Ord, Show, Read, Bounded)

instance Semigroup Or where
    Or x <> Or y = Or $ x || y

instance Monoid Or where
    mempty = Or False 
    
newtype And = And {getAnd :: Bool}
    deriving (Eq, Ord, Show, Read, Bounded)

instance Semigroup And where
    And x <> And y = And $ x && y

instance Monoid And where
    mempty = And True

甚至可以实现函数类型的Monoid：

newtype Dot a = Dot {run :: a -> a}

instance Semigroup (Dot a) where
    Dot x <> Dot y = Dot $ x . y

instance Monoid (Dot a) where
    mempty = Dot id