在非整数键上有效地实现记忆
我是 Haskell 的新手,并且一直在通过做一些简单的编程挑战来练习。最近两天,我一直在尝试在这里实现无界背包问题。维基百科页面上描述了我使用的算法,但对于这个问题,“重量”一词被替换为“长度”一词。无论如何,我开始编写没有记忆的代码:
maxValue :: [(Int,Int)] -> Int -> Int
maxValue [] len = 0
maxValue ((l, val): other) len =
if l > len then
skipValue
else
max skipValue takeValue
where skipValue = maxValue other len
takeValue = (val + maxValue ([(l, val)] ++ other) (len - l)
我曾希望 haskell 会很好,并且有一些很好的语法#pragma memoize来帮助我,但是四处寻找示例,解决方案是用这个斐波那契问题代码解释的。
memoized_fib :: Int -> Integer
memoized_fib = (map fib [0 ..] !!)
where fib 0 = 0
fib 1 = 1
fib n = memoized_fib (n-2) + memoized_fib (n-1)
在掌握了这个例子背后的概念后,我感到非常失望——所使用的方法是超级hacky,只有在 1) 函数的输入是单个整数时才有效,并且 2) 函数需要按顺序递归计算值f(0), f(1), f(2), ... 但是如果我的参数是向量或集合怎么办?如果我想记住一个像 的函数,当我不需要大多数这些值时(其他人指出这种说法是错误的)f(n) = f(n/2) + f(n/3),我需要计算f(i)所有小于 n 的值。
我尝试通过传递一个我们慢慢填充为额外参数的备忘录表来实现我想要的:
maxValue :: (Map.Map (Int, Int) Int) -> [(Int,Int)] -> Int -> (Map.Map (Int, Int) Int, Int)
maxValue m [] len = (m, 0)
maxValue m ((l, val) : other) len =
if l > len then
(mapWithSkip, skipValue)
else
(mapUnion, max skipValue (takeValue+val))
where (skipMap, skipValue) = maxValue m other len
mapWithSkip = Map.insertWith' max (1 + length other, len) skipValue skipMap
(takeMap, takeValue) = maxValue m ([(l, val)] ++ other) (len - l)
mapWithTake = Map.insertWith' max (1 + length other, len) (takeValue+val) mapWithSkip
mapUnion = Map.union mapWithSkip mapWithTake
但这太慢了,我相信是因为Map.union 花费的时间太长,O(n+m)而不是O(min(n,m)). 此外,对于像 memoizaton 这样简单的东西,这段代码似乎很混乱。对于这个特定问题,您可能可以将 hacky 方法推广到 2 维,并进行一些额外的计算,但我想知道如何在更一般的意义上进行记忆。如何在保持与命令式语言中代码相同的复杂性的同时,以这种更通用的形式实现记忆化?
回答
如果我想记住像 f(n) = f(n/2) + f(n/3) 这样的函数,我需要为所有小于 n 的 i 计算 f(i) 的值,当我不这样做时不需要大多数这些值。
不,懒惰意味着不使用的值永远不会被计算。您为它们分配一个 thunk 以防它们被使用,因此它是非零数量的 CPU 和 RAM 专用于这个未使用的值,但例如评估f 6永远不会导致f 5评估。因此,假设计算一个项目的费用远高于分配一个 cons 单元的费用,并且您最终会查看总可能值的很大一部分,那么此方法使用的浪费的工作很小。
但是如果我的参数是向量或集合怎么办?
使用相同的技术,但使用与列表不同的数据结构。映射是最通用的方法,前提是您的键是 Ord 并且您可以枚举您需要查找的所有键。
如果您无法枚举所有键,或者您计划查找的键比可能的总数少很多,那么您可以使用 State(或 ST)来模拟在函数调用之间共享可写记忆缓存的命令式过程.
我很想向您展示这是如何工作的,但我发现您的问题陈述/链接令人困惑。您链接到的练习似乎等同于您链接到的维基百科文章中的 UKP,但我在该文章中没有看到任何与您的实现相似的内容。维基百科提供的“动态编程预先算法”明确设计为具有与fib您提供的记忆示例完全相同的属性。键是单个 Int,数组是从左到右构建的:从len=0基本情况开始,所有其他计算都基于已计算的值。此外,出于某种我不明白的原因,它似乎假设每个合法大小的对象至少有 1 个副本,而不是至少 0 个;但如果您有不同的限制,这很容易解决。
您实现的内容完全不同,从总 len 开始,并为每(length, value)一步选择length要切割的大小件数,然后使用较小的 len 进行递归并从您的权重值列表中删除前面的项目。它更接近于传统的“给定这些面额,您可以通过多少方式更改一定数量的货币”问题。这也适用于与 相同的从左到右的记忆方法fib,但在两个维度上(一个维度是要更改的货币数量,另一个维度是剩余要使用的面额数量)。