控制论与科学方法论-控制与反馈

按

《控制论与科学方法论》这本书是在1983年首次出版，在出版前就已经风靡了10年，现在在看依然不过时，比《系统之美》等书谈的更体系，更深入。

可能性空间

控制论与系统论的研究始于可能性空间

定义

可能性空间是事物在发展变化过程中所面临的各种可能性的集合。

譬如一个鸡蛋所面临的可能性空间如下：

性质

可能性空间呈树状
可能性空间代表的是事物的不确定性
可能性空间中所有的状态都是由事物的内部性质决定的

矛盾论中说事物内部有相反的力量决定了事物的发展，可能性空间也由此而来，事物发展的矛盾决定了事物能发展成什么，那我们如果对事物进行控制呢？

控制

控制是对一个事物的可能性空间进行有方向的选择的过程。

控制事物至少需要三个环节：

了解事物的可能性空间
确立事物要到达的状态，即目标
控制转化条件是事物朝期望状态进行

控制能力

如果判定我们的控制达到了预定效果，或者说在向预定方向进行？这就需要测量控制能力。

对于离散的状态而言，可以使用控制前的状态数量与控制后状态数量之比来衡量控制能力，对于连续状态而言，可以使用面积之比来衡量

M 为控制前的可能性空间，m 为控制后可能性空间，则控制能力可表示为 C = M/m

称重的天平有1g, 0.1g, 0.01g 的砝码，我们称重永远无法精确的知道物体的重量，只要符合我们的要求就可以了，对于目标的达成也一样，大部分时候精确到某一个状态是不可能的，所以任何目标在设定的时候都需要规定一定的误差范围，只要在误差范围内，我们就可以认为成功的实行了控制。

控制方法

日常中人们使用各种方法来达到控制的目的，对于不同的领域也都有著作来讨论，《孙子兵法》就是讨论对战争的控制，在控制论中有几类控制方法

随机控制

随机控制是在人们对事物不了解的时候通过尝试的方式来对事物施加影响，然后观察事物的反应来达到控制的目的。

随机控制应用非常广泛，通常在刚接触事物的时候都是使用的随机控制。科学家在研究时，随机的改变某些变量，然后观察事物的反应，在积累了很多的观察结果之后，才能对事物的发展有一个大概的认识。

随机控制需要注意几点。

速度问题，如果控制后需要等待很长时间才能得到结果，那很大可能由于无法得到足够的样本量而对事物有正确的认识，这方面的例子最直观的就是天文学。
对可能性空间大小的估计。如果手里有100把钥匙，我们要开门前首先要确定开门的钥匙在这其中，这样以后的尝试才有意义
扩大控制范围。由于最开始认识的不清晰，随机控制的范围是很小的，对很多可能性没有意识到，因此在随机过程中，要随时注意扩大控制范围

有记忆的控制

有记忆的控制与随机控制相比多了记忆模块，这样就可以在尝试了一种可能性之后，不会再重复进行尝试，这样就大大减少了尝试的次数。（有点像动态规划）

有记忆的控制与随机控制一样，也需要注意控制范围的问题。要制作一副担架，我们会去找两根木棍和一块软布，以这种形式去找可能会耗费很长时间，直接将门板拆下来当成担架就扩大了控制范围，从来得到了一个更优的实现

共轭控制

共轭控制可以将一件无法完成的事变成可完成的。

曹操让群臣称象，大家束手无策，曹冲说先将大象放到船上，记下船的水位线，然后放上石头到相同的水位线，最后称出石头的重量就是大象的重量。

曹冲此处使用的就是共轭控制，先将大象的重量转换称石头的重量，此变换称为L，然后称出石头的重量，此动作称为 A，然后再将石头的重量转换为大象的重量，这是L的逆过程，即 L-1, 我们将此三步过程表示为 L-1AL，表示为先 L，再A，最后 L-1，这样就称出了大象的重量。

几乎人类制作和使用的所有工具，本质上都包含这样一个控制范围扩大的过程。

在现代控制设备中，L 通常称作感应器，L-1 称作效应器，如下图

各种传感器将对象的数据转换成电信号(L)，控制人员分析数据后（A），通过按钮发送电脉冲给控制对象(L-1)，从而实现了对象的控制。

控制人员分析数据也有共轭控制的过程，眼/耳将信号数据传递给大脑(L), 大脑处理数据(A), 然后通过手控制按钮(L-1) 实现了对控制面板的控制。

负反馈调节

如果我们选择了某个目标，但是我们当前的控制能力达不到控制的要求怎么办？发射一个火箭到月球上去，并不是我们将火箭对准月球就可以的，事物是在动态变化中的。

观察一下老鹰抓兔子的过程，老鹰在从空中俯冲时，兔子也一直在跑动，老鹰并不是在俯冲时就固定了兔子的位置，然后不变地朝着那个位置飞行，而是先朝着那个位置飞行，兔子跑动后，老鹰通过鹰眼定位到兔子的新位置，然后朝调整目标向新位置飞行，直到抓住兔子，老鹰都一直在进行调整。

在这个过程中，老鹰的目标是抓到兔子，在飞行的过程中由鹰眼反馈回来的兔子的位置，老鹰的大脑通过比较自己和兔子的位置就得到了一个目标差，老鹰的每次调整都是朝着目标差减小的方向进行的，这样就构成了老鹰连续的飞行轨迹。这里关键的一点是老鹰始终朝着目标差减小的方向改变，这一过程在控制论就称为负反馈调节过程。

一般负反馈调节一般有两个环节：

系统一旦出现目标差，便自动出现减少目标差的反应
减少目标差的调节要一次次发挥发挥作用，使得对目标的逼近能累计起来。

如果不满足这两个环节，就不是一个完善的负反馈调节过程，像保险丝熔断，虽然满足第一个环节，但是不满足第二个，因此不算完整的负反馈调节。

负反馈调节如何扩大了控制能力

我们前面对控制能力的定义是 C = M/m, 即可能性空间的变化比，在负反馈调节中，控制能力是如何扩大的呢？

如上图，在最开始兔子跑动的可能性空间为A，在老鹰俯冲一段距离后，由于老鹰兔子的距离变短了，因此兔子跑动的可能性空间变为了 B，这一段老鹰的控制能力为 C1 = A/B, 再一段俯冲后，兔子的可能方向又缩小为 C，这一段老鹰的控制能力变为：C2 = B/C, 这样两次俯冲的控制能力为 A/B * B/C = A/C ，即通过反馈，老鹰扩大了自己的控制能力，通过不断的调整，老鹰最终的控制能力为 A/B * B/C * C/D *... * x/m = A/m ，由于每一次控制能力变为都大于1，因此老鹰通过负反馈，积累了系统的控制能力。

应用

负反馈通俗来说就是"做起来看", 老师上课通过不断观察学生的反应来调整自己的教学节奏是负反馈过程，通过批改作业，同学反馈等方式来调整自己下次课的教学目标。巡航导弹发射之后通过地图对比不断调整接近目标，也是负反馈的一种应用。

正反馈调节

负反馈是目标差减小的过程，正反馈是目标差扩大的过程，通常所说的恶性循环就是正反馈的一个表现。

注意，此处正负反馈是根据目标差来定义的，在其他系统书籍中，有的将正反馈定义为了指数型发展，譬如理财，本金一段时间后生成利息，利息又作为本金又可以生成利息，这也是一个正反馈过程。

因此，只要是 A 增大引起 B 增大，而 B 增大又影响 A 增大这个过程即可称为正反馈。毕竟有时你的目标是无限大，钱多多益善嘛。