何以智能

戏说猫狗 2023-08-01 07:53:06

不时在想从事大数据工作（数据人）的追求是什么？是无休止的与数据作对？是对数据全面管理？是数据能力中台化降低业务使用成本？是让数据易用来提升数据使用率和覆盖人群？这些是在数据应用演化进程上的产物，是手段而不是目的。最终的目的是想通过数据造就智能，通往智能化。

如今都在说智能化，很多人不由得问什么是智能化？又如何达到智能化呢？

我认为智能化包含两部分：自动化和智力，同时也是智能路径上的两个阶段。

自动化是基础，智力是核心。自动化阶段是可以自动的依据指令或信号完成某项流程或动作，不需要人工介入。但是需要人工触发信号，即没有自我辨识能力。而智力是可以通过自我学习，外界指导学习后作出自我判断，并根据判断后的结果自我沉淀经验，持续完善经验并作出最优判断。当然这个智力主要指的是IQ层面，不涉及情感或EQ。如果涵盖情感因素我认为这就不仅是智能，而是类人或超人化存在。

所以通过智力判断后作出指令控制，并自动化执行。这一套流程结合起来就是智能化要做到的。类似于大脑和肢体的协作，大脑发出指令，肢体自动化执行，还会存在简单条件反射。可以理解最原始的初始化智力就是由简单规则组成的本能的简单条件反射。

那么我们如何一步步达到智能化？这看似是一个由高科技堆叠而成的理念，但抛开技术实现来说智能化的具体路径抽象来看应该都一致的，所以在这不探讨软技术和硬件如何配合实现，而是来看智能化演进的路径。在我的概念里，现在应用最广泛的机器学习甚至深度强化学习也只是技术选型之一，我认为并不一定是最优解。下面我会抛出智能化演进路径的框架，来进一步探讨。

这就不得不从思维形成过程来说，即人之所以可以做出多种判断来抽象判断性思维形成过程的原因。有言道：世上本无路，人走皆有之。人走的多了自然而然就形成了路，这其实暗含了人们经过多次的尝试或由于习惯沉淀下了一些规律，逐步演变为了规则。“路”可以理解为共性的规则，因为路可能是两地间的最短路径，也可能是大多数人的走路习惯。规则让人有了判断标准或能力。

当路走多了以后，人们自然就会依据规律去规划道路。也就是说，由于大量规则的衍生，根据规律出现了思考、规划甚至预测能力。像呱呱坠地的婴儿，刚出生就被社会的条条框框所约束。通过学习规则，逐步形成了判断力，甚至成长后思考如何改变规则。

只有判断能力在如今不能称为智力或者高等智力，因为仅仅熟知做事原则并遵守就可以拥有判断标准。当具备思考能力，可以创造或改变规则那么就具备了初步的智力。

那么智力如何衍生出来的呢？我们抽象一下就是规则、规律、强化、刻意、重复和反馈。我们思考的过程或结果需要有反馈才能进行思维进化，这就是为什么你做一件事从来没有拿到过结果，你并不知道你的做法是不是对的，是不是成功可行的，很难再去进一步决策。

对于思维进化来说反馈是极其重要的一步，也是整个思维进化闭环中的最后一环。思考过程需要有结果的指导，这个结果往往会奠定继续下去的方向。比如发散思维是空想，但最终还是要归于一个点，否则思考是没有意义的。也没有辨别你思考正确与否的机制，这样就不能保证智力是正向提升的。

一、“智力”或“思考”是依托场景化的区分

对于“思考”，拿我们自身举例，“思考”和“思维”也是分场景的。这个场景可能是某项专业技能，可能是生活中的某个片段，你所作出的结果都是依据特定场景下的思维判断。这不是局限，而是模块化思考的能力。所以我们逐步学习和成长的过程实质是在不同场景中逐步学习、碰壁和反馈中渐进发展的，并不是一概而论的。所以大脑只是承载了不同场景中的智力学习、存储和运行，并不会有一个通用的思考能力覆盖所有场景。

现阶段（现在的科学不一定就是真理）在对大脑的科学研究发现，无论是记忆还是正在发生的事情大脑都是以小的片段化记忆并处理的，所以我认为“片段”就是大脑对小场景的划分。

智能化的过程也是模拟以上场景化下的学习、判断、反馈及经验沉淀来形成思考和思维并不断重复和强化。而在模块化、场景化思考能力之上需要一个全局的思维管控，根据模块场景优先级进行精力分配及协调。

智能化其实也是对大脑认知的抽象，大脑认知根据成长我分为了两个阶段：

1. 第一阶段

第一阶段是大脑运作的基础闭环：学习、感知（已发生场景识别）、判断决策、触发动作执行、反馈、知识经验沉淀（顺序为信息传递方向）。

我们通过知识的学习记忆来感知事物或环境并作出相应判断，基于判断会出信号来触发自身的行为动作，并通过事后的神经反馈来知晓结果，并把整个过程作为记忆储存为经验和学习的拓展为以后同类事情的发生提供辅助。这是我们日常也是最基础的大脑行为过程。

第一阶段是可自动化所具备的条件，而形成自动化的过程也就是规则经验沉淀的过程，即判断和反馈。自动化形成后的持续运行是对外界环境多样性的沉淀及相似场景的刻意练习。即使对于人的大脑来说，智力成长的过程也需要不断的刻意练习去刺激大脑皮层来增加更多神经元的生成。而刻意练习的过程同样适用于机器，刻意或重复练习是从自动化通往智能化的必经之路。

2. 第二阶段

随着知识经验长期的积累沉淀，第二阶段便衍生出了：预感预测（第六感，未发生场景预知）、反哺学习、预知决策（预测场景判断决策和已发生场景判断决策）、灵感（随机行为和思想）（顺序为信息传递方向）。

你会发现有时我们会提前去思考某一件事可能即将或未来会发生，或者是提前去思考事情发生的多种可能性，并根据你预想发生的情况去作出提前应对方式。甚至有时也会出现类似第六感或Deja Vu。而且有时你会发散思维或想象去做一些与常规格格不入的事情，例如很多我们难以理解的艺术品。这些其实就是与第一阶段常规不同的进化部分，这个进化的缘由很大一部分就是经验的积累带来视野边界的扩大。

很多人说“教育”限制了孩子的想象力，这是个伪概念不详细探讨。但是想象力是来自于已有基础的边界扩充，简单来说就是，你都没有交通的概念，怎么会能凭空的创造出一个交通工具？类似于你都不知道基础科学怎么可以在此之上进行科学突破或研究？

所以当知识、经验丰富到一定程度后，大脑会更容易的作出预测甚至形成潜意识的预感和灵感。并且可以根据经验对预测和预感作出判断及应对策略，这是你心智模型的构建过程。

心智模型的逐步成熟意味着智力的产生，也就意味着具备了智能化的核心。

何以智能

图1 大脑认知抽象（做图不易，且看且珍惜）

以上是通过大脑认知抽象来看智能化的路径，可能过于抽象但理念却是相通的。那么如果把智能路径具象通过平台化、产品化如何实现？我们带着此疑问逐步进行拆解。

首先为了引出智能化与知识图谱的关系，并让大家更好理解。我们先来认清一下数据和知识的关系。

二、“数据”和“知识”的关系

上文中我一直都在强调知识，那么知识是什么？数据就是知识吗？为了更好的理解后面知识图谱的重要性。这里先初步解释一下，避免混淆数据和知识的概念。

简单来说知识和数据是逐级包含关系，也就是说知识是由数据构成的。这个大家可能理解，但并不是所有的数据都是知识。首先我们来拆解一下，通过对数据的分析加工变成了信息进行传递，而信息只是有效传递的一种形式并非知识，只有提炼出信息与信息之间的联系并进行应用便转化为了知识。知识是有特定关联的信息的集合和应用。

可能一时揭露本质难以理解，可以细细体会。

三、“智能化”与“知识图谱”的关系

信息与信息之间相互联系才构建形成了知识。

知识图谱是对经验的构建，也是知识沉淀的一种方法。

知识图谱简而言之是对现实世界实体与实体之间关系的构建和对实体属性的定义去来构建知识体系的。而通过关系的推理可以知道在某些场景下所能联系出的方式方法和策略，相当于基于经验知识的智能。

举一个实际数据应用场景的例子：比如最常见的数据分析场景。进行数据分析的时候，当前业务的分析维度或指标是需要你依据业务场景来设想。如果基于已有的知识体系和经验会推荐出跟你相关的数据指标或数据维度，这取代或节省的是你设想和构思分析模型的时间和效率。

你会发现这种应用在不同工作中都会存在很多类似的场景：像特征工程的特征筛选；运营、营销和风控等策略方法相关场景。总而言之运用到知识经验的场景都可以进行应用。

但现阶段对于创新还是有一定难度的，目前主要应用还是在于历史经验的筛选。不过可以通过后期图推理能力的增强进行关联性创新，即通过关联到的其他维度进行方法的适配。如营销策略从风控策略中抽象而来的方法也不是没有可能。

四、反哺和吸取

说到创新，从机器智力的角度，有一点是难以实现的。就是我以前文章《深入数据分析思维》中提到的“无中生有”。因为这个东西在机器的世界里（数据）从未出现过，也无法通过组装的方式衍生出来。但是有方式可以弥补这个缺陷，即快速的新知识获取，获取速度尽量等同于新知识的产生速度。

我们再来回顾一下人的思考过程，你会发现人的创新或想象力并不是凭空出现的，也并不仅仅是靠训练而获得的，其中还有一种思考的原材料，就是知识和经验。人是根据不断获取外界的知识和经验去进行思考和实践，之后对已有知识体系的排列组合。

所以我们可以通过把自动化构建知识作为思考原料的补充，通过迅速爬取和自动构建知识体系，可以近似于无限接近知识的边界而拥有了创新能力。

五、智能化要减少或避免偏见

虽然说智能化是一个人人都期待的未来，但好事物总是一把双刃剑。智能化也不例外。而产生偏见或许是需要担忧的核心问题，这涉及了道德伦理、社会和人权等一系列问题。因为智能化很大程度要么依赖于人或事（作为输入）的特征并且结果（作为输出）作用于人，对于真实生活中的人来说有偏见很正常，每个人会有自己善恶丑美的判断标准，大自然会中和人们偏见带来的影响。而对于平台来说，一个中立的系统，从另一种意义上说就代表着大自然的地位。带有偏见的决策可能就会是毁灭性的。

六、智能化的特点：用户的感知一定是简单

智能并不代表着复杂。相反，智能给人的感觉一定是易用易懂。智能化的逻辑过程虽然复杂，但是产品平台的意义就是把智能化的逻辑封装作为知识体系传递给用户，面向用户的仅仅需要简单的操作指令去应用知识。如果把过程暴露给用户，智能化并不能提升效率反而会造成极大的使用成本，这也失去了智能的意义。

你会发现自动化的前提可能会很复杂，比如预先定义一些固化的标准，然后基于标准进行自动化的处理。而定义标准或是SOP的过程是繁杂的。用户定义的过程相当于一次沉没成本的投入，换取后续固化下来的自动化。而且作为用户要考虑到各种情况的应对策略，否则自动化就会陷入死胡同。

因此自动化是把知识逻辑开放给用户的；而智能化是封装了自我衍生的知识逻辑，用户要做的是告知应对的场景是什么。

七、智能化的产品平台

通过启发式思考，抽象来看对于智能平台应该具备的核心能力或者模块应该有哪些？依于此，智能化的平台如何构建？

1. 平台产品智能化路径

我们根据抽象出来的每个环节来对应平台核心能力（这里所说的平台没有属性的倾向性，因此没有对应场景去说明，完全高度抽象）。

那么核心能力链路就要涵盖：数据感知中心（数据采集、收集和计算引擎）、知识中心（知识沉淀、知识图谱）、事件感知识别（依据知识做出的判断）、学习中心（算法及图推理引擎）、中央控制枢纽（资源协调、任务分配及熔断）、人工干预（强制人工介入）、全局可视化。

下面详细阐述一下各个能力的组成逻辑。

1）知识中心（知识沉淀、知识图谱）

对于“学习”来讲，首先需要具备“知识”，而知识的积累过程是来源于用户的“灌输”和对外界的“感知”。从知识维度来讲，我们需要区分知识的类型。我分为了四大类：①事物特征；②识别规则；③操作行为；④平台经验。这四类知识分别代表着对外界真实的感知，感知后的认知及判断和决策后的处置动作。因此这个知识体系可以覆盖整个平台的自动有效运行。而平台自身依据知识学习后的实践反馈可作为平台自身经验沉淀后作为后续迭代进化的基础。

感知“事物特征”需要根据接触到的事物的事实进行数据化后收集并提炼，例如看到一只动物对它自身的毛发颜色、奔跑速度等一系列事实存在的特征数据化提炼。当然是需要对事物处置前、后的特征都进行沉淀，这需要作为对执行过程的反馈和结果认定的标准。

对于第一步真正知识的“灌输”是根据用户已有对事物特征的判断经验而抽象的规则，这也是最简单也最常见的经验运作方式，随之沉淀为平台的识别规则。

基于面对的事物及其特征进行规则判断后，下一步是用户的处置动作。而处置的操作行为是作为后续提炼决策的一个重要知识。我们可以依据事物特征、特征与判断规则及处置方式的联系进行后续的学习并形成平台自己的决策知识。

2）数据感知中心

数据感知本质是一个传感器的存在，主要是对外界环境事物和内部数据的采集和收集，感知的核心是数据变化需要精准和精确。知识中心沉淀的事物特征、操作行为是需要通过数据采集加工后进行标准的知识沉淀。当然数据是一条很复杂的链路，这里我就不再细说，感兴趣的同学可以去研究或私下问我数据采集和加工链路。

3）中央控制枢纽（监控、协调、分配、熔断）

中央控制枢纽主要是对平台应对场景的感知和内部多模块中心的协调运作进行监控、协调处理与任务分配，如对场景数据的感知从而触发相应的执行操作、不同环境下执行操作的计算资源弹性调配、模块性能的优先级保障、运行状态监控和分配任务执行链路等。并通过定义核心关键指标来限制平台智能不得突破应对场景的操作底线，否则直接触发熔断的保障机制让智能失效，降级回归至硬规则自动化或人工介入。

整个模块相当于平台自身智能化操作的触发监控和触发后平台的协调调度中心，保障各种环境状态下的运行正常和机制健全。

4）学习引擎

学习对于平台来讲是需要图算法构建和图推理的一个过程，前提是需要大量的数据积累。包括用户所要应对事件的特征、用户对于此类事件在平台上的操作处理行为、操作触发后事件所表现出的结果特征、用户对此事件的评定和处理方式，以及处理方式结论的评价。这些都需要作为知识和经验保存下来，因此知识图谱的应用是助力学习与智能运用的一剂良药。

5）事件感知及策略

事件感知分为两方面：预测和识别。

预测是基于历史的知识经验，并结合推理出的更多可能性，可以对现在环境的特征预测未来各场景下事件发生的可能性；识别是对当前正在发生事件的特征进行辨别判断从而识别。通过预测和识别的场景进行针对性的策略应对。这一模块是智能化下的执行环节，有效的进行策略输出与执行。

6）人工干预

顾名思义，人类从来都是把最终掌控权掌握在自己手中，也往往是安全机制中的最后一环。简单来说就是自动切手动，人工作为智能的保障。

7）全局可视化

全局可视化不必多说，需要尽可能的把环节中有用和事件处理的结果效果有效的展现出来，让人更直观、更透明且有预期的对全局的把控。