深度分析:从智障到智能体,无用阶级要到来了吗?
2022年11月30 OpenAI 发布了ChatGPT,一时间引爆人工智能话题。为什么这次ChatGPT反响如此之大,而在其它细分领域例如机器学习、图片识别、OCR、图片搜索、神经网络,决策树、脑机接口、机器人辅助、机械臂、机器人、骨骼设备、自动驾驶、智能家居、智能推荐等一直都是平静发展?
我个人认为,主要原因是这次大语言模型的突破似乎破解了人类思维的奥秘,对人类自以为至高无上、引以为傲、区别去其它物种的思考、创造、表达能力产生了剧烈的冲击,让人感受到了前所未有的被替代危机。面对这个危机,我们更需要乐观地探索人工智能如何更好的造福人类,更应该多思考如何落地应用好这些智能科技,钉钉AI助手在这样的背景下诞生,必将是一次伟大的尝试与探索。本文将从自己的亲身实测钉钉助手,结合自己5年的产品工作经验对AI进行思考,聊聊钉钉AI能否站在AI落地应用的浪潮之巅。
一、人工智能发展简史与背景
讨论AI之前我们先了解下它的历史和背景。AI(Artificial Intelligence)–人工智能,这一概念是在1956年由一众AI领域的科学家、数学家、教育者等在达特茅斯学院召开了一个研讨会正式确立,之后被大家接受并推广。这些开创者的代表人物有约翰·麦卡锡(John McCarthy), 马文·明斯基(Marvin Minsky), 纳撒尼尔·罗切斯特(Nathaniel Rochester)以及克劳德·艾尔伍德·香农(Claude Elwood Shannon)。
● 在此之前人工智能已经萌芽孕育了十多年,最早可追溯于1943年神经生理学家麦卡洛克(W. S. McCulloch)和皮茨(W. Pitts)的神经元模型。
● 20世纪60年代AI迎来了第一次浪潮期,发展出了符号逻辑,解决了若干通用问题,初步萌芽了自然语言处理和人机对话技术,其中代表人物和事件有:
✧ 丹尼尔·博布罗(Daniel Bobrow)在1964年发表了《计算机问题解决系统的自然语言输入(Natural Language Input for a Computer Problem Solving System)》。
✧ 约瑟夫·维森鲍姆(Joseph Weizenbaum)在1966年发表了《任务型对话系统研究综述(ELIZA—A Computer Program for the Study of Natural Language Communication between Man and Machine)》。
但由于此时期的人工智能更多地侧重底层的逻辑和通用问题的求解,大家对人工智能的热情也逐渐褪去,人工智能也进入了近十年的“寒冬”。
● 20世纪70年代末至80年代迎来了人工智能的第二次的浪潮,各种人工智能框架、理论和产品在此期间涌现,也标志着人工智能在细分领域开始蓬勃发展。其中代表人物和理论有:
✧ 1975年马文·明斯基(Marvin Minsky)提出明斯基框架用于知识表示(Knowledge Representation),针对的是人们在理解事物情景或某一事件时的心理学模型。
✧ 1976年Douglas Lenat(道格拉斯·布鲁斯·勒纳特),发表启发式搜索(Heristic Search)。
✧ 1976年Randall Davis发表大规模知识库构建与维护(Large Scale Knowledge-Base Construction),在基于知识的系统和人机交互领域做出了开创性的贡献。
✧ 1982年David Marr 发表计算机视觉(Computer Vision),学习和运算能让机器能够更好的理解图片环境,并且建立具有真正智能的视觉系统。
✧ 1979 年 7 月,Hans Berliner(汉斯·柏林格) 开发出一款名为 BKG 9.8 的计算机程序在蒙特卡洛举行的世界西洋双陆棋锦标赛中夺得冠军,
✧ 朱迪亚·珀尔(Judea Pearl)提出贝叶斯网络(Baysian Network),它可以模拟人类推理过程中因果关系的不确定性处理,其网络拓扑结构是一个有向无环图(DAG),一种概率图模型。
✧ 1986年,Brooks发表论文《移动机器人鲁棒分层控制系统》基于行为的机器人(Behavior-based robotics)标志着基于行为的机器人学的创立。也让人工智能在二个观念上做了转变:第一,智能不是符号化的模型;第二,智能不是由输入得到输出的计算过程。
之后经历10年的平稳发展期
● 2006年以后进入了第三次浪潮与之前最大的不同,这次引领浪潮冲锋的是企业:
✧ 2006杰弗里·辛顿(Geoffrey Hinton)等人提出的深度学习。塞巴斯蒂安·特龙(Sebastian Thrun)在谷歌领导了自动驾驶汽车项目;
✧ IBM 的沃森(Watson)于 2011 年在《危险边缘》(Jeopardy)中战胜人类、获得冠军;
✧ 苹果在 2011 年推出了自然语言问答工具 Siri 等;
✧ 2016年谷歌旗下DeepMind公司推出的阿尔法围棋(AlphaGo)战胜围棋世界冠军李世石。
✧ 特斯拉自动驾驶技术从2014年发布到如今FSD软硬件逐渐成熟,已达到Level 3、Level 4高度自动化级别。
可以说这次人工智能浪潮的影响是前所未有的。
● 在2022 年在经历疫情冲击,经济下行全球经济低迷之际,互联网急需一针强心剂来改变现状,ChatGPT横空出世,一夜引爆人工智能话题,这一大语言模型让大家切实感受到了AI从“智障”到真切智能的转变。一时间资本趋之若鹜,进而促使AI更加风靡互联网各行各业。不管是出于被资本的追捧、还是对于新技术的探索、再或怕落后时代的焦虑,互联网公司纷纷如此,截止2024年市场上除ChatGPT 推出4.0版本外还涌现了众多AI产品:
✧ Google 推出了Bard(现改名Gemini),Facebook开源了Llama模型,马斯克开源了Grok模型,国内也出现了百度文心一言,讯飞星火推出了天工AI搜索,字节的豆包,阿里的通义千问。
✧ 文生图代表Midjourney,OpenAI DALL.E,生成式视频代表Sora视频生成,Gen-2, runway。
✧ 还出现众多细分领域的小模型,例如图片增强、去水印、抠图、音视频的增强等。
✧ 还有很多基于小模型,实施落地应用的各种聊天、文本生成式应用横飞。
汹涌的AI浪潮滚滚而来,浪潮退下,经过洗礼留下的AI应用才是真正的弄潮儿。
二、产业AI的迅速发展
在互联网行业大家深知,一旦一项技术趋域成熟,在其垂直领落地应用的窗口期只有两年。因此在AI火爆之后,国内大厂纷纷入场,都想在这两年窗口期中拔得头筹,阿里自然也在其中,包括一个典型样例-钉钉。
● 在2023年4月,钉钉宣布全面智能化,首先在B端发力,将所有产品要用大模型重塑一遍,截止目前钉钉不仅完成了在B端业务功能的智能化,钉钉这次的AI升级将智能化底座(AI PaaS)开放给生态伙伴和客户,用大模型帮助生态把产品重新做一遍,并推出基于AI PaaS长出来的创新产品“数字员工”,以及多款智能化场景方案和智能化行业方案。这标志着钉钉智能化已全面进入生态层。
● 在to C 侧2024年1月4日开放一款国民级工作应用钉钉个人版AI,并在不断的升级,目前已上线图片理解、文档速读、工作流等产品能力率先探索多模态、长文本与 RPA 技术在 AI 应用的落地。
● 除此之外,2024年4月18日,钉钉正式上线AI助理市场(Al Agent Store),个人用户、企业、开发者开发的 AI 助理可通过上架市场,分享给更多企业。
钉钉AI官方为其功能和角色定义;
● 基于AIGC浪潮进入生产力和应用场景的最新判断:AI Agent是最佳AI应用入口,钉钉要成为低门槛、高频、开放的AI智能助理平台。
● 其模型主要的能力是环境感知增强,记忆增强,推理规划增强,行动系统增强。
● 主要的场景应用有工作流,工具插件,长文本,多模态,分享进通讯录摘要总结,创作生成,数据分析,信息提取,客服咨询。
由上我们可以得出钉钉AI 要持续智能化迭代发展的4个重要核心;
1. 模型基础建设持续投入,不断优化提升智能性,让自己在众多模型中保持优势。
2. 推进生态的建设,开放智能化底座,三方的AI落地应用也可以接入钉钉,先前在App上已经火了一把的妙鸭相机已同步上线自己的产品到钉钉的个人版中。
3. AI Agent 概念,只需要简单的场景预设,根据自己的垂直领域增加一些历史知识库就能创建属于你自己的AI助手。同时钉钉AI还搭建了助手市场平台,大家可以在上面发布分享彼此的AI助手。可以猜测后期平台大概率会支持AI助手的交易,届时将有一部分人在这里找到自己的财富机会。与此相似的是电商后台的各种工具,不过钉钉AI开发门槛更低,这也让更多人有了进入的机会。
4. 个人版的钉钉。垂直领域的终点必将是每个人的需求,一方面个人用户的量级是to B 用户无法比拟的,另一方面AI 助手更符合千人千面的需求场景,因此钉钉在此时推出个人版是极其关键的,可以猜测如果尝试成功,钉钉个人版必将独立面相市场。与其对标的就是文心一言,作为国内首个推出对标ChatGPT的产品,它目前的产品生态建设是不容小觑的,同时在百度系生态下的功能应用也能见到AI的身影,搜索结果的AI智能回答,图片搜索后对图片的AI放大,去水印,扩展,局部替换、重绘,相似图绘制等功能。
钉钉在AI落地应用上的全面、深入、彻底,在国内甚至全球都是前所未有的。大力出奇迹,先天的大厂资源优势,加上如此的市场、技术风口,我对钉钉AI最后的成功持乐观态度。
三、钉钉AI助理深入使用后的总结与感受
本人是从事互联网工具类产品开发的产品经理。下面是以一个自己曾经做过的“屏幕录制”工具的项目为主题,模拟产品经理在接触一个新事物到需求方案落地过程中钉钉AI助手能为我们提供哪些支持帮助。主要围绕5个核心步骤:市场行业了解,基本原理了解,用户场景分析,核心需求分析与提炼,需求文档的编写。
市场行业了解:在助手市场中搜索查询“市场调研”关键字并未有结果,因此找了相关的通用角色的“产品经理小助手”任务角色来帮助我解决了解市场。
问题:互联网工具类产品的发展现状
问题:现在开发一个“屏幕录制”工具产品还有市场机会吗?
可以看出,AI助手的回答确实能给出一些核心内容和竞争对手,这对产品工作有很大的指导意义,但内容过于模式化,笼统,对于实际落地还是需要进一步细化,当然也可以用AI助手帮你进一步处理。
基本技术原理了解:屏幕录制技术原理是什么?技术壁垒在哪里?
对于技术相关的回答,对产品经理新接触一个产品来讲已足够,对于经验深厚的产品经理来讲就很鸡肋。
用户场景的分析:有哪些核心的用户场景
核心需求分析与提炼:用户的需求痛点是什么
用户场景和需求痛点分析,给出的答案是所有问题中我最满意的,它很快地罗列出了这个产品在互联网用户中的需求情况。这个不错的结果或许跟我选择的是互联网工具产品,在模型训练数据中具有一定的优势。至于具体的核心痛点需求还是需要根据自己的开发市场情况选定一个方向。
需求文档编写:在助手市场找到了更相关的角色“产品需求文档专家”,于是切换使用。
问题:我想要设计一个屏幕录制产品
Q:请帮我详细地写出
此时发现给出的答案太不尽人意,需要提供的信息太多,对于一个新手的产品经理来讲门槛太高,于是转回钉钉AI助手。
Q:写一份关于屏幕录制产品的需求文档,尽可能详细
此时长文本的结果的展现,内容结构的完整给了我深深的震撼。AI 助手能帮助新手产品经理提供这样的产品文档大纲是很有裨益的。
值得一提的是在文末它还提供了跳转钉钉文档的入口,你可以在此基础上进一步细化完善,从这能看出钉钉AI在工作场景、工具间的衔接,体现出了它强大的整合能力。不足的是:会话会自动断开,有时候会衔接不上,还会重复回答,当然这些瑕不掩瑜,毕竟产品开发迭代过程中bug才是推动进步的根本。
再谈谈交互与体验。
使用一个产品给用户的成本主要有三种:认知成本,视觉成本,行为成本;这三种成本从难易程度上来讲,认知成本 > 视觉成本 > 行为成本。
● 认知成本:钉钉AI助手团队版在标题栏右侧用一个显眼icon作为入口,这不难看出钉钉对AI助手的重视,用户会很容易注意到。进入钉钉AI助手,为了降低认知成本,钉钉AI提供了常用的提示语,可以让用户快速的完成第一次提问试用,在整个对话过程中也有不断的引导提示,保证用户顺畅的使用。
● 视觉成本:虽然钉钉AI支持多模态,长文本交互,但是它会考虑人们常用的习惯以及对内容的理解,一方面控制每次返回的长度和内容的精准性(自然也会有成本的考虑),另一方面当每次新的会话出现,旧的会话会折叠起来,帮助用户区分分割内容,同时整个界面风格也比较清爽。
● 行为成本:钉钉AI助手可以快速唤起,内容输入不仅可以文字输入手机端也可以语音输入。在助手市场中为用户对角色进行分门别类,能很快的帮助用户找到想要的AI助手角色。在人物角色的创建上面,把复杂的模型调参浓缩简化成简单的关键性字段,让每个人创建合适的专属助更加简单。
总的来说,整个钉钉AI助手的产品体验比较良好,能感受到钉钉强大的产品力。
四、AI目前到底为我们带来了哪些价值
产品如果不能帮助用户解决一些核心问题是无法持续的。新事物出现以后,涌入的用户会有一部分是尝鲜的心态,如果不能快速创建让用户对产品念念不忘的锚,新鲜感过去产品终会难逃被冷落的命运。在使用完钉钉AI我感知到了以下的价值。
● 降本增效。对于to B的企业来讲最核心的是降本增效,钉钉AI在各个领域的垂直落地应用,例如报表智能可视化,历史内容的学习检索,内容的总结提取,智能问题客服等确实可以为企业进一步降低成本。但不可忽视的是让一个企业员工都学习使用最新的钉钉并接收这种工作方式也需要一个长期的适应和转变成本,企业为此有可能面临着整个员工的更换交替,这种不确定性做企业管理者是必须要考虑的。
● 娱乐属性。钉钉AI助手确实变得更加智能,甚至可以创建出一个极为真实的具有感情色彩的虚拟人物对象,市场上对应的垂直领域的应用众多,也获得了不错的效益。从这方面看AI助手在娱乐领域确实可以大有作为。钉钉AI出于对自身产品的定位,虽然在团队版会弱化相关属性,不过在活动组织,对话组织,一些周边场景上也能感受到它的娱乐属性,但钉钉AI的个人版将可以大力发展。
● 帮助与支持。AI助手缩短了人们对一个新事物的认知成本,从传统的各种资料搜集理解到现在的即问即答,极大地缩短了时间。复杂的操作流程被语言对话指令替代,收到正确指令后它能在后台帮你快速处理,比如快速订票,查询天气,规划路线等。
● 工作流中的深度结合使用。钉钉AI对垂直工作流的融合和服务支持,已经能为互联网从业者在日常工作的各个环节提供帮助,例如会议记录总结,周报汇写,数据分析可视化等。极大了提高了个人的工作效率。
五、AI发展的反思
任何一个事物的发展都会对社会、环境以及周围的事物产生冲击和负面影响,AI 的发展也不例外。最近在美国有新闻事件报道,智能汽车上路,人物迫于对其工作替代的焦虑,出现了打砸自动驾驶汽车的恶性事件。表象之下,这是人们对科技AI发展焦虑的反应。
● 使用者内心的安全感。AI 让信息的获取太过于简单,决策也太过顺利,对于我们大部分跟着互联网发展起来的用户来讲,这份简单会造成心里的不安全感,纵使你给的答案可能比我在各种费时费力权衡利弊之后的决定更优,我还是可能选择相信自己。因此解决AI准确性,及时性将会是一条漫长的历程。
● 中心化的依赖。模型的部署是高度中心化的,传统离线的模型例如盘古,Siri,各种助手,迭代升级会受限,智能水平远达不到高度集中部署的模型。深度依赖AI助手后,我们会退化获取知识的能力,当AI设备损坏,寒冷,偏远,深海等极限环境下,AI助手无法运行后我们最后的保障在哪里。同时这个超级中心大脑如果无法独立运行,那当无网无电的时候我们将如何面对。
● 能源的限制。自然的规律总逃不过能量守恒定律,当AI为我们解决了问题提供了服务,自然会消耗更多的能量。大模型的训练,运行会极大消耗能源,一旦AI高度普及,能源消耗将是指数级增长。虽然人类对能源的探索从未停止,但自发明电力以来,人类对能源的开发利用上还未有一个革命性的突破,能看到能源的问题将伴随着AI的发展很快地到来。
● 道德与伦理。一部分在现实中受挫的人,在AI虚拟的人物形象中找到了安慰,幸福愉悦,虚拟对象的沉迷,虚拟世界沉迷,在这里所有的人生不如意都得到了实现,人们将会沉沦,是人类的进步还是危害值得我们思考
六、总结:未来已来,你准备好了吗
钉钉AI在to B和to C的全力投入,落地应用不可否认让我们看到了AI Agent的样貌,这个全方位的落地探索也是独一无二的探索。我对钉钉AI能否站在AI落地应用的浪潮之巅持乐观态度。
正如哲学家、文化学者王东岳先生提出“递弱代偿”,时代潮流汹涌而至势不可挡,能否对AI的恰当使用是决定一个人能否跟上时代潮流的重要能力,也终将成为拉开人与人之间距离的一个重要因素。
无用阶级的到来,尤瓦尔·赫拉利在《未来简史:从智人到神人》(Homo Deus: A Brief History of Tomorrow)中,提出了“无用阶级”(useless class)的概念。随着技术特别是人工智能和生物技术的迅猛发展,越来越多的传统工作可能会被机器取代,导致大量人口变得经济上无用,即他们无法为经济体系贡献足够的生产力来维持自己的生计。这种情况下,社会结构和人类身份可能面临深刻的变革,许多人可能会发现自己属于一个新的“无用阶级”。而此刻的AI让我们更加清晰地感受到这个时代的临近。
未来已来,保持积极乐观的心态拥抱迎接绚烂夺目的AI新时代。
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!