
许多组织最常见的幻灭感如下:他们对使用 ChatGPT 或 Microsoft Co-Pilot 的生成式 AI 感到兴奋,阅读一些关于 AI 如何“以某种方式使您的业务变得更好”的文章,然后尝试寻找其他他们可以打击聊天机器人的用例,最终当结果不是超级令人满意时感到失望。然后,理由阶段来了。我经常听到这样的话,“模型不够好”或“我们需要提高人们的技能,以编写更好的提示”。
在 90% 的情况下,这些不是正确的结论,而是来自我们在聊天机器人中思考的问题。我已经为三人组织到拥有超过 30 万名员工的全球企业开发了三十多个生成式 AI 应用程序,我到处都能看到这种模式。
有成千上万的公司告诉你,你需要有 “某种聊天机器人解决方案”,因为每个人都这样做。带有 ChatGPT 的 OpenAI、Microsoft Copilot、带有 Gemini 的 Google 以及所有其他向您销售聊天机器人的公司都在打破创建聊天机器人的初始障碍方面做得很好。但让我告诉你:使用生成式 AI 可以解决的真正痛苦的问题中有 75% 不会从聊天机器人中受益。
我经常看到经理、项目主管或其他决策者从这样的想法开始:“我们这里有一些带有 AI 的产品,可以让我们构建聊天机器人——让我们找到尽可能多的地方来实施它。“根据我的经验,这是错误的方法,因为您从一个解决方案开始,并试图将现有问题融入其中。正确的方法是研究问题,分析问题并找到合适的 AI 解决方案。对于某些用例来说,聊天机器人可能是一个很好的界面,但将每个问题都强行放入聊天机器人中是有问题的。

在本文中,我将分享我通过构建无数应用程序的实践经验而开发的见解和方法。这些应用程序现已投入生产并为数千名用户提供服务,这塑造了我对构建有影响力的生成式 AI 解决方案的想法,而不是盲目追随趋势,如果它不起作用就会感到失望。
首先考虑您的流程 — 其次是聊天机器人(或其他界面)
我告诉你不要从聊天机器人开始思考,那么你应该从哪里开始呢?答案很简单:业务流程。
公司内部发生的一切都是一个业务流程。业务流程是连接到工作流 [1] 中的不同活动(“工作单元”)、事件(例如错误)和网关(例如决策)的组合。有用于以众所周知的图表形式对业务流程进行建模的工具 [2],以及以分析和改进业务流程 [3][4][5] 为中心的整个研究学科。业务流程管理是一个很好的工具,因为它不是理论上的,但在公司中无处不在——即使他们不知道该怎么称呼它。
让我给你举个例子。想象一下,您是一家为银行进行房地产估价的公司。在银行发放抵押贷款之前,他们会要求房地产估价师估计物品的价值,以便他们知道如果无法偿还抵押贷款,他们有实际价格。
创建房地产估价报告是一个大型业务流程,我们可以将其分解为多个子流程。通常,估价师会亲自开车到房子,拍照,然后坐在那里写一份 20-30 页的报告,描述他们的估价。让我们暂时不要陷入“呃,一份 20-30 页的报告,让我坐在 ChatGPT 前面,我可能会更快”的习惯。请记住:首先是流程,然后是解决方案。
我们可以将这个过程分解成更小的子流程,比如开车到房子,拍照,然后写报告的不同部分:房子的位置描述,描述不同房间的状况和大小。当我们更深入地研究单个进程时,我们将看到所涉及的任务、网关和事件。例如,为了编写位置描述,房地产估价师坐在他们的办公桌前,做一些研究,在 Google 地图上查看周围的商店,并查看城市的交通地图,以确定房屋的连通程度和街道的外观。这些都是案例工作者必须执行的活动(或任务)。如果房子是一个偏僻的农场,公共交通选择可能无关紧要,因为这种房子的买家通常无论如何都依赖汽车。这种关于流程中要走哪条路径的决定称为网关。

我们在这里应用的这种流程驱动型思维方式从评估当前流程开始,然后再对其进行任何 AI 干预。
编排而不是基于聊天的交互
通过对我们的流程和目标的分析,我们现在可以开始研究使用 AI 的流程应该是什么样子。考虑我们需要采取的各个步骤很重要。如果我们只关注用于创建描述的子流程,则可能如下所示:
- 分析房屋周围的位置和商店
- 描述内部状况
- 除非位置非常偏远:查找最近的公共交通站点
- 为报表编写一页文本
是的,您可以使用聊天机器人以交互方式执行此操作,在那里您与“AI 陪练伙伴”合作,直到您获得输出。但这在公司设置中有三个主要问题:
- 可重现性:每个人的提示都不同。这会导致不同的输出,具体取决于提示用户的技能和经验水平。作为一家公司,我们希望我们的输出尽可能具有可重复性。
- 质量参差不齐:您可能已经与 ChatGPT 进行了互动,您需要多次改写提示,直到获得所需的质量。有时你会得到完全错误的答案。在这个例子中,我们没有找到一个可以高质量地描述周围商店而不会产生幻觉的 LLM。
- 数据和现有系统集成:每家公司都有他们可能希望在这些交互中使用的内部知识。是的,您可以使用聊天机器人进行一些检索增强生成 (RAG),但这并不是在每种情况下都能获得良好结果的最简单、最通用的方法。
这些问题来自聊天机器人背后的 LLM 的核心基础。

企业应用程序不应依赖“及时响应”交互周期,而应设计为一系列精心编排的、(部分)AI 驱动的流程步骤,每个步骤都针对特定目标。例如,用户可以触发一个多步骤流程,该流程集成各种模型和可能的多模式输入,以提供更有效的结果,并将这些步骤与无需使用 AI 即可检索数据的小脚本相结合。通过整合检索增强生成 (RAG) 并最大限度地减少人工干预,可以创建更强大和自动化的工作流程。
与通过交互式界面进行手动编排相比,这种编排方法可显著提高效率。此外,并非流程中的每个步骤都应该完全依赖 AI 模型来完成。在上面的示例中,我们实际上发现,使用 Google Maps API 获取附近的站点和公交站在质量上远优于询问像 GPT-4o 这样的优秀 LLM,甚至是像 Perfasciity 这样的网络搜索 RAG 引擎。
通过编排提高效率
让我们想一想没有 AI 的时代。手动过程可能需要大量时间。假设一个任务需要 1 小时手动完成,该过程重复 4 次,总共需要 4 小时。使用由生成式 AI 提供支持的聊天机器人解决方案可以节省 50%(或任何百分比)的时间。但是,剩余的时间用于制定提示、等待响应以及通过更正和调整确保输出质量。这已经足够好了吗?

对于重复性任务,尽管节省了时间,但在多名员工执行同一流程的组织中,需要制定提示、等待和调整输出以实现一致性可能会成为问题。为了解决这个问题,利用流程模板变得至关重要。
使用模板,流程被通用化和参数化,以便可重用。创建高质量流程模板的工作只发生一次,而单个案例的执行效率会显著提高。花在提示创建、质量保证和输出调整上的时间大大减少。这是将基于聊天机器人的解决方案与使用 Templates 的 AI 支持的流程编排进行比较时的核心区别。而这个核心差异对质量和可重复性有巨大影响。

此外,我们现在有一个狭窄的领域,我们可以在其中测试和验证我们的解决方案。在用户可以插入任何内容的聊天机器人中,以可量化的方式测试和找到信心是很困难的。我们定义和限制用户可以插入的可能参数和文件的次数越多,我们就越能更好地定量验证解决方案。
在 AI 支持的流程中使用模板反映了传统流程管理中业务流程引擎的原则。当出现新情况时,这些引擎会利用模板存储库并选择相应的模板进行编排。对于编排,然后填充输入参数。
在我们的房地产评估过程示例案例中,我们的模板有三个输入:对象类型(单户住宅)、内部图片集合和地址。
流程模板如下所示:
- 使用具有给定地址的 Google Places API 查找附近的商店。
- 使用 OpenAI 视觉 API 描述内部条件。
- 使用 Google Places API 查找最近的交通选项。
- 从 1 中获取输出 JSON 对象。和 3.和运输选项的描述,并使用 GPT-4o 创建一页具有以下结构的文本:对象、商店和交通的描述,然后是内部描述和结论,给每个人打分。
在我们的示例用例中,我们使用带有内置无代码构建器的 entAIngine 平台实现了应用程序。
请注意,在此过程中,只有 1/4 步骤使用大型语言模型。这是一件好事!因为 Google Maps API 永远不会产生幻觉。是的,它可以有过时的数据,但它永远不会 “只是编造一些听起来像是现实的东西”。其次,我们具有人工循环的可验证性,因为现在我们拥有可以分析和签署的真实信息来源。
在传统的流程管理中,模板可以减少流程可变性,确保可重复性,并提高效率和质量(如六西格玛等方法所示)。这是我们在这里必须采用的相同心态。
用于生成式 AI 应用程序的接口
现在,我们已经开始了一个使用 LLM 的流程,但也解决了很多令人头疼的问题。但是用户如何与它交互呢?
这种流程的实现可以通过手动编码或使用 entAIngine [6] 等无代码 AI 流程引擎来实现。
使用模板对业务流程进行建模时,交互可以以各种方式进行。根据我过去 2 年的经验,对于 90% 的生成式 AI 用例,以下接口是相关的:
• 知识检索界面:功能类似于搜索引擎,可以引用和引用来源。
• 文档编辑器界面:将文本处理与对模板、模型和编排的访问相结合。
• 聊天界面:用于迭代、交互式参与。
• 无专用接口 (RPA) 的嵌入式编排:通过 API 集成到现有接口中。
最后的问题是,最有效的交互方式是什么?是的,对于一些创造性的用例或非重复性的任务,聊天界面可以成为首选工具。但通常情况并非如此。通常,用户的核心目标是创建某种类型的文档。然后,在编辑器界面中提供这些模板是一种非常有效的交互方式。但有时,如果您有一个想要使用 AI 进行增强的现有应用程序,则无需创建另一个隔离的接口。这里的挑战只是执行正确的流程,在现有应用程序中获取它的输入数据,并在应用程序界面中的某个位置显示输出。
这里提到的这些接口构成了我迄今为止遇到的大多数生成式 AI 用例的基础,同时支持与企业环境的可扩展集成。
底线
通过将他们的注意力从“我如何在任何地方使用 AI 聊天机器人”转移到“哪些流程执行哪些步骤以及如何在这些步骤中使用生成式 AI”,企业为真正的 AI 影响奠定了基础。将 AI 与现有系统相结合,然后只研究您需要的用户界面类型。通过这种方式,您可以释放无法超越聊天机器人思考的企业甚至做梦都想不到的效率。
引用
[1] Dumas 等人,“业务流程管理基础”,2018 年
[2] 对象管理组。“业务流程模型和表示法 (BPMN) 版本 2.0.2。”OMG 规范,2014 年 1 月
[3] van der Aalst,“流程挖掘:数据科学在行动”,2016 年
[4] Luthra, Sunil, et al. “全面质量管理 (TQM):原则、方法和应用。”第 1 版,CRC 出版社,2020 年。
[5] Panagacos,“业务流程管理终极指南”,2012 年
[6] www.entaingine.com
联系我们
工四科技 是一家前沿技术公司,提供云计算、大数据、信息安全和人工智能解决方案。我们致力于利用创新技术助力企业数字化转型,推动业务增长。我们的业务范围包括:
云服务:作为 AWS 和 Akamai 合作伙伴,提供全面的云计算和企业上云解决方案,帮助企业实现高效的云端部署和管理,满足各种规模的业务需求。 安全防护:通过安全托管应对未知的网络威胁,通过SOC安全运营中心提供一个全面的网络安全解决方案,集成了资产管理、入侵检测、调查响应、风险防范等多项功能,旨在为企业提供全方位的网络安全保护和管理服务。 RPA(机器人流程自动化):通过自动化技术,提高业务流程效率,降低运营成本。 PWA(渐进式 Web 应用):开发跨平台的 Web 应用,为用户提供接近原生应用的体验。 短信服务:提供全球短信,语音短信,满足企业通信需求
0 Comments