在启动 AI 计划时,许多公司陷入了各自为政的境地,将 AI 视为一项纯技术业务,将领域专家边缘化或让其参与得太晚。最终,他们开发出了通用的 AI 应用程序,这些应用程序忽略了行业细微差别,给出了糟糕的建议,并很快变得不受用户欢迎。相比之下,深入了解行业特定流程、约束和决策逻辑的 AI 系统具有以下优势:
领域专家可以帮助您将 AI 系统的技术性与其实际用途和价值联系起来。因此,他们应该是您的 AI 应用程序的关键利益相关者和共同创造者。本指南是我关于专业知识驱动型 AI 系列的第一部分。根据我对AI 系统的心理模型,它提供了一种将深厚的领域专业知识嵌入到您的 AI 中的结构化方法。

在本文中,我们将使用供应链优化 (SCO) 的用例来说明这些不同的方法。现代供应链不断受到地缘政治紧张局势、气候变化和需求变化的影响,而人工智能可以提供预测延误、管理风险和优化物流所需的动态、高覆盖率情报。然而,如果没有领域专业知识,这些系统往往与现实生活脱节。让我们看看如何通过在人工智能应用程序的不同组件中集成领域专业知识来解决这个问题。
一 数据:专业知识驱动的人工智能的基石
人工智能对领域的认知程度取决于它所学习的数据。原始数据是不够的,它必须由了解其在现实世界中的含义的专家进行整理、改进和情境化。
1.数据理解:教人工智能什么是重要的
虽然数据科学家可以建立复杂的模型来分析模式和分布,但这些分析通常停留在理论和抽象层面。只有领域专家才能验证数据是否完整、准确并代表现实世界的情况。
例如,在供应链优化中,货运记录可能包含缺失的交货时间戳、不一致的路线细节或无法解释的运输时间波动。数据科学家可能会将这些视为噪音而丢弃,但物流专家可能会对这些不一致现象有现实的解释。例如,它们可能是由天气相关的延误、季节性港口拥堵或供应商可靠性问题造成的。如果不考虑这些细微差别,人工智能可能会学习到过于简化的供应链动态视图,从而导致误导性的风险评估和糟糕的建议。
专家在评估数据完整性方面也发挥着关键作用。人工智能模型会根据现有数据开展工作,假设所有关键因素都已存在。识别盲点需要人类的专业知识和判断力。例如,如果您的供应链人工智能没有接受过海关清关时间或工厂停工历史方面的培训,它将无法预测监管问题或生产瓶颈造成的中断。
✅实施提示:与数据科学家和领域专家进行联合探索性数据分析 (EDA) 会议,以识别缺失的业务关键信息,确保 AI 模型使用完整且有意义的数据集,而不仅仅是统计上干净的数据。
2.数据源选择:从小处着手,战略性扩展
刚开始使用 AI 时,一个常见的陷阱是过早集成过多数据,导致复杂性、数据管道拥堵以及模糊或嘈杂的见解。相反,从几个高影响力的数据源开始,并根据 AI 性能和用户需求逐步扩展。例如,SCO 系统最初可能使用历史装运数据和供应商可靠性评分。随着时间的推移,领域专家可能会发现缺失的信息(例如港口拥堵数据或实时天气预报),并向工程师指出可以找到这些信息的数据源。
✅实施提示:从最小、高价值数据集(通常 3-5 个数据源)开始,然后根据专家反馈和现实世界的 AI 性能逐步扩展。
3.数据注释
AI 模型通过检测数据中的模式进行学习,但有时,原始数据中还没有正确的学习信号。这就是数据注释的作用所在——通过标记关键属性,领域专家可以帮助 AI 了解重要事项并做出更好的预测。考虑一个为预测供应商可靠性而构建的 AI 模型。该模型是根据包含交货时间、延迟和运输路线的装运记录进行训练的。然而,仅靠原始交货数据并不能全面反映供应商的风险——没有直接的标签表明供应商是“高风险”还是“低风险”。
如果没有更明确的学习信号,人工智能可能会得出错误的结论。它可能会得出这样的结论:所有延误都同样糟糕,即使有些延误是由可预测的季节性波动造成的。或者它可能会忽略供应商不稳定的早期预警信号,例如频繁的最后一刻订单变更或库存水平不一致。
领域专家可以使用更细致的标签来丰富数据,例如供应商风险类别、中断原因和异常处理规则。通过引入这些精心策划的学习信号,您可以确保 AI 不仅记住过去的趋势,还能学习有意义的、可供决策的见解。
您不应该急于完成注释工作 - 相反,应该考虑一个包含以下组件的结构化注释过程:
✅实施提示:定义具有明确标签标准的注释剧本,每个关键标签至少涉及两名领域专家以确保客观性,并运行定期的注释审查周期,以确保 AI 从准确的、与业务相关的见解中学习。
4.合成数据:为罕见但关键的事件做好人工智能准备
到目前为止,我们的 AI 模型都是从现实生活中的历史数据中学习的。然而,罕见的、影响巨大的事件(如工厂停工、港口关闭或供应链情景中的监管变化)可能被低估。如果不接触这些情景,AI 可能无法预测重大风险,导致对供应商稳定性过度自信和应急计划不力。合成数据通过为罕见事件创建更多数据点来解决这个问题,但专家监督对于确保它反映的是合理风险而不是不切实际的模式至关重要。
假设我们想预测供应链系统中供应商的可靠性。历史数据中可能记录的供应商违约很少——但这并不是因为不会发生违约。相反,许多公司在风险升级之前会主动降低风险。如果没有合成示例,人工智能可能会推断供应商违约极为罕见,从而导致错误的风险评估。
专家可以根据以下内容帮助生成模拟故障场景:
✅可操作的步骤:与领域专家合作,定义影响大但频率低的事件和场景,这些事件和场景可以在生成合成数据时成为焦点。
数据让领域专业知识大放异彩。依赖干净、相关且丰富的领域数据的 AI 计划将比采用“快速而粗糙”的数据捷径的计划具有明显的竞争优势。但是,请记住,处理数据可能很繁琐,专家需要看到他们努力的结果——无论是改进 AI 驱动的风险评估、优化供应链弹性还是实现更明智的决策。关键是让数据协作直观、有目的且与业务成果直接相关,这样专家才能保持参与度和积极性。
二 智能:让人工智能系统更加智能
一旦人工智能能够获得高质量的数据,下一个挑战就是确保它能生成有用且准确的输出。需要领域专业知识来:
让我们看看一些常见的人工智能方法,看看它们如何从额外的领域知识中受益。
1.从头开始训练预测模型
对于供应链预测等结构化问题,分类和回归等预测模型可以帮助预测延迟并提出优化建议。但是,为了确保这些模型与业务目标保持一致,数据科学家和知识工程师需要共同努力。例如,人工智能模型可能会不惜一切代价尽量减少货物延误,但供应链专家知道,通过空运快速跟踪每批货物在财务上是不可持续的。他们可以对模型制定额外的约束,使其优先考虑关键货物,同时平衡成本、风险和交货时间。
✅实施提示:在训练 AI 模型之前与领域专家定义明确的目标和约束,确保与实际业务优先级保持一致。
2.探索大型语言模型 (LLM) 三要素
虽然从头开始训练的预测模型可以擅长完成非常具体的任务,但它们也非常僵化,会“拒绝”执行任何其他任务。GenAI 模型更加开放,可以用于高度多样化的请求。例如,SCO 系统中基于 LLM 的对话小部件可以让用户使用自然语言与实时见解进行交互。用户不必筛选不灵活的仪表板,而是可以询问“哪些供应商面临延误风险?”或“有哪些替代路线可用?”人工智能会从历史数据、实时物流信息和外部风险因素中提取信息,以提供可行的答案、建议缓解措施,甚至自动化重新安排货运路线等工作流程。
但是,如何确保像 ChatGPT 或 Llama 这样庞大的开箱即用模型能够理解您所在领域的细微差别?让我们来看看 LLM 三要素——将领域知识纳入您的 LLM 系统的一系列技术。
随着你从左到右的进步,你可以在 LLM 中融入更多的领域知识——然而,每个阶段也增加了新的技术挑战。在这里,让我们关注领域专家如何在每个阶段参与进来:
1).开箱即用的 LLM提示似乎是一种通用方法,但凭借正确的直觉和技巧,领域专家可以微调提示,从 LLM 中提取额外的领域知识。就我个人而言,我认为这是提示的一大魅力——它将最强大的 AI 模型直接交到领域专家手中,而无需任何技术专业知识。一些关键的提示技术包括:
2). RAG(检索增强生成):虽然提示有助于指导 AI,但它仍然依赖于预先训练的知识,而这些知识可能已经过时或不完整。RAG 允许 AI 检索实时的公司特定数据,确保其响应基于当前的物流报告、供应商绩效记录和风险评估。例如,RAG 驱动的 AI 系统不会生成通用的供应商风险分析,而是会提取实时装运数据、供应商信用评级和港口拥堵报告,然后再提出建议。领域专家可以帮助选择和构建这些数据源,在测试和评估 RAG 系统时也需要他们。
✅实施提示:与领域专家合作,策划和构建知识源——确保 AI 仅检索和应用最相关和高质量的业务信息。
3). 微调:虽然提示和 RAG 会即时注入领域知识,但它们并不会将供应领域特定的工作流、术语或决策逻辑嵌入到你的 LLM 中。微调使 LLM 能够像物流专家一样思考。领域专家可以通过创建高质量的训练数据来指导这一过程,确保 AI 从真实的供应商评估、风险评估和采购决策中学习。他们可以改进行业术语以防止误解(例如,AI 区分“缓冲库存”和“安全库存”)。他们还将 AI 的推理与业务逻辑相结合,确保它考虑成本、风险和合规性,而不仅仅是效率。最后,他们评估微调后的模型,根据现实世界的决策测试 AI,以发现偏见或盲点。
✅实施提示:在 LLM 微调中,数据是关键的成功因素。质量重于数量,对小型高质量数据集进行微调可以为您带来出色的结果。因此,请给您的专家足够的时间来找出微调数据的正确结构和内容,并计划微调过程的大量端到端迭代。
3.使用神经符号人工智能对专家知识进行编码
每种机器学习算法都会时不时地出错。为了减少错误,它有助于将您所在领域的“硬事实”牢牢地固定下来,从而使您的 AI 系统更加可靠和可控。这种机器学习和确定性规则的组合称为神经符号 AI。
例如,显性知识图谱可以以结构化、互联的格式对供应商关系、监管限制、运输网络和风险依赖关系进行编码。
富含知识图谱的人工智能系统不仅仅依赖于统计相关性,还可以:
如何决定哪些知识应该用规则编码(符号AI),哪些知识应该从数据中动态学习(神经AI)?领域专家可以帮助您选择最适合硬编码的知识:
在大多数情况下,这些知识将存储在 AI 系统的单独组件中,例如决策树、知识图谱和本体。还有一些方法可以将其直接集成到 LLM 和其他统计模型中,例如Lamini 的内存微调。
4.复合人工智能和工作流工程
生成洞察并将其转化为行动是一个多步骤的过程。专家可以帮助您建模工作流程和决策流程,确保您的 AI 系统遵循的流程与他们的任务保持一致。例如,以下流程展示了我们迄今为止考虑的 AI 组件如何组合成工作流程以降低装运风险:
专家还需要校准人工智能与人类之间的“劳动分配”。例如,在建立决策逻辑模型时,他们可以设定自动化的阈值,决定人工智能何时可以触发工作流程,何时需要人工批准。
✅实施提示:让您的领域专家将您的流程映射到 AI 模型和资产,识别差距与已经可以自动化的步骤。
三 设计符合人体工程学的用户体验
尤其是在 B2B 环境中,员工深深融入日常工作流程,用户体验必须与现有流程和任务结构无缝集成,以确保效率和采用率。例如,基于 AI 的供应链工具必须与物流专业人员的思维、工作和决策方式保持一致。在开发阶段,领域专家是与真实用户最亲近的“同行”,而汲取他们的智慧是弥补 AI 功能与现实世界可用性之间差距的最快方法之一。
✅实施提示:在 UX 设计早期就让领域专家参与进来,以确保 AI 界面直观、相关且适合真实的决策工作流程。
1.确保人工智能决策的透明度和信任度
人工智能的思维方式与人类不同,这让我们人类持怀疑态度。通常,这是一件好事,因为它可以帮助我们对潜在的错误保持警惕。但不信任也是人工智能采用的最大障碍之一。当用户不理解系统为什么会提出特定建议时,他们不太可能接受它。领域专家可以定义人工智能应该如何解释自己——确保用户能够了解置信度分数、决策逻辑和关键影响因素。
例如,如果 SCO 系统建议更改货物运输路线,物流规划人员如果直接接受,就是不负责任的。她需要了解建议背后的“原因”——是因为供应商风险、港口拥堵还是燃料成本飙升?UX 应该展示决策的细分,并提供历史数据、风险因素和成本效益分析等其他信息。
⚠️减轻对人工智能的过度依赖:用户对人工智能的过度依赖可能会导致偏见、错误和不可预见的故障。专家应该找到方法来校准人工智能驱动的洞察力与人类专业知识、道德监督和战略保障,以确保决策的弹性、适应性和信任。
✅实施提示:与领域专家合作定义关键的可解释性特征(例如置信度分数、数据源和影响摘要),以便用户可以快速评估 AI 驱动的建议。
2.简化人工智能交互而不失去深度
AI 工具应该让复杂的决策变得更容易,而不是更难。如果用户需要深厚的技术知识才能从 AI 中提取见解,那么从用户体验的角度来看,该系统就失败了。领域专家可以帮助在简单性和深度之间取得平衡,确保界面提供可操作的、情境感知的建议,同时在需要时允许进行更深入的分析。
例如,人工智能可以根据常见的物流挑战提供预配置报告,而不是强迫用户手动筛选数据表。但是,专家用户也应该在必要时能够按需访问原始数据和高级设置。关键是设计出既适合日常使用又能在需要时灵活进行深入分析的人工智能交互方式。
✅实施提示:使用领域专家反馈来定义默认视图、优先级警报和用户可配置设置,确保 AI 界面既能为日常任务提供效率,又能为更深入的研究和战略决策提供深度。
3.与专家一起进行持续的用户体验测试和迭代
AI UX 不是一次性完成的过程——它需要随着现实世界的用户反馈而发展。领域专家在 UX 测试、改进和迭代中发挥着关键作用,确保 AI 驱动的工作流程与业务需求和用户期望保持一致。
例如,您的初始界面可能会显示太多低优先级警报,导致用户开始忽略 AI 建议,从而产生警报疲劳。供应链专家可以确定哪些警报最有价值,让用户体验设计师能够优先考虑影响大的见解,同时减少噪音。
✅实施提示:进行有声思考会议,让领域专家在与 AI 界面交互时用语言表达他们的思维过程。这有助于 AI 团队发现隐藏的假设,并根据专家的实际思考和决策方式改进 AI。
四 小结
垂直领域人工智能系统必须在每个阶段整合领域知识,专家应该成为人工智能开发的关键利益相关者:
一个“掌握”业务领域的人工智能系统不仅在短期和中期有用且可采用,而且还能为业务带来竞争优势。
售前咨询