将 AI 与数据分析结合使用
概念信息
您可以使用 Analytics AI 命令和外部 AI 服务将 AI 纳入您的数据分析。通过此无代码或低代码选项,您可以在 Analytics 界面中输入自然语言用户提示词,以描述您希望 AI 服务执行的分析以及您希望返回的结果类型。
说明
外部 AI 服务并非由 Diligent 提供。它必须由贵组织提供。
仅连接到贵组织批准使用的外部 AI 服务。如果您打算将敏感数据从 Analytics 传输到 AI 服务,请务必遵循所有安全协议。
AI 结果可能包含不准确或错误。如果需要绝对准确性,请使用替代方法验证结果。
AI 命令的预期用途
AI 命令旨在扩展或增强 Analytics 中的现有数据分析功能,而不是取代它们。AI 尤其适用于对文本数据进行定性分析,包括自由文本域中的非结构化数据。通过推理,AI 可以处理文本并提取含义、意图和上下文,或识别模式。使用现有定量且基于规则的 Analytics 命令集,很难甚至无法执行这种基于推断的定性分析。
您还可以使用 AI 快速调查互联网上的公开信息,然后将发现纳入您正在 Analytics 中构建的数据分析中。例如,您可以让 AI 评估供应商表中各个供应商的信誉,或者评估费用报销的合理性。
使用 AI 命令,您可以将此类分析添加到您在 Analytics 中的工作中:
-
分类将风险调查回复归类为运营、战略、财务和系统性等类别
-
情感分析对客户评价、员工反馈、开放式调查问题或采访转写稿进行情感分析和分类
-
数据清理清理交易描述中的个人身份信息 (PII)
-
评估根据供应商名称和地址对供应商进行评估与评价
-
比较比较费用描述与金额,以核查合理性并识别异常情况
-
关联测量自由文本数据与定量域(如数值评分或分数)之间的相关性
AI 命令示例
以下示例展示了 AI 命令的三种实用应用。还有许多其他实用的应用。人工执行这些任务中的任何一项都将极其耗时。
-
使用 AI 进行供应商评估利用公开信息快速评估供应商表中各供应商的基本有效性。
-
使用 AI 进行费用审核结合费用描述、单价及有关商品和服务的公开信息,核实费用报销的合理性。
-
使用 AI 进行情感分析处理客户评论中的非结构化文本,以推断客户的感受或情感,并根据结果对评论进行分类。
使用 AI 进行供应商评估
您想要对供应商表执行基础检查,以发现任何可能的虚假供应商。您将供应商名称和地址域输入 AI 服务,并要求其将供应商分类为“常见”、“罕见”或“未知”。
| 用户提示词 | Is this a commonly known vendor? The output value should be COMMON if common, RARE if known but uncommon, UNKNOWN otherwise. |
| AI 回答 |
Industrial Business Equip, 6 E Monroe St Ste 1004, RARE Officemax 896, 2300 E Highland Dr, COMMON Staples 500, 2910 E Harding Ave, COMMON Ingras Garden Images, 1203 N 4th St, UNKNOWN |
| AI 如何提供帮助 | AI 流程利用大量关于供应商的公开信息,快速评估供应商表中各供应商的有效性。 |
您可以根据需要以任何方式调整用户提示词。相比于输出中的三类细分结果,您可能需要更精细的分类方式,比如:
-
老牌蓝筹企业
-
老牌供应商
-
有一些信息可用
-
未知
使用 AI 进行费用审核
您想要审核采购卡交易记录,并标记出商品或服务与购买价格不符的所有费用。您将费用描述和成本域输入 AI 服务,并要求其评估费用是否合理。
| 用户提示词 | Given the combination of Description and Unit Cost, indicate whether the cost is typical or unusual. |
| AI 回答 |
5-Shelf Steel Shelving Unit, 112.50, Typical price for basic metal shelving 60" Urban Bookcase, Cherry, 276.20, Typical price for a quality wooden bookcase Stainless Steel Water Bottle, 312.90, Unusually high for a water bottle Deluxe High-Back Computer Operator Chair, 532.00, Typical for ergonomic chair File Folder Red Lgl, 13.10, Slightly high for file folders Color Paper Grey Ltr Cascade, 22.50, Unusually high for colored paper |
| AI 如何提供帮助 | AI 流程利用大量关于商品和服务价格的公开信息,快速评估采购卡交易表中每项费用的合理性。 |
使用 AI 进行情感分析
在一个包含顾客酒店评价的表中,您想要对其中的自由文本评论进行情感分析及归类。您要求 AI 服务按人类的六种基本情绪对评论进行分类。
简短的用户提示词
| 用户提示词 | Perform a sentiment analysis on the reviews_text field and categorize the reviews by the following basic human emotions: Happiness, Anger, Fear, Sadness, Disgust, Surprise. |
|
客人评论 1 |
Bad: A little bit of noise from the 'L' down below, but then again that is part of the character of the city.Good: Overall cleanliness, new feel, friendly efficient staff, great happy hour! Excellent location. |
| AI 回答 1 |
Happiness - Generally positive despite minor noise concern |
|
客人评论 2 |
Bad: The room rate was terrible we had a Booking.com rate that was not honored it soured the stay and was a big difference.We to date have no explanation! Good: 位置 |
|
AI 回答 2 |
Anger - Frustrated about rate discrepancy despite good location |
| AI 如何提供帮助 |
AI 服务可以处理客户评论中的非结构化文本,并能推断:
AI 推断基于客户选用的特定词汇、强化词和修饰语(如“非常”、“极其”、“稍微”),是否存在讽刺或反语,以及评论文本的其他各种语言及语境特征。 基于推理的各个方面,AI 流程将每条评论归类为六种基本人类情绪之一。 |
更长、非常具体的用户提示词
提示
您可以让 ChatGPT 等在线 AI 聊天机器人为您生成提示词,然后根据需要进行完善。例如,您可以指示聊天机器人:“Give me a good prompt to use when performing a sentiment analysis on the customer comment field in a table of hotel reviews.”
| 用户提示词 |
You are an expert data analyst specializing in customer feedback analysis for the hospitality industry. Your task is to evaluate the sentiment of each customer comment about a hotel stay. For each input comment, return a response with: entiment — one of: Positive, Neutral, or Negative. sentiment_score — a numeric value from -1.0 (very negative) to +1.0 (very positive). key_reasons — a short list (1–3 phrases) explaining what drove the sentiment (e.g., friendly staff, dirty room, great location). themes — the main aspects mentioned, chosen from: staff, cleanliness, food, amenities, location, value, comfort, service, booking, other. Important: Consider tone, context, and modifiers (e.g., not bad = mildly positive). If the sentiment is mixed, base the rating on the overall impression. Be concise and consistent across reviews. Input Example: The room was clean and the staff were helpful, but the Wi-Fi didn't work. Expected Output Example: sentiment: Positive sentiment_score: 0.4 key_reasons: clean room, helpful staff, poor Wi-Fi themes: cleanliness, staff, amenities |
|
客人评论 1 |
Brand new hotel in brand new retail area on the water.Easy to access off the beltway.Friendly staff, clean rooms, comfortable beds.Only complaint is that the full offering of the Hampton Inn breakfast was not available at the two times we came down (at 7am and 9am on a Saturday).The food at 9am had been in the bin too long.Still more choices than the continental breakfast at other places, including make-you-own waffles and yummy egg burritos.The fee for parking in the community garage was free with room key and even included a convenient room key drop upon final exit.Pool but no hot tub. |
| AI 回答 1 |
sentiment: Positive sentiment_score: 0.6 key_reasons: clean rooms, friendly staff, breakfast issues themes: cleanliness, staff, food |
|
客人评论 2 |
Bad: Timing seemed to be off.Had to wait a very long time for breakfast, longer than people who had come in after us.Had to wait a very long time for the valet to bring our car, seemed to be some kind of communication issue.They were nice about it, and so were we, but it seemed to be a theme, which was a bit of a disappointment.Good: Nicely appointed room, great location. |
|
AI 回答 2 |
sentiment: Neutral sentiment_score: 0.3 key_reasons: nice room, slow service times themes: service, amenities |
| AI 如何提供帮助 |
除了上一个示例中描述的推断和基本分类外,这种更深入的 AI 分析还在输出中提供了多个有用的要素。
|
有效地使用 AI 服务
AI 服务通常会限制它将在每次操作中处理的数据量。Analytics 表中的记录会被分批发送到 AI 服务,以提高保留在数据限制范围内的可能性。虽然批处理很有帮助,但为了优化 AI 命令的性能和响应时间,您还应遵循以下准则:
-
仅发送分析目标所必需的域不要发送整个源表。如果您在发送的数据中包含唯一标识符域,则可以将从 AI 服务返回的表与原始源表进行联接或关联。有关更多信息,请参阅创建唯一标识符域。
-
限制您发送的记录数在将数据发送至 AI 服务之前,通过执行数据准备和整理步骤来提炼数据集。
-
使用 AI 服务进行定性分析不使用 AI 服务进行大规模数值或定量分析。利用排序、分类、汇总或分层等现有的 Analytics 操作,在本地执行此类分析会更加快速高效。
开始之前
必须满足这些先决条件,然后您才能使用 AI 命令。
-
Python 的安装
您必须在将运行命令的计算机上安装并配置 Python 的兼容版本。您还必须安装两个 Python 库:Pandas 和 OpenAI Python API。有关更多信息,请参阅配置 Python 以便与 Analytics 一起使用。
-
AI 服务的连接设置
在选项对话框中,必须为所需的设置指定 值,以便在 Analytics 与外部 AI 服务之间建立连接。有关更多信息,请参阅 外部 AI 服务的连接设置。
使用外部 AI 服务分析数据
使用 AI 命令将数据发送到外部 AI 服务进行分析。
-
打开包含数据的表。
-
从 Analytics 主菜单中,选择分析 > AI 命令。
如果出现要求为 AI 服务提供 API 密钥的消息,则您需要在选项对话框中指定 API 密钥。有关更多信息,请参阅 外部 AI 服务的连接设置。
-
单击选择域,并指定要发送到 AI 服务的一个或多个域。
-
可选。要过滤发送给 AI 服务的记录,请单击 If 并使用表达式生成器对话框创建一个要用作过滤器的条件表达式。
筛选器必须至少包含表中的一条记录。如果该筛选器排除了表中的所有记录,则 Analytics 会显示错误,并且 AI 命令不会运行。
有关使用表达式生成器创建表达式的更多信息,请参阅 使用表达式生成器创建表达式。
-
在到文本框中,为包含 AI 服务所返回数据的表指定一个名称。
您可以单击到,然后使用文件资源管理器前往要用于存储所返回数据表的文件夹。
说明
Analytics 表名称限制为不超过 64 个字母数字字符,且不包括 .FIL 扩展名。该名称可以包括下划线字符 ( _ ),但不能包括其他特殊字符或任何空格。该名称不能以数字开头。
-
如果您想让表在操作完成后自动打开,请选择使用输出表。
-
执行以下操作之一:
-
将 Python 脚本域留空,以使用 Analytics 默认 Python 脚本与 AI 服务进行交互。
-
使用您自己的 Python 脚本与 AI 服务进行交互。
在 Python 脚本域中,指定您要使用的 Python 脚本的文件路径和名称。
例如:C:\Users\<account_name>\Documents\ACL Data\<analytics_project_name>\Python_scripts\your_python_script.py
您可以指定 Python 脚本的相对路径,或者如果脚本位于 Analytics 项目文件夹中,则仅指定脚本文件名。
您也可以单击浏览,然后找到计算机上的 Python 脚本。
有关更多信息,请参阅使用您自己的 Python 脚本。
-
-
在用户提示词文本域中,指定要输入 AI 服务中的提示词。
提示词会告诉 AI 服务如何处理您发送的输入数据以及您希望该服务返回的输出内容。有关提示词的一些示例,请参阅 AI 命令示例。
要增加工作空间,请选择编辑提示词以打开用户提示词生成器。您可以双击可用域列表中的域名称,将其快速添加到用户提示词文本域中。
说明
请勿在用户提示词域中包含任何双引号 ( " )。双引号会导致该命令失败。您可以在域中使用单引号 ( ' )。
-
确保 AI 模型域包含正确的 AI 模型信息。
如果需要,您可以更新 AI 模型信息。
系统将使用选项对话框(工具 > 选项 > 系统)中指定的值来填充 AI 模型域。有关更多信息,请参阅 外部 AI 服务的连接设置。
-
确保 AI 基础 URL 域包含 AI 服务 API 的完整 URL。
如果需要,您可以更新 AI 服务 API 的 URL。如果您确实更新了 URL,则很可能还需要更新选项对话框中的 AI API 密钥,这是进行 AI 服务认证所需的密码或许可证密钥值。
系统将使用选项对话框(工具 > 选项 > 系统)中指定的值来填充 AI 基础 URL 域。有关更多信息,请参阅 外部 AI 服务的连接设置。
-
可选。在批次大小域中,指定要包含在发送到 AI 服务的每个批次中的记录数。
如果您将此域留空,则系统会使用 100 条记录的默认批次大小。指定一个小于 100 的数字可减少每个批次发送到 AI 服务的数据总量。减少每个批次的数据量可提高保留在 AI 服务数据限制内的可能性。
-
可选。在该对话框的更多选项卡上,指定您想要使用的任何范围选项。
有关更多信息,请参阅 “更多”选项卡。
-
单击确定以运行该命令。
在从 AI 服务返回的输出表中,单个 ai_response 域包含 AI 分析的结果。
该命令可能需要几分钟的时间才能运行,具体取决于您发送到 AI 服务的数据量。考虑最初发送一个包含 100 条记录的小测试集,以便您可以快速了解所返回结果的类型。
如果您收到错误消息,并且 AI 命令无法运行,请尝试将批次大小减少到 50 或 25 条记录。有关更多信息,请参阅有效地使用 AI 服务。
说明
如果 ai_response 域包含多个组成部分或元素,则您可以使用标准 Analytics 技术在单独的域中隔离这些组成部分。有关更多信息,请参阅分隔 ai_response 域中的多个组成部分。
AI 命令对话框选项
“更多”选项卡
| 选项 | 描述 |
|---|---|
| 全部 | 处理视图中的所有记录(默认选择)。 |
| 前 | 从表中的第一个记录开始处理,并且仅包括指定数量的记录。 |
| 下一个 |
从表中当前选定的记录开始处理,并且仅包括指定数量的记录。 说明 前或后 选项中指定的记录数参考表中记录的物理或索引顺序,不考虑对视图进行过滤或快速分类的情况。不过,解析操作的结果与任何过滤相关。 如果视图进行了快速分类,后和前操作相同。 |
| While |
使用 WHILE 语句根据相应的条件限制对主表中记录的处理。 仅当指定的条件评估为真时,才对视图中的记录进行处理。当条件变为假时,处理立即终止,不再考虑剩余的记录。有关更多信息,请参阅 使用表达式生成器创建表达式。 |
创建唯一标识符域
如果要将从 AI 服务返回的表与原始源表联接起来,但缺少唯一标识符域,则您可以在使用 AI 命令之前通过 RECNO( ) 函数创建一个此类域。