最佳实践:vividime Copilot智能问数,精准决策
如上图所示,对于知识 “低价订单,即销售额小于50的订单”,包含字段:销售额、订单,低价订单则为一般词组。例如,当数据同时包含“销量”和“销售额”字段时,提问时需明确指明是“销量”还是“销售额”,如:“哪种产品的总销售额最高”。例如,字段“销售额”可添加别名“营收额”,使用户既能通过“销售额”也能通过“营收额”获取数据,拓宽提问方式。例如,避免使用模糊的表述“产品销量”,应改为“产品的总销量”或“
在数字化时代,BI智能问数功能成为众多企业洞察数据价值的重要工具,凭借其高效便捷的数据分析能力,帮助企业快速作出决策。为了帮助您充分发挥这一功能的优势,提升问答准确率与使用体验,我们将分享一些最佳实践,帮助您更好地使用BI智能问数功能。
1、数据准备环节
(一)字段命名规范
1. 贴近实际使用场景
字段命名应尽量简洁明了,与业务场景紧密相关。例如,员工数据中字段命名为“员工姓名”、“员工年龄”,而避免使用难懂的代码式名称。
2. 设置字段别名
为常用字段设置别名,增加提问灵活性。例如,字段“销售额”可添加别名“营收额”,使用户既能通过“销售额”也能通过“营收额”获取数据,拓宽提问方式。
3. 避免使用特殊字符
字段名中避免出现特殊字符(如“()”、“/”等),因为它们可能干扰系统的识别与解析,导致问答错误。确保字段名简洁规范。
(二)约束数据集数量
同一文件夹内的数据集数量直接影响查询性能。建议每个文件夹中的数据集不超过20个,以保证系统的高效运行,避免查询时间过长。
2、优化问题描述
(一)消除歧义
在提问时,确保问题明确。例如,避免使用模糊的表述“产品销量”,应改为“产品的总销量”或“产品的月均销量”,帮助系统精准理解需求,返回准确答案。
(二)明确问题指向
问题需要根据数据内容细化,以避免不同数据环境下产生误解。例如,当数据同时包含“销量”和“销售额”字段时,提问时需明确指明是“销量”还是“销售额”,如:“哪种产品的总销售额最高”。
(三)合理请求数据
避免提出不符合数据实际的请求。例如,若数据集中没有地理信息,提问“用地图展示各地区销售额”会导致回答结果不理想。
(四)精准表达意图
确保提问清晰明确,避免模糊表达。例如,将“了解成本在一定范围产品的情况”改为“哪些产品的平均成本在[X]到[Y]之间”,有助于系统精准检索和分析。
3、优化问题描述
BI智能问数功能支持多维度、多度量分析、排序、过滤、同环比等常见操作。但目前仍不支持子查询、策略建议等复杂场景。了解这些限制,合理规划提问内容,可以避免因功能不支持而导致的问题。
4、提升问答准确率的关键举措
(一)数据预处理
1. 多数据源整合
利用数据模型或自服务数据集,将多个数据源合并为一个,减少数据分散带来的问题,提升分析效率。
2. 字段名规范化
数据字段名应采用汉字化和规范化处理,确保用户提问与系统识别一致。例如,将“STA”改为“省份”,“MKT”规范为“市场分布”。
3. 数据类型转换
根据数据的实际意义,转换字段数据类型,如将“商机创建时间”从文本格式转换为日期时间格式,便于系统进行时间序列分析。
4. 简化数据结构
在搭建数据模型时,尽量避免复杂的多对多关系,简化数据结构,提升系统处理效率。
5. 指标计算根据业务需求定义并计算关键指标,例如转化率、用户留存率等,确保系统能识别这些计算列,并为用户提供更精准的数据分析。
(二)配置知识库
知识库是BI智能问数系统的核心组成部分,帮助系统快速、准确地提供相应答案。合理配置知识库,能显著提升问答效率和准确性。
知识库每一条数据由两列组成:keywords 和 knowledge。
1.关键词的构成
关键词是来自Knowledge的标准化词,通常是一般词组、字段名、字段值。如上图所示,对于知识 “低价订单,即销售额小于50的订单”,包含字段:销售额、订单,低价订单则为一般词组。因此最终关键词为“低价订单 ||| 销售额 ||| 订单”。
2.处理特定词汇
对于系统难以理解的词汇(如“本单位”、“本部门”),可通过引用系统参数进行解释,例如“本部门指部门等于?{{_GROUP_}}”,“我指用户等于?{{_USER_}}”确保准确理解问题中的含义。
3.去除重叠信息
确保知识库中的每条数据独立、互斥,避免内容重叠,确保问答的准确性和可靠性。
(三)选用推荐大模型
优先使用经过优化训练的大模型,如Qwen2.5-32B、GPT4o等。这些大模型在数据分析和问答方面表现出色,能够提升系统的准确率和专业性。
通过以上实践,您将能够最大化发挥BI智能问数功能的优势,提升数据分析的效率与准确性,助力企业在决策中获得更有价值的洞察。
更多推荐
所有评论(0)