在当今数据驱动的商业环境中,企业对于高效、智能的数据分析工具需求日益增长。传统商业智能(BI)系统虽然功能强大,但往往存在使用门槛高、灵活性不足等问题。衡石科技推出的ChatBI解决方案,通过创新的"指标管理+数仓引擎"架构,实现了端到端的智能数据分析平台,为企业提供了全新的数据探索与洞察方式。本文将深入解析衡石ChatBI的技术架构设计,揭示其如何融合前沿AI技术与成熟BI方法论,打造新一代智能分析平台的核心竞争力。

ChatBI的技术演进与市场定位

商业智能(BI)领域正经历着从传统报表工具向智能分析平台的深刻变革。随着大数据技术的普及和人工智能技术的发展,企业对能够快速、直观获取数据洞察的需求日益增长1。在这一背景下,ChatBI作为一种创新的商业智能系统应运而生,它通过自然语言处理(NLP)技术,使用户能够以对话方式与数据进行交互,显著降低了数据分析的门槛。

衡石科技作为国内领先的BI PaaS厂商,早在2024年3月就完成了DeepSeek V1的适配,并正式将ChatBI投入商业场景。不同于市场上对AI技术的盲目乐观,衡石科技采取了更为务实的策略,将AI视为增强BI能力的工具而非替代品。在衡石科技创始人兼CEO刘诚忠看来,"AI不是一个市场,而是一项技术,关键是要看落地后能否满足市场真实的需求面"5。正是基于这一理念,衡石科技设计了"AI助手与BI平台互为支撑"的ChatBI架构,最大程度提升数据探索和消费环节的效率。

ChatBI的市场定位十分明确——服务于那些需要高效、易用数据分析工具的企业用户,特别是缺乏技术背景的业务决策者。据IDC预测,到2026年,全球BI市场年复合增长率(CAGR)将保持在8-10%,市场规模可能突破400亿美元。虽然北美仍是最大市场,但亚太地区尤其是中国增速最快5。这一市场趋势为衡石ChatBI的发展提供了广阔空间。

从技术演进角度看,ChatBI的核心突破在于将**大型语言模型(LLMs)**与传统BI系统有机结合。早期的BI系统基于规则构建,而现代ChatBI则利用深度学习模型训练,能够更好地理解自然语言,为数据交互提供了全新的技术支撑。衡石ChatBI特别强调指标管理在提高AI理解准确性方面的关键作用,通过构建完善的指标体系,为自然语言灵活查数问数场景奠定坚实且严谨的基础。

值得注意的是,衡石ChatBI并未采用业界常见的Text2SQL技术路线,而是创新性地选择了Text2Metrics方案。这一选择源于实践中的深刻认识——在精确性至关重要的数据分析领域,LLM直接生成SQL的准确率往往难以满足企业级需求(约30%的准确率极大地限制了该技术在实际应用场景中的有效落地)。相比之下,通过LLM将用户询问翻译为指标描述语言,再由BI层翻译为SQL进行下推查询,既能有效保证准确率,又能无缝衔接AI+BI平台到各种异构数据源5。

端到端平台架构设计

衡石ChatBI平台采用分层架构设计,将复杂的数据分析流程抽象为清晰的模块化组件,实现了从数据接入到洞察生成的全链路覆盖。这一架构的核心思想是通过指标管理统一业务语义,依托高性能数仓引擎保障查询效率,最终通过自然语言交互降低使用门槛,形成完整的端到端解决方案。

核心组件与数据流

衡石ChatBI的系统架构由多个关键组件协同工作构成,每个组件承担特定功能并与其他模块紧密集成。自然语言理解(NLU)模块作为用户交互的第一入口,负责解析用户的查询意图,将其转化为机器可理解的形式。这一模块的准确率直接影响ChatBI对用户需求的理解程度,进而决定后续数据分析的准确性。为提高理解能力,衡石ChatBI构建了专门的业务知识库,存储业务逻辑、术语定义和常见问题等信息,帮助NLU模块更准确地解析专业术语和上下文信息。

查询引擎是架构中的核心枢纽,根据NLU模块的输出构建相应的数据查询语句。与传统的直接生成SQL不同,衡石采用独特的"NL2DSL"方式,通过LLM翻译询问为指标描述语言(HQL - Hengshi Query Language),由BI层进一步翻译为SQL进行下推查询。这种设计既保证了查询的准确性,又能无缝对接各种异构数据源,同时在BI层实现精细的数据权限控制。

数据可视化模块则将查询结果以图表、报表等形式展现给用户。衡石ChatBI在此环节创新性地引入了交互式探索功能,用户可以对初步结果进行多轮追问、维度切换和深度下钻,形成真正的对话式分析体验。可视化模块支持多种图表类型和布局方式,特别针对中国企业的复杂报表需求进行了优化,实现了与Excel高度兼容的界面设计。

指标管理平台的关键作用

指标管理是衡石ChatBI架构中最具差异化的设计。衡石科技从2018年就开始自研类似DAX的语义层能力(HQL),这些积累使其在BI厂商中能够较快上线准确度可落地的企业级ChatBI5。指标平台对指标进行中心化管理,并通过预置指标分析模板和业务场景结合快速形成业务指标分析看板。

在HENGSHI SENSE 5.0版本中,指标管理平台引入了"粒度"概念,将业务指标定义时设定的相关维度、时间轴、限定条件等统一使用粒度进行管理11。用户在进行业务指标创建时,可以直接引用对应业务场景的粒度,极大简化了维度等信息的设置过程,使业务指标创建更加方便快捷。同时,5.0版本还增强了指标权限管理功能,能够将指标以数据包为单位进行可见设置,满足了企业级应用的安全需求。

指标平台的另一创新是建立了指标血缘关系,可以对指标进行溯源12。这一功能帮助业务人员理解指标的计算逻辑和数据来源,增强了分析结果的透明度和可信度。衡石科技认为,"指标即业务语言,业务指标沉淀着垂直领域的行业洞见,通过指标体系可以定义管理实体的明确目标"。引入指标管理动作,可以让数据分析真正回归业务,而不是停留在技术和数据工程的环节。

数仓引擎的性能优化

数据连接与处理是衡石ChatBI架构的另一关键部分。平台需要能够连接多种数据源,包括关系型数据库、数据仓库、云存储等,以满足不同用户的数据需求。在数据查询之前,ChatBI会对数据进行清洗、转换等预处理操作,以保证数据质量和分析的准确性。

衡石ChatBI的性能优势很大程度上源于其数仓引擎的设计。随着高性能数仓的普及,业务指标的计算从数仓阶段后移至建模阶段,更多计算在看板打开时实时触发,减少了预计算,使看板更加动态。这种ELT(提取、加载、转换)架构相比传统的ETL(提取、转换、加载)架构更适应现代数据分析的需求。

为了支持实时数据分析能力,衡石ChatBI架构特别优化了流式处理能力。平台可以接入实时数据流并进行即时分析,满足运营监控、风险预警等时效性要求高的场景1。同时,架构设计中充分考虑了可扩展性和容错性,能够根据数据规模和工作负载动态调整资源分配,保证系统稳定运行。

数据安全与隐私保护贯穿整个架构设计。在数据连接与处理过程中,衡石ChatBI遵守数据安全和隐私保护的相关法规,实施严格的数据加密和访问控制策略,确保用户数据的安全。特别是在多租户环境下,平台通过细粒度的权限管理和数据隔离机制,防止数据越权访问。

AI与BI的深度融合策略

衡石ChatBI的核心创新在于将生成式AI能力与传统BI平台深度融合,而非简单叠加。这种融合不是技术上的拼凑,而是从架构设计层面就考虑的有机结合,使得AI能够真正理解业务语义,BI能够具备自然交互能力,共同提升数据分析的效率和深度。

Text2Metrics技术路线

衡石ChatBI摒弃了业界常见的NL2SQL(自然语言转SQL)方案,而是采用了独创的Text2Metrics技术路线。这一选择源于深刻的实践认知——在数据分析领域,直接由大模型生成SQL语句的准确率难以满足企业级需求(仅约30%的准确率使该技术几乎失去实用价值)。相比之下,Text2Metrics依托于BI的数据建模与指标体系建设,先将自然语言转换为指标描述语言(HQL),再由BI层转换为优化的SQL查询。

这种架构设计具有多重优势:首先,指标层抽象屏蔽了底层数据结构的复杂性,使AI只需要理解业务指标而非数据库模式;其次,BI层可以对生成的查询进行验证和优化,确保其正确性和性能;最后,这种分层处理方式天然支持数据权限控制,避免越权访问。衡石科技CEO刘诚忠将这种协作比作"文科生与理科生的知识互补",实现了既创新又务实的落地效果。

HQL(Hengshi Query Language)作为这一架构的关键组件,是衡石自2018年开始研发的语义层查询语言。它类似于Power BI的DAX,但更专注于指标表达和分析场景。HQL将业务指标的计算逻辑与物理数据模型解耦,使得业务人员可以用熟悉的业务术语进行查询,而不必关心背后的技术实现。在HENGSHI SENSE 5.0版本中,HQL进一步强化了对时间智能、同环比分析等常见分析模式的支持,大大降低了复杂分析的表达难度。

AI Copilot的交互设计

衡石ChatBI的AI Copilot功能并非孤立存在,而是深度集成到BI平台的各个交互环节中。在报表查看状态下,用户可以通过简明的"去分析"入口启动AI对话,侧边栏会展开AI增强助手,支持多轮自然语言交互12。这种设计既保留了传统BI的确定性输出优势,又增加了灵活探索的可能性,实现了"固定报表+随机探索"的最佳组合5。

AI Copilot具备四项核心能力:对话式交互支持通过自然语言提问形式搜索、分析业务信息,并生成可视化结果和分析报告;多轮问答能力可以联系上下文提到的指标数据和业务场景逐步深入分析;智能推荐功能根据数据内容推荐相关问题,引导用户有效提问;指标平台+大模型分析方式将行业通用知识与企业专有知识结合,提升回答的专业性。

特别值得注意的是,衡石ChatBI的AI Copilot并非追求完全自动化,而是定位为"辅助"角色。刘诚忠明确指出:"未来真正能在BI行业应用的很可能是AI Copilot,而非Autopilot"。这一理念体现在产品设计中,就是AI不会替代人类决策,而是提供数据支持和建议,最终判断权仍保留在业务人员手中。这种人机协作模式在保证分析质量的同时,也避免了AI过度承诺带来的风险。

RAG增强的准确性保障

为了提高大模型在专业领域的回答准确性,衡石ChatBI采用了检索增强生成(RAG)技术架构。当用户提出问题时,系统会先从指标知识库中检索相关指标定义、计算方法和业务上下文,将这些结构化信息作为提示词的一部分输入给大模型。这种方式有效弥补了大模型在企业特定知识方面的不足,显著提升了回答的相关性和准确性。

指标知识库的构建是RAG能否成功的关键。衡石采用"主题域空间"的方式组织指标,通过业务主题对指标进行管理和授权。每个指标都有明确的业务定义、计算公式、数据来源、更新频率等元数据,以及与其他指标的关联关系。这些丰富的语义信息使大模型能够更准确地理解指标含义和使用场景。

袋鼠云在类似应用中验证了这种方法的有效性:"通过与AI大模型的结合,智能指标AIMetrics可以实现更加智能的指标检索功能...即使用户输入的关键词不完全匹配,也能返回相关的指标"7。衡石ChatBI进一步扩展了这一思路,不仅支持指标检索,还能基于指标进行趋势分析、异常检测和归因分析,形成完整的分析链条7。

企业级应用的关键考量

将ChatBI技术应用于企业环境面临诸多独特挑战,包括大规模数据处理、复杂权限管理、系统集成需求等。衡石ChatBI平台从设计之初就针对这些企业级需求进行了专门优化,使其不仅具备前沿的AI能力,更能满足严苛的企业应用标准。

准确性与可靠性保障

在企业决策场景中,数据分析结果的准确性至关重要,微小的偏差可能导致重大商业损失。衡石ChatBI通过多层校验机制保障输出质量:在自然语言理解阶段,系统会识别模糊查询并主动追问澄清;在查询生成阶段,指标平台的严格定义避免了语义歧义;在执行阶段,BI层会对生成的SQL进行逻辑验证和性能优化。

腾讯云ChatBI的实践也印证了这种严格校验的必要性,其架构中包含专门的"语义修正器(Semantic Corrector)"组件,用于检查语义信息的合法性,对不合法的信息做修正和优化处理。衡石ChatBI采用了类似思路,通过构建完整的语义解析链条(从自然语言到业务指标再到物理查询)来确保每个环节的可控性和可解释性。

针对大模型固有的"幻觉"问题,衡石ChatBI设计了结果验证机制。对于关键指标查询,系统会标注数据来源和计算逻辑;对于推测性分析,会明确区分事实和推断;对于不确定的回答,会主动提示用户核实。这种透明的交互方式帮助用户建立合理预期,避免盲目信任AI输出。

权限管理与数据安全

企业数据通常具有严格的访问控制要求,不同部门、角色的人员只能查看特定范围的数据。衡石ChatBI将权限管理深度集成到整个架构中:在指标平台层,可以定义指标的数据包可见性;在查询引擎层,会动态注入权限过滤条件;在展示层,会根据用户角色控制功能可用性。

这种细粒度的权限体系体现在多个维度:数据行级权限确保用户只能看到自己权限范围内的数据记录;列级权限控制敏感字段的访问;功能权限限制高级分析操作的使用;分享权限管理分析结果的传播范围。特别是在嵌入式部署场景下,衡石ChatBI可以与宿主系统的权限体系无缝集成,实现统一的访问控制。

数据安全方面,衡石ChatBI遵循企业级安全标准,支持数据传输和存储加密、操作审计日志、敏感数据脱敏等功能。平台也符合主流数据合规要求,如GDPR等,帮助企业满足法规监管需求。这些特性对于金融、医疗等高度监管行业的应用尤为重要。

嵌入与集成能力

衡石ChatBI采用"POWERED BY HENGSHI"策略,设计为可嵌入各种企业应用的分析引擎,而非独立的BI工具。平台提供全面的API和SDK支持,包括数据接入、指标管理、分析功能、可视化组件等各个层面,使合作伙伴能够灵活集成分析能力到现有业务流程中。

这种嵌入式架构具有显著优势:对最终用户而言,分析功能与业务系统无缝融合,无需切换多个平台;对ISV(独立软件开发商)而言,可以快速增强产品数据分析能力,无需从零开发;对衡石而言,则能聚焦于核心分析引擎的优化。目前衡石已与超过200家各行业软件厂商深度合作,产品生态覆盖数字营销、ERP、CRM、HR、MES等数十个垂直领域。

HENGSHI SENSE平台的开放架构体现在多个方面:所有功能模块均可单独嵌入;提供丰富的Open API接口支持二次开发;数仓设计为可拔插组件,便于替换;支持从界面风格到功能深度的多级定制。这种灵活性使不同规模的合作伙伴都能找到适合的集成方式,从轻量级的分析插件到深度定制的分析套件。

衡石科技CEO刘诚忠这样描述其战略:"我们不是一家BI或报表工具的公司,而是要做数据分析的基础设施...让每一个To B厂商都能够转型为数据智能服务商"。这一愿景正在通过ChatBI的嵌入式能力逐步实现,合作伙伴可以基于衡石平台快速构建具有行业特色的智能分析应用,形成差异化竞争力。

行业应用与未来展望

衡石ChatBI的技术架构设计并非纸上谈兵,而是已经在多个行业和场景中得到实际验证,创造了显著的商业价值。同时,随着技术持续演进和应用深入,ChatBI仍有着广阔的发展空间,有望重塑企业数据分析的生态格局。

Logo

永洪科技,致力于打造全球领先的数据技术厂商,具备从数据应用方案咨询、BI、AIGC智能分析、数字孪生、数据资产、数据治理、数据实施的端到端大数据价值服务能力。

更多推荐