“决策支持系统已经超过 30 年没有发生过重大的改变了。” Kyligence 高级副总裁兼合伙人葛双寅(Silas Ge)数月前在一场线下演讲时讲到。在生成式 AI 驱动下,其与大数据高效结合让Kyligence看到了新的可能。“数据文化的倡导者困境”是否又能在企业中得到优化和解决?这篇文章给到了真诚的回答。

1

企业期望通过 AI
进一步提升数据文化

根据 IDC 此前对全球 CEO 及 CXO 进行的调查,我们能看到一个有意思的反差:83% 的 CEO 期望他们的组织可以更由数据驱动,87% 的 CXO 认为让企业向智能化转型是他们最重要的优先级。但实际情况并不那么尽如人意,我们称之为“数据文化的倡导者困境”。实际上,整个公司仅有 33% 的人去询问 KPI 和指标;仅有 30% 的人认为他们的日常工作是由数据驱动的。这就是我们所处的时代,往大了说,任何企业文化在推动的时候都会遇到类似的问题,数据文化只是其中一个典型例子。

图片

与此同时,大家可以看到上图,生成式 AI 在个人领域已经引领了巨大的变革。作为 IT 行业的从业人员应该都至少使用过 ChatGPT 或文心一言生成或解读过文字,听过一两首 Jukebox 创作的歌曲,用过 Midjourney 或 Dall-E 生成过图片,甚至用过微软 Copilot 生成过 Python 代码。可以说,生成式 AI 已经渗透了个人领域的方方面面。

2

AI 蓬勃发展

但在企业数据领域进展不如预期

但企业市场呢?和个人市场相比,企业市场中 AIGC 的应用似乎远没有想象中广泛。2023年上半年,Kyligence 用户大会上,多家咨询机构向我们描绘了生成式 AI 的壮丽图景。然而半年之后,综合考虑人力投入、基础设施和软件成本、数据安全等方面,根据我们的观察,这些应用在企业中落地寥寥。员工知识库问答似乎是各大企业中最容易落地也最容易拿来完成任务的生成式 AI 项目。

如果把目光聚焦到企业数据领域,我们会发现这里的困难似乎更多。

数据准确性无法得到保障

首先,数据准确性是生成式 AI 的一大硬伤,左边是一段著名的 ChatGPT 对话的节选,算是人类早期“驯服 AIGC ”的典型案例,我们可以发现 ChatGPT 受到人类的蛊惑,给出了完全不靠谱的数据结果,这让我想起了右边的这个笑话。

图片

很多人解释说这里的结论性错误并不是 ChatGPT 的锅,ChatGPT 实际上可以针对非常复杂的数学问题给出解题思路与步骤,但它好像又确实无法得到一个准确的结果,我们无法完全信任它的回答。这个解释在我看起来有点苍白无力,就像是我们小时候拿着数学考卷回家跟父母解释说,这道题目我会做的,就是最后有点粗心算错了,你以为这样就能逃过父母的一顿毒打嘛?同样,这样的问题对于企业数据应用往往是致命的,没有一个做数据工作的同学希望自己辛辛苦苦折腾一下午提供给领导的数字,可能是在 Excel 中就能简单验算出数字是错误的。

对于我们的启示是,如果想在企业数据应用中用好生成式 AI,一定要把大语言模型最擅长的部分交给它,而把最需要精确性的数值计算留给我们信任多年的系统与软件。

模型的可解释性有限

第二个问题,大语言模型的可解释性有限,如下图所示,要把大语言模型的可解释性研究透彻,我们需要耗费大量的精力。大家也可以去搜索引擎查一下这个话题,大部分人可能看到第二段就读不下去了。

图片

我曾经问过某个大模型,如何确定大模型给出的答案是正确的?他给出的第一个方法是——“对比已知答案”,我竟无言以对,要是我知道已知答案,我何必来问你呢?因此,我们推荐各位在给出 AI 提供的结论之前,再认真复核一遍,对自己和公司都好。

通用大语言模型在企业内部适用性较小

由于生成式 AI 背后使用的通用大语言模型经过海量数据的积累,可以做到足够的通用,但也因为其通用性,往往会忽略了“个性”,而这种“个性”往往是企业客户所需要的。大家可以看看这幅漫画,是不是也多多少少符合各位的日常工作场景?当然 ChatGPT 的图画创作组件 Dall-E 创作的这幅漫画还是不错的。

图片

因此,再好的通用大语言模型依然需要企业内部语料的预训练或支持库的结合和支持,才能适应企业的真实的个性化需求,大家在选择相关软件的时候需要对这方面的开放性有一些要求。

数据安全永远是绕不过的话题

最后也是最重要的,数据安全是大语言模型应用中永远绕不过的话题,这里简单列举了一系列大语言模型使用过程中的安全问题。好在国产大语言模型和开源大语言模型在过去一年中取得了长足的进步,让我们有足够多的选择可以部分解决数据安全的问题。

图片

3

在一系列限制因素下

找到企业数据与 AI 的最优解

AI - 数据文化无法得到有效推广,生成式 AI 在企业中的使用又有那么多掣肘,但我们依然认为我们有必要在企业中大力拥抱生成式 AI,甚至我认为生成式 AI 一定程度上能够重新激活企业中的数据文化与氛围

下图左侧是著名的杨三角理论,作者是腾讯集团人才系统的重要设计者杨国安教授,当年他正是通过这套方法论在腾讯推动了企业文化的发展。他认为,**企业文化可以通过员工能力、员工思维及员工治理三个方向来解构并给出解决方案。**其中员工能力最为基础,想要解决的是员工“会不会”的问题,员工思维讲的是员工愿不愿意,而员工治理则是公司是否容许。

图片

把这个理论拆解到一个组织的 AI - 数据文化,我们可以从员工能力、员工思维、员工治理的角度思考上述问题。

从员工能力来看,以往使用和分析数据的能力其实仅仅掌握在少数人手中,让所有人使用 BI Dashboard 并不是建立数据文化。而统一的指标能够赋能自上而下的所有员工,在 AI 的加成下,能够实现更友好的交互方式,让数据文化成为可能。

图片

从员工思维来看,以往企业内部组织数据社区、数据大赛、发放奖品,的确是一种激励数据文化的方式,但效果往往难以评估。真正的激励是:自己的老板在使用数据,自己的工作结果体现在数据,自己的绩效由数据决定,企业使用数据后真的在“变好”。这些实打实的正向反馈能够帮助企业以数字化的 KPI 为导向,实现公司的整体经营目标。

图片

从员工治理来看,数据分析软件不应该只是孤立地进行分析,这样并不能形成合理的“驱动”闭环,久而久之,分析是分析,行动是行动,最后变成仅仅是一个取数工具和看数工具,被孤立和边缘化但并没有达到决策层采购的初始目标。

图片

我们认为数据分析应该融入整个公司的执行链路中,变成一个业务系统,这样的数据分析才是“有生命力”的,同时还需要保障数据的准确性、安全性、实时性。

那么,如果一款产品能够同时把 AI 与大数据,把随机与精确,把涌现与严谨完美地结合,它应该又能解决企业数据文化推广中的困境,帮助领导者促进企业数据文化,同时又可以完美地避开 AI 在实际使用时的各种不尽如人意的问题。那下一步 AI 将会有机会进一步帮助我们改变数据行业:

  • AI 将代替人类完成数据分析,将人从纷繁的数据准备和处理工作中解放出来;

  • AI 将短路平台到终端的路径,因为大部分中间工作也将由 AI Agent 来执行;

  • AI 将带来数据平权,使用数据不再是公司中一小部分人的特权;

  • AI 将降低复杂系统的使用门槛,因为有了 AI 的交互将会更加简便;

  • AI 也将增加管理者的管理半径,提升公司的整体运行效率。

图片

最后,如果和数据工作打交道有些年头应该都会对这张图不陌生,这是决策支持系统的完整图景。决策支持系统的概念开始于 1970 年代,在 1990 年左右就变成了这幅图显示的样子。数据从 OLTP 数据库中经过 ETL,加载到数据仓库,加工成数据集市,再通过 MOLAP 或者 ROLAP 为报表提供服务。大家对这幅图如此熟悉,也正说明决策支持系统已经超过 30 年没有发生过重大的改变了。我们认为 AI 将有机会颠覆这一套系统,这也是我们正在探索的方向,欢迎大家了解 Kyligence AI 解决方案(智能一站式指标平台与 AI Copilot),共同抓住时代的机遇。

4

Kyligence AI 技术路线和实践

Kyligence 提供的 AI + 指标平台一站式解决方案能帮助企业更好地应对数据挑战。Kyligence Zen 集 AI 大模型、业务模型、指标管理、指标加工、数据服务等能力于一体,Kyligence Copilot 内置其中,现已支持 Azure OpenAI GPT 系列 、通义千问、智谱 AI、百川智能等国内外领先的大语言模型,实现自主对话数据分析、一键生成分析报告、自动创建个性化仪表盘等效果,进一步提升数据民主化,简化数据分析流程,赋予每位员工决策的力量。

图片

Kyligence 产品落地关注两个核心问题:语言理解的准确性和数据的安全性。在语言理解准确性方面,目前主要有两个技术路径:一是“自然语言到 SQL”(NL to SQL),二是 Kyligence 提出的**“自然语言到指标查询再到 SQL”(NL to Metric Query to SQL)**。Kyligence 采用的是 Multi-agent 多智能体架构,主要路径是将自然语言转换成指标,然后再转换为 SQL 查询。在这种模式中,用户能够充分使用 AI 数智助理以及达到企业级的安全管控,面对各种业务问题的提问,Kyligence Copilot 目前的回复准确率能保证 95% 以上,并达到 100% 可解释性。

图片

Kyligence 智能一站式指标平台与 AI Copilot 数智助理现已落地金融、零售、制造、医药等行业的多家客户,在企业贷款客户洞察、营业厅运营分析、全渠道销售分析等场景中应用实践。

关于 Kyligence

图片

跬智信息(Kyligence)由 Apache Kylin 创始团队于 2016 年创办,是领先的大数据分析和指标平台供应商,提供企业级 OLAP(多维分析)产品 Kyligence Enterprise 和智能一站式指标平台 Kyligence Zen,为用户提供企业级的经营分析能力、决策支持系统及各种基于数据驱动的行业解决方案。

Kyligence 已服务中国、美国、欧洲及亚太的多个银行、证券、保险、制造、零售、医疗等行业客户,包括建设银行、平安银行、浦发银行、北京银行、宁波银行、太平洋保险、中国银联、上汽、长安汽车、星巴克、安踏、李宁、阿斯利康、UBS、MetLife 等全球知名企业,并和微软、亚马逊云科技、华为、安永、德勤等达成全球合作伙伴关系。Kyligence 获得来自红点、宽带资本、顺为资本、斯道资本、Coatue、浦银国际、中金资本、歌斐资产、国方资本等机构多次投资。

图片

点击**「阅读原文」**了解更多