8月10日,以“精耕数智,为创新加速”为主题的2023网易数帆城市行(北京)在北京JW万豪酒店举办,网易数帆在会上发布了融合前沿AIGC技术研发而成的对话式BI产品——有数ChatBI。
网易数帆大数据产品线总经理余利华表示,借助有数ChatBI的自然语言理解与专业数据分析能力,用户只需通过日常对话的方式即可获得可信的数据,这极大降低了数据消费门槛,让“人人用数据,时时用数据”的愿景成为现实。
数字化时代,无论产品研发、市场营销、财务管理还是客户服务,在经营各环节使用数据支撑决策已成为企业的日常,企业数据分析需求暴增。以网易数帆某客户为例,其月均数据分析需求量超过了200,策划、运营、用户体验、QA等不同岗位都提出了用数的需求,而且其中运营相关的临时或紧急的需求占比很高。然而,由于数据分析流程的专业性和分析人才的稀缺性,传统数据分析显得耗时而低效。
这一极度困扰的局面,一直持续到AIGC技术的发展,能够用于数据分析的类ChatGPT产品扎堆出现。类ChatGPT产品有问必答,速度极快,与数据分析师对需求的响应不可同日而语,这让从业者看到了效率之光。
然而,余利华发出了灵魂之问:“人工智能助手可以立即回答您的数据问题,但您能相信他们吗?”
答案是否定的。首先,类ChatGPT产品并非专门为数据分析而设计,只擅长处理自然语言文本数据相关任务。其次,即使最先进的通用大模型也很容易捏造事实,俗称“AI幻觉”,在BI领域可能是捏造字段,这在环环相扣的数据分析中可能成为致命的缺陷。
在过去的10个月中,网易数帆的重要事项之一,就是在数据分析领域与这种幻觉对抗,打造可信的有数ChatBI。
“AI幻觉”的产生是由于训练数据不足、文本与表示之间的编解码错误等因素,可怕的是AI并不知道这是幻觉,单靠Prompt(提示)来纠正极为困难。网易数帆是如何做的呢?
余利华用20个字总结了网易数帆打造可信的有数ChatBI的奥妙:需求可理解,过程可验证,用户可干预,产品可运营。
所谓需求可理解,是指网易数帆为弥补用户认知和复杂工具之间的门槛,提升准确率,借助大模型的语言理解能力,先进行需求分析,这样即使是完全不懂BI的使用者也能通过需求分析内容判断系统的取数步骤是否正确。
过程可验证,即借助基于大模型的NL2SQL能力实现复核。为了提升NL2SQL能力,网易数帆有针对性地定制生成和优化了超过30万不同类型的问法和SQL。余利华介绍,网易数帆调优出的NL2SQL领域模型,效果已达到GPT-3.5的水平。
用户可干预,即将数据模型和查询条件结构化,用户可干预可调整,切换数据模型或者查询条件。
产品可运营,即网易数帆为有数ChatBI产品构建了独特的运营反馈机制,用户可以反馈数据的准确性,管理员可运营知识库、标记及优化badcase,从而提升数据可靠性。
网易数帆产品人员通过大型连锁超市的华北地区的销售负责人日常用数的场景,演示了如何通过有数ChatBI全程自助获得可信数据的过程。
产品人员只需输入“我想看今年上半年华北地区每个月的利润”,有数ChatBI立即给出结果,并用自然语言描述了查询的逻辑与步骤,如有掌握SQL的专业人员,也可以点击“更多”按钮查看对应的SQL。而如果逻辑有误,如用户想看“订单日期”在上半年的数据,但是AI筛选的却是“发货日期”,用户点击“修改查询条件”即可进行对应的校正,还可以修改更符合需求的图表样式,例如通过折线图可以更好地查看趋势。
当被问到利润增长的原因时,有数ChatBI通过图表给出了主要影响的因素和维度:“细分为小型企业、类别为办公用品、城市为北京”是影响利润增长的最核心维度。
与传统分析方式需要繁琐的步骤不同,有数ChatBI只需要对话和点选就能得到可信的结果,有数ChatBI让非技术人员也能轻松获取数据和业务洞察。余利华认为,这是一种门槛更低、效率更优、更智能的数据分析新范式。
目前,有数ChatBI在网易公司的应用,已经覆盖产品、运营、市场、财务等非技术人员。
当AIGC成为影响整个数智领域的核心技术,网易数帆也在借助AIGC构建数智竞争力。余利华透露,有数ChatBI是网易数帆在BI领域的实践成果之一,在数据分析阶段之前的数据准备阶段,如数据建模与管理环节,和之后的数据应用阶段,网易数帆也正在积极探索各项产品与AIGC技术的融合,未来将可实现更智能的数据能力,如自动生成ETL流程、报表自动生成、自动生成填报表单、数据分析结论及洞察等。
“AIGC和BI的结合,将改变整个数据服务的格局。”余利华说。
当前,数据分析能力已经企业业务能力,企业的每一位员工都需要借助数据分析去实现更多价值,网易数帆有数ChatBI引领的数据分析新范式,将更好地帮助业务成长,实现数智化转型。
– END –
报告下载
大佬观点