本公开总体上涉及云中复杂数据的分析,更具体地说,涉及大量数据的高效并且智能分区和实时可视化见解的生成。
背景技术:
1、数据分析是日益发展的领域,它从原始信息源中获取见解。数据分析技术可有所不同,但它们典型地用于收集、处理和分析数据以供人们消费和决策。数据分析可用于揭示因大量未分析数据而丢失或“不可见”的趋势和指标。然而,以这种方式使用该信息可优化过程并提高系统的整体效率,否则将无法获得该信息。
2、传统上,许多可视化仪表板主要侧重于提供高级摘要,如细分概况、群组分析和其他类似指标。为了获得竞争优势,利益相关者(包括直线经理)寻求通过深入研究报告中的较低等级数据来揭示更深层次分析见解的工具。然而,在‘大数据’的上下文中(具有数万亿表格行和海量存储器),可视化报告生成变得滞后,尤其是在响应前端刷新请求时。这造成了不必要的高延迟仪表板并阻碍了对重要见解的访问。
3、本领域需要一种解决上述缺点的系统和方法。
技术实现思路
1、公开了一种优化用于数据存储和刷新事件的资源的数据处理和分析系统。所提出的系统和方法描述了用于生成分区策略的动态和自动化过程,该分区策略用于在云中管理和维护大数据的实施方式。该系统和方法通过自动评分和标识最适合给定项目的用户需求的最佳分区大小来解决上述问题。在一个示例中,来自多个源的数据可以被集成在云不可知和数据格式不可知的过程中,允许系统创建新的度量并且建立关系的集合,这些关系支持为可视化工具提供动力的表格语义数据模型的构建。在一些实施例中,所提出的数据分析框架采用高度优化和自动化的分区加载技术,该技术涉及将数据分割为更小的单元。此外,自定义数据刷新技术可有选择性地只刷新必要的分区,加上智能数据集市(“mart”)能力,随着冗余的消除,所需的计算时间大大减少。
2、一方面,本公开为基于云计算的基础设施提供了一种处理和对数据进行分区的计算机实施方法。该方法包括在数据分析系统的分区器模块处接收第一客户标准和包括表格数据的第一客户数据集的第一步骤,以及在分区器模块处计算表格数据的第一大小得分的第二步骤,第一大小得分标识最有可能满足第一客户标准的第一数据增量。此外,第三步骤包括在分区器模块处基于第一大小得分而生成第一分区策略,并且第四步骤包括在数据分析系统处实施第一分区策略以产生表格数据中的聚合数据的集合,这些集合包括第一分区。该方法的第五步骤包括将集合数据作为智能数据集市的部分存储在数据分析系统中。第六步骤包括经由与数据可视化平台相关联的第一用户界面接收第一用户查询,并且第七步骤包括确定第一用户查询与第一分区有关。此外,该方法包括经由数据可视化平台从智能数据集市取回第一分区的第八步骤,以及为数据可视化平台并且经由生成人工智能(ai)模块基于第一分区生成第一可视化的第九步骤。
3、另一方面,本公开提供了一种存储软件的非暂时性计算机可读介质,该软件包括可由一个或多个计算机执行的指令,这些指令在执行时,促使一个或多个计算机通过执行以下各项为基于云计算的基础设施处理和对数据进行分区:(1)在数据分析系统的分区器模块处接收第一客户标准和包括表格数据的第一客户数据集;(2)在分区器模块处计算表格数据的第一大小得分,该第一大小得分标识最有可能满足第一客户标准的第一数据增量;(3)在分区器模块处基于第一大小得分而生成第一分区策略;(4)在数据分析系统处实施第一分区策略以产生表格数据中的聚合数据的集合,该集合包括第一分区;(5)将聚合数据的集合作为智能数据集市的部分存储在数据分析系统中;(6)经由与数据可视化平台相关联的第一用户界面接收第一用户查询;(7)确定第一用户查询与第一分区有关;(8)经由数据可视化平台从智能数据集市取回第一分区;以及(9)针对数据可视化平台并且经由生成式人工智能(ai)模块基于第一分区生成第一可视化。
4、在又一方面,本公开提供了一种用于为基于云计算的基础设施生成应用程序架构的系统,该系统包括一个或多个计算机和存储指令的一个或多个存储设备,这些指令在被一个或多个计算机执行时可操作以使一个或多个计算机:(1)在数据分析系统的分区器模块处接收第一客户标准和包括表格数据的第一客户数据集;(2)在分区器模块处计算表格数据的第一大小得分,该第一大小得分标识最有可能满足第一客户标准的第一数据增量;(3)在分区器模块处基于第一大小得分而生成第一分区策略;(4)在数据分析系统处实施第一分区策略以产生表格数据中的聚合数据的集合,该集合包括第一分区;(5)将聚合数据的集合作为智能数据集市的部分存储在数据分析系统中;(6)经由与数据可视化平台相关联的第一用户界面接收第一用户查询;(7)确定第一用户查询与第一分区有关;(8)经由数据可视化平台从智能数据集市取回第一分区;以及(9)为数据可视化平台并且经由生成式人工智能(ai)模块基于第一分区生成第一可视化。
5、本领域普通技术人员在研究以下附图和详细说明后,将会明白本公开的其他系统、方法、特征和优点。所有这类附加的系统、方法、特征和优点均旨在包括在本说明书和本公开内容中,包括在本公开的范围内,并且受到所附权利要求的保护。
6、虽然对各种实施例进行了描述,但该描述旨在进行示例性说明,而非限制性说明,对本领域普通技术人员而言,清楚的是,实施例范围内可能有更多实施例和实施方式。尽管在附图中示出了许多可能的特征组合,并在详细描述中进行了论述,但是所公开特征的许多其他组合也是可能的。除非特别定义,否则任何实施例的任何特征或元素可与任何其他实施例中的任何其他特征或元素结合使用或替代任何其他特征或元素。
7、本公开包括并考虑了与本领域普通技术人员已知的特征和元素的组合。已公开的实施例、特征和元素也可与任何常规特征或元素组合,以形成权利要求所定义的独特发明。任何实施例的任何特征或元素也可与来自其他发明的特征或元素相结合,以形成如权利要求所定义的另一个不同的发明。因此,将会理解,本公开中示出和/或论述的任何特征可单独地被实施或以任何合适的组合被实施。因此,除了根据所附权利要求及其等同物之外,实施例不受限制。此外,在所附权利要求的范围内可进行各种修改和改变。
1.一种用于为基于云计算的基础设施处理和对数据进行分区的计算机实施的方法,所述方法包括:
2.根据权利要求1所述的方法,其中实施所述第一分区策略还包括:在基本上同步的过程中在所述表格数据中创建多个分区。
3.根据权利要求1所述的方法,还包括:
4.根据权利要求3所述的方法,还包括:
5.根据权利要求1所述的方法,还包括:
6.根据权利要求5所述的方法,还包括:经由所述第二用户界面接收对所述第一选项的选择,并且其中实施所述第一分区策略是响应于接收到对所述第一选项的所述选择。
7.根据权利要求1所述的方法,还包括:
8.一种非暂时性计算机可读介质,其存储软件,所述软件包括由一个或多个计算机可执行的指令,所述指令在执行时,使所述一个或多个计算机通过以下方式为基于云计算的基础设施处理和对数据进行分区:
9.根据权利要求8所述的非暂时性计算机可读介质,其中所述指令还使所述一个或多个计算机以基本上同步的过程在所述表格数据中创建多个分区。
10.根据权利要求8所述的非暂时性计算机可读介质,其中所述指令还使所述一个或多个计算机:
11.根据权利要求10所述的非暂时性计算机可读介质,其中所述指令还使所述一个或多个计算机:
12.根据权利要求8所述的非暂时性计算机可读介质,其中所述指令还使所述一个或多个计算机:
13.根据权利要求12所述的非暂时性计算机可读介质,其中所述指令还使所述一个或多个计算机经由所述第二用户界面接收对所述第一选项的选择,并且其中实施所述第一分区策略是响应于接收到对所述第一选项的所述选择。
14.根据权利要求8所述的非暂时性计算机可读介质,其中所述指令还使所述一个或多个计算机:
15.一种用于为基于云计算的基础设施处理和对数据进行分区的系统,所述基础设施包括一个或多个计算机和存储指令的一个或多个存储设备,所述指令在被所述一个或多个计算机执行时可操作以使所述一个或多个计算机:
16.根据权利要求15所述的系统,其中所述指令还使所述一个或多个计算机以基本上同步的过程在所述表格数据中创建多个分区。
17.根据权利要求15所述的系统,其中所述指令还使所述一个或多个计算机:
18.根据权利要求17所述的系统,其中所述指令还使所述一个或多个计算机:
19.根据权利要求15所述的系统,其中所述指令还使所述一个或多个计算机:
20.根据权利要求19所述的系统,其中所述指令还使所述一个或多个计算机经由所述第二用户界面接收对所述第一选项的选择,并且其中实施所述第一分区策略是响应于接收到对所述第一选项的所述选择。