Menu
产品
Tempo大数据分析平台
Tempo商业智能平台
Tempo人工智能平台
Tempo数据工厂平台
Tempo数据治理平台
Tempo主数据管理平台
Tempo指标平台
解决方案
自助式可视化分析
算法模型管理
指标管理解决方案
数字指挥中心
湖仓一体解决方案
智能场景应用构建
主数据应用监管
数据中台
行业应用
发电
电网
制造
油气
煤炭
高校
政企
金融
科研院所
数据资产入表
大模型应用
产教融合
认证中心
DCMM认证
DAMA认证
关于我们
美林数据
合作生态
内容中心
帮助中心
美林新闻
行业资讯
申请试用
方案咨询
产品
Tempo大数据分析平台
面向企业级用户的一体化大数据分析平台
Tempo商业智能平台
面向业务人员的自助式可视化分析平台
Tempo人工智能平台
自动化、智能化的分析模型构建平台
Tempo数据工厂平台
批流一体的大数据开发平台
Tempo数据治理平台
打破数据治理困境,为业务价值保驾护航
Tempo主数据管理平台
解决主数据集成难、应用难的问题
Tempo指标平台
让管理更敏捷、业务更智能
解决方案
自助式可视化分析
数据指导行动,让每一次都有进步
算法模型管理
构建企业级模型管理与应用平台
指标管理解决方案
轻量化打造指标体系,让企业高质量发展
数字指挥中心
从数据中获得见解,让决策有据可依
湖仓一体解决方案
一体化的数据存储、集成、开发解决方案
智能场景应用构建
从数据开发到智能分析的一站式解决方案
主数据应用监管
解决企业主数据应用无法监管难题
数据中台
打造企业数字化转型数据底座
行业应用
发电
数字化赋能新能源电厂提质增效
电网
助力数字电网建设
制造
数字化智造从顶层设计到落地实施
油气
以AI视角优化油气行业生产流程
煤炭
AI赋能智慧煤矿安全、高效生产
高校
教学、实践、科研一体化实验室解决方案
政企
助力智慧政务决策
金融
客群价值深度挖掘,打造精准营销新模式
科研院所
提升科研转化能力,助力产业应用创新
数据资产入表
大模型应用
产教融合
认证中心
DCMM认证
掌握DCMM国家标准,全面提升数据管理技能
DAMA认证
学习国际数据管理业界权威知识体系,培养数据人才
关于我们
美林数据
连续7年大数据企业50强
合作生态
基于多年成功经验,提供技术与方法论支持
内容中心
大数据专业知识沉淀与成果共享
帮助中心
Tempo产品操作手册及常见问题解析
美林新闻
美林数据动态尽在掌握
行业资讯
第一时间洞察最新行业资讯
美林数据
ABOUT US
美林数据技术股份有限公司(简称:美林数据,NEEQ:831546)是国内知名的数据治理和数据分析服务提供商。
产品简介
Tempo商业智能平台
提供了从数据接入、数据准备、数据可视化分析于一体的完整的解决方案
Tempo人工智能平台
为“全民数据科学家”提供自动化、智能化的数据分析模型构建能力。
Tempo数据工厂平台
支持大规模数据的快速集成和高效计算,构建流批一体大数据开发平台。
Tempo指标平台
指标的体系化建设和全生命周期管理。
Tempo数据资产管理平台
面向企业数据治理、数据中台落地的应用平台。
Tempo主数据管理平台
为用户提供全生命周期管控的主数据治理工具。
相关推荐
Tempo+金融|银行智能分析决策平台建设实践
数字化转型的四大典型场景,TempoBI来支持
数据分析上手难?2招帮你快速生成高质量数据可视化报表
美林新闻
/
NEWS
首页
美林数据
大数据分析与应用
Tempo人工智能平台之智能学习模块
2020-04-10 14:30:36
次
在数据驱动决策,数字化转型的今天,越来越多的企业设立首席数据执行官以及数据分析科学家的角色,带领一个团队去完成数据的收集、存储、传输以及分析任务,设计组织、协调、流程、技术实现及生产部署,其除了需要了解业务,定义分析方案,自动执行或优化流程外,更重要的在于其需要通过协同团队来发掘创新及洞察,优化他们所创造的价值,这就需要在一个集成、协同的环境中去实现
数据挖掘
分析。
Tempo大数据分析平台是一款专注大数据挖掘与可视化分析的业务增值工具,其采用数据流拖拽式的操作流程,结合CRISP-DM工业标准,以高性能计算技术、领先的数据挖掘算法、高维可视化分析技术、独创DVL数据可视化语言技术为基础,帮助用户解决数据价值发掘和利用的问题,其强大的自学习功能更是为建模分析及优化模型提供了一种有效便捷的途径。
图 1 CRISP-DM数据挖掘流程
在完成建模数据准备之后,需要依据数据建立模型时,通常会面临算法选择的问题,即选择何种算法可能会取得较好的结果,一般的做法是依据经验和算法特点来确定。而在选定算法后,面临的第二个问题是如何设定算法的参数,通常默认的算法参数针对的一般的数据集,如公开的数据挖掘算法测试数据集,在针对具体的业务建模时,就需要多次实验来确定一组相对较好的算法参数,整个过程耗时耗力。
图 2 选择模型或算法时的困扰
Tempo人工智能平台的智能学习模块为您提供一站式的解决方案,主要包括自动分类、自动择参、交叉验证和循环行四大部分。自动分类部分可实现分类模型的自动选择,自动择参可实现对算法最优参数的自动选择,交叉验证可实现对训练模型泛华性能的评估,循环行可实现按特定字符字段分类处理或建模功能。
图 3 Tempo智能学习模块
其中自动分类能实现一个数据集的多种分类算法的一次性建模,并且内嵌自动择参和交叉验证等功能,确保在多种模型中选择和推荐出最佳的模型,以实现模型的自动化和智能化学习。
图 4 自动分类流程示例
图 5 自动分类参数配置
图 6 自动分类洞察信息
其中,自动择参提供了一定范围下的批量建模,在实际建模中,针对每个算法提供对应的一批参数和这些参数的多个取值,算法对这些参数及其取值进行组合,并通过循环执行组合内的值,挑选出表现最佳的模型。平台中调参的方法包含grid和list,grid是仅支持数值型参数,并提供如线性尺度、对数尺度等变换方式,list除了支持数值型参数调参外,还支持对字符型参数。模型洞察信息中包含最终选择的算法最有参数及模型结构相关信息,便于后续模型调优及应用部署。
图 7 自动择参流程示例
图 8 自动择参内部流程及参数配置
图 9 自动择参结果洞察信息
交叉验证是一种用来验证模型性能的统计分析方法,基本思想是:将原始数据进行分组,一部分作为训练集,一部分作为验证集,首先用训练集对分类器进行训练,再利用验证集来测试训练得到的模型,以此作为评价模型的性能指标。过程中不仅考虑了训练误差,同时也考虑了泛化误差,有助于从某些候选模型中选择最适合某个学习问题的模型,使得模型在偏差和方差之间找到最佳的平衡点。Tempo平台中实现的方法为K折交叉验证法,假设指定验证次数为k,则意味着将原始样本分为k份,将每份子集数据分别做一次测试验证集,其余的k-1组子集数据作为训练集,这样会得到k个模型,将这K个模型的预测结果分别相加,作为此分类模型的汇总混淆矩阵,并由汇总混淆矩阵得出指定参数下该模型的正确率、召回率等性能指标。模型洞察信息中包含各模型的混淆矩阵及正确率信息和最终模型对于整体数据的正确率。
图 10 交叉验证流程示例
图 11 交叉验证内部流程及参数配置
图 12 交叉验证结果洞察信息
另,
Tempo人工智能平台
提供了循环行功能,可实现根据指定的字符型属性的不同取值,将数据集分群,各分群数据集分别执行循环行中的任务(数据读取、数据处理、建模、评估等),如支持将全国销售数据分区域进行缺失值处理,华北/华南区域中某城市销售额存在空值的,则用华北/华南区域各城市销售额均值填充处理。将其结合平台的自学习功能可实现更为复杂场景的建模,为用户有效便捷地实现企业价值发掘提供更有力的支持。
图 13 循环行流程示例
图 14 循环行内部流程及参数配置
图 15 循环行结果洞察信息
关于Tempo大数据分析平台
Tempo
大数据分析平台
是一款集数据接入、数据处理、数据挖掘、数据可视化、数据应用于一体的软件产品。它秉持“智能、互动、增值”的设计理念,面向企业级用户提供自助式数据探索与分析能力,为企业提供从BI到AI的一体化数据分析与应用解决方案。
上一篇:Tempo大数据分析平台之文本分析
下一篇:7个回归分析方法!数据分析师必须掌握
在线咨询
服务热线
400-608-2558
咨询热线
15502965860
电话联系
微信扫描二维码,立即在线咨询
微信沟通
申请试用