【大数据行业知识分享】什么是数据湖?
2023-03-02 17:29:52
次
今天给大家分享的是数据湖的概念
那相对于数据仓库所面临的两大挑战
数据湖呢凸显了两方面的能力
一方面呢
就是数据的快速汇集存储能力
它不再提到写时建模
和统一模型的这个概念
那第二点呢
其实就是说
数据价值快速释放的能力
那它着重提出了
读时模型的构建能力
那读时模型的构建能力呢
我们可以理解为
从业务视角的这个角度
那如何快速地从集中存储的数据中
获取到我们想要的数据的
这个是数据湖所需要体现的两大能力
同时呢数据湖也面临着两大挑战
那第一个挑战是什么
就是堰塞湖
堰塞湖其实在我们的读时模型
无法快速构建的情况下
那它会发现呢
数据的价值无法进行释放
非常像堰塞湖
数据都挤在里面了
就像在茶壶里面煮饺子
第二大挑战呢
很容易形成数据沼泽
在数据质量没有很好地监控的情况下
那大量的
数据质量非常低下的数据进入以后呢
那会形成数据沼泽
使得数据释放的能力
也有所下降
那这是数据湖所面临的两大挑战
那在下一节呢
那我们将进一步介绍云边协同
在数字化转型中所起到的作用
下期我们再来接着分享
关注视频号【美林数据Tempotata】
查看视频讲解~