数据源集市建设的初步思路和规划

这是学习笔记的第  2310 篇文章

最近在对接数据流转的一些问题,发现越是了解,越是担心,因为有不少潜在的问题,所以我就在想规划和统一所谓的数据源集市,能够实现数据流转方向的一个基线标准。

目前发现的问题:

1.数据出口通道繁杂,管理混乱

2.MySQL流转服务单点难以扩展

3.任务状态不清晰,缺乏统一管理

4.数据交付质量难以保证,反馈不及时

5.近实时数据同步需求难以满足

对此提出的改进方案有:

1.数据出口通道统一交付

2.构建数据源集市服务组,水平扩展压力

3.任务配置平台化,任务日志指标可视化

4.数据交付提供交付标准和数据质量日志

5.提供近实时方案作为备选,预知问题

整个数据源集市在数据流转体系中的角色和位置如下:

当日这里是刻意把数据源集市的一些组件和服务列举出来,能够尽可能在这个层面实现数据质量的标准和度量,简而言之,数据如果不合理,我应该及时预警,不能将错就错的提供给中下游,数据源集市需要做好这一层的保障。

在数据流转方向上,我把数据表分为状态表,流水表和配置表,他们在流转体系中的定位和标准也大有不同。

当然这仅仅是数据流转体系内的冰山一角,而如果要把数据的认知和数据源要整合起来,形成统一的认知,这个工作量是极为巨大的。

我感觉对于数据的认知,一旦抛出这个话题,就好像打开了一扇窗,经过了更大范围的讨论,我感觉我本来想要的是一口井,没想到现在需要引一条河流,而且还要再河流上再搭一座桥,真让人头大。

各大平台都可以找到我

  • 微信公众号:杨建荣的学习笔记

  • Github:@jeanron100

  • CSDN:@jeanron100

  • 知乎:@jeanron100

  • 头条号:@ 杨建荣的学习笔记

  • 网易号:@杨建荣的数据库笔记

  • 大鱼号:@杨建荣的数据库笔记

  • 腾讯云+社区:@杨建荣的学习笔记

近期热文:

《大江大河2》最触动我的一段经典对话

MySQL 5.7和MySQL 8.0的4个细节差异

从生命周期的角度来规划数据库运维体系

使用图表分析2020北京积分落户的数据

MySQL 8.0给开发方向带来的一些困扰

关于故障复盘的一些总结

迁移到MySQL的业务架构演进实战

MySQL业务双活的初步设计方案

如何优化MySQL千万级大表,我写了6000字的解读

一道经典的MySQL面试题,答案出现三次反转

小白学MySQL要多久?我整理了10多个问题的答案

转载热文:

工行“去O”数据库选型与分布式架构设计

MySQL 实战笔记 第01期:MySQL 角色管理

MGR用哪个版本?5.7 vs 8.0

SQLcl这个可爱的小工具,来了解一下呀~

CPU占用又爆了?MySQL到底在干什么

这个MySQL优化原理剖析,比照X光还清楚

自己动手写SQL执行引擎

最受欢迎的微服务框架概览

程序员,保住你的钱袋子!

QQ群号: 763628645

QQ群二维码如下, 添加请注明:姓名+地区+职位,否则不予通过

在看 ,让更多人看到