BR 技术头条
yq yq.aliyun.com / 2019-03-01 17:39 / by @可耐芊小仙女

基于 DataLakeAnalytics 做跨地域的数据分析

在阿里云上,很多客户的应用都是多地域部署的, 比如在北京(cn-beijing)的地域部署一个应用让北方的客户访问快一点,同时在杭州(cn-hangzhou)地域部署一份让南方的客户访问快一点。多地域部署之后,业务数据被拆成了多份,而各个地域的数据库都是独立的,网络又不通,给总体业务数据的分析造成了困难。今天我给大家介绍一套基于 DataLakeAnalytics, OSS, DataX 等几个阿里云产品的跨地域数据分析的解决方案。

赞过的人

@技术头条

发表评论

相关分享

mp mp.weixin.qq.com / 2021-03-06 18:09

超全!常用的 70 个数据分析网址

今天给大家分享的这篇文章,更像是一份数据分析常用网站字典,一共70个,可视化、词频词云、PPT模板等等面面俱到,值得收藏!

无图
mp mp.weixin.qq.com / 2020-06-28 21:57

8 个 Python 高效数据分析的技巧

不管是参加Kaggle比赛,还是开发一个深度学习应用,第一步总是数据分析,这篇文章介绍了8个使用Python进行数据分析的方法,不仅能够提升运行效率,还能够使代码更加“优美”。

无图
mp mp.weixin.qq.com / 2020-05-18 13:34

7大 Python 特殊技巧提升数据分析能力

本文列举了一些提升或加速日常数据分析工作的技巧,包括:

1. Pandas Profiling
2. 使用 Cufflinks 和 Plotly 绘制 Pandas 数据
3. IPython 魔术命令
4. Jupyter 中的格式编排
5. Jupyter 快捷键
6. 在 Jupyter(或 IPython)中使一个单元同时有多个输出
7. 为 Jupyter Notebook 即时创建幻灯片

无图
mp mp.weixin.qq.com / 2020-04-26 20:09

8 个 Python 高效数据分析的技巧

不管是参加Kaggle比赛,还是开发一个深度学习应用,第一步总是数据分析,这篇文章介绍了8个使用Python进行数据分析的方法,不仅能够提升运行效率,还能够使代码更加“优美”。

一行代码定义List

定义某种列表时,写For 循环过于麻烦,幸运的是,Python有一种内置的方法可以在一行代码中解决这个问题。

无图
yq yq.aliyun.com / 2019-05-05 16:28

重磅 | 物联网数据分析利器 阿里云发布时序数据库InfluxDB版

近年来,由于IOT,APM等系统的需求,一种以时间戳为主键的数据模型,越来越流行,存储该数据模型的数据库被称为时序数据库。若干年中,市面上出现了很多种不同的时序数据库,他们或数据模型不同,或生态不同,或存储架构不同。经过数年的发展,InfluxDB一枝独秀,在DB-Engines中,遥遥领先其他的时序数据库,成为最受用户欢迎的数据库之一。

无图
yq yq.aliyun.com / 2019-03-22 17:14

OLAP on TableStore:基于Data Lake Analytics的Serverless SQL大数据分析

TableStore(简称OTS)是阿里云的一款分布式表格系统,为用户提供schema-free的分布式表格服务。随着越来越多用户对OLAP有强烈的需求,我们提供在表格存储上接入Data Lake Analytics(简称DLA)服务的方式,提供一种快速的OLAP解决方案。DLA是阿里云上的一款的通用SQL查询引擎,通过在OTS连通DLA服务,使用通用的SQL语言(兼容mysql5.7绝大部分查询语法),在表格存储上做灵活的数据分析任务。

无图