目录
- 从一个新闻门户网站案例引入
- 推算一下你需要分析多少条数据?
- 黄金搭档:分布式存储+分布式计算
这篇文章聊一个话题:什么是分布式计算系统?
一、从一个新闻门户网站案例引入
现在很多同学经常会看到一些名词,比如分布式服务框架,分布式系统,分布式存储系统,分布式消息系统。
但是有些经验尚浅的同学,可能都很容易被这些名词给搞晕。所以这篇文章就对“分布式计算系统”这个概念做一个科普类的分析。
如果你要理解啥是分布式计算,就必须先得理解啥是分布式存储,现在我们从一个小例子来引入。
比如说现在你有一个网站,咱们假设是一个新闻门户网站好了。每天是不是会有可能上千万用户会涌入进来看你的新闻?
好的,那么他们会怎么看新闻呢?
其实很简单,首先他们会点击一些板块,比如“体育板块”,“娱乐板块”。
然后,点击一些新闻标题,比如“20年来最刺激的一场比赛即将拉开帷幕”,接着还可能会发表一些评论,或者点击对某个好的新闻进行收藏。
那么你的这些用户干的这些事儿有一个专业的名词,叫做“用户行为”。
因为在你的网站或者APP上,用户一定会进行各种操作,点击各种按钮,发表一些信息,这些都是各种行为,统称为“用户行为”。
好了,现在假如说新闻门户网站的boss说想要做一个功能,在网站里每天做一个排行榜,统计出来每天每个版块被点击的次数