1、 移动互联网和电商情景下的混合云实践 刘秋岐 提纲 两个“故事” 电商靠“促” | app靠“Push” 如何维稳且节省成本? 双机房 和 单机房+云端方案对比 单机房+云端 架构 单机房+云端架构实施 带宽考虑 云主机的计算和IO能力考虑 数据一致性和安全 弹性计算 自我介绍自我介绍 之前在搜狗和兰亭集势负责数据库的运维和架构设计 目前在宝宝树(母婴社区网站)负责网站的运维和架构 一枚热爱数据库技术的少年 先讲两个故事先讲两个故事 某电商网站图书促销,我在购物车里 面塞了些书,点击“购买”按钮后, 浏览器迟迟没有响应 当晚该电商公 司大老板发微博:“我已经紧急购买 采购了10台服务器,增强网站后台, 明天继续促销一天。” 第二天一上班,我再次点击“购买” 按钮后,悲剧的发现页面还是 “Service is too busy”.当晚贵司老 板发微博要请信息部同事喝茶(咖啡) 前端时间非常火的app足记,大家知 道它有多火么?从App Store排名100多位 蹿升到免费分类全榜第1,足记只花了不到 10天,3月22号当天的数据为“每天新增 下载量超过100万,日活跃用户近50%”。 由
2、于太过火爆,足记关闭了部分app的功 能以缓解服务器压力:“由于服务器压力 过大,只好暂时暂停这块功能”,然后该 团队开始寻觅CTO对其架构进行优化等: 电商靠“促”电商靠“促” 天猫和淘宝双十一 成交额571亿元: 各大企业也加快电商的促销布局:特卖网站每天特卖外也额外增加 促销 图为化妆品特卖网站聚美优品的3月1号 大促特卖活动: app靠“Push”app靠“Push” 那么如何提升app的Dau? 主要靠Push消息来提升,不断push提高dau, 一旦停了一天的push就会丢掉一些dau App运营数据有几个非常重要:次日留存率、 Dau(日活跃用户数)、Mau(月活跃用户数) 下图为陌陌申请ipo中招股书的截图: Push的信息随手抓了几条: appapp靠靠“PushPush” Push之后用户点开消息,访问网站api,这个时候,网站的访问量就会飙升,造成load的尖峰 (这个尖峰和Push的时间点完全吻合) 竞争对手之间的恶意攻击竞争对手之间的恶意攻击 电商大促期间,竞争对手可以利用“黑产” 去对正在促销活动的电商企业进行一些恶意 攻击: DDoS、CC攻击甚至是穿透缓
3、存层的长尾攻击. 450G 是个什么概念呢? “450G是个很大的值,据我们了解,国内一些中小城市总的 带宽也不一定有450G,也就是说如果有这么大的流量打到某 个城市的IP上,这个城市就要断网了。” DDoS的流量在黑产里比较廉价: “打1G的流量到一个网站一小时,网上报价只需要50块钱” 那么, 在移动互联网快速发展和电商流行的今天, 在互联网日益竞争激励的今天, 如何保障我们的维持4个9的稳定性且极大程度上节省成本呢? 破坏稳定性的原因: 机房故障(断网/掉电/空调问题/不可抗力毁坏) 遭遇攻击(DDoS,CC,穿透缓存的攻击(打到db的攻击) 访问量突高(评估访问量低了,实际很高,资源不够用) 解决方案: 方案一: 引入灾备机房并扩充主机房资源 方案二: 对接云服务提供商 方案方案机房不可用机房不可用 机房不可用机房不可用攻击攻击投入(每年投入(每年 单位¥万)单位¥万) 电力故障电力故障机房过热机房过热 机房网络机房网络 故障故障 DDoSDDoSCCCC 穿透缓存穿透缓存 的攻击的攻击 即时应对即时应对 3030分钟分钟 内应对内应对 1 1小时内小时内 应对应对 2 2小
4、时内小时内 应对应对 双机房双机房240240 单机房单机房 + + 云云300300243243189189146146 注:以上数据是根据我们真实计算出的数据而后为了演示做了一定比例的修改而出的数据 方案对比: 单机房单机房+ +云云方案胜出!方案胜出! 单机房 + 云 架构图: 云机房云机房 web 流 量 流 量 流 量 流量流量 web db other component 云nginx 反向代理 源站源站idc 流 量 流 量 流 量 一、带宽: 严格计算带宽:各个系统的同步流量,包括数据库主从同步的流量、缓存同步的流量、广告系统同步的流量等等 这里需要算好各系统同步峰值叠加的流量值,我们为了安全,专线1g是计算得到值的2倍 考虑可以不用很实时同步的数据异步化, 降低带宽争用 预算有限,拉了1g的专线,从北京兆维机房到北京上地的某云机房 由于跨运营商的问题,从兆维联通出来的专线先接入到一个大厦的点上, 再从这个点接入上地云机房(电信) 二、考虑云端的云主机的计算能力: 计算能力实测: 线上服务器云端服务器 CPUv2620-v2630v2650-v2690 VM配置相同相同
5、 业务线上实测平均耗时云端实测平均耗时 *_worker97.7ms111.5ms *_task30.2ms34.1ms *_system142.1ms87.7ms *_front325.5ms276.4ms 云主机的计算能力跟自己机房的机器运算能力的差别需要测试,用于跑apache+php的机器要根据云主机的计算能力调各种配置 二、考虑云端的云主机的IO能力: IO性能实测: VM SizeTest caseTotal I/O per second (the bigger the better) Total MBs per second (Decimal) Average I/O Response Time(ms) Maximum I/O Response Time(ms) % CPU utilization SSD VM2CPU, 4KiB Read 50% and 100% Random 9311.1237.720.235.52.4% SSD VM4CPU, 4KiB Read 50% and 100% Random 17841.1474.120.245.684.49% SSD
6、VM8CPU, 4KiB Read 50% and 100% Random 32208.75131.810.265.975.22% SSD VM16CPU, 4KiB Read 50% and 100% Random 37823.12153.830.46786.567.63% Standard2CPU , 4KiB Read 50% and 100% Random 557.432.294.12211.682.75% Standard4CPU , 4KiB Read 50% and 100% Random 607.372.67.09205.300.87% 我们数据库机器用了SSD,云端DBServer也需要支持SSD,且需要亲自测 IO,测主从DBServer之间的同步延时 三、数据一致性和安全: 由于我们非电商系统,所以对数据的一致性要求不是很严格,对数据库的写全是写在自己机房, 一旦机房出现故障,通过修改私网dns指向访问到云端的 DBServer 数据的安全:99%的数据库都是用户的帖子数据、用户的日记等以及一些孕育知识、线上活动,只有1%的数据是用户机密数据, 这个我们做了个javaservice,类似于简单passport的东西去支持,并对访问进行检测和保护(防止一次性请求很多数据等) 现在各种云厂商已经很强大了,观察到某家云厂商已经快支持在云端建立专有网络(VPC) 专有网络 (Virtual Private Cloud,简称VPC) ,帮助您基于云构建出一个隔离的网络环境。您可以完全掌控自己的虚拟网络, 包括选择自有 IP 地址范围、划分网段、配置路由表和网关等。此外您也可以通过专线/VPN等连接方式将VPC与传统数据中心 组成一个按需定制的网络环境,实现应用的平滑迁移上云。 三、弹性运算 Doing: app push 初始化删除 时间轴 19:0024:0018:0019:000:001:00
《移动互联网和电商情景下的混合云实践》由会员蜀歌分享,可在线阅读,更多相关《移动互联网和电商情景下的混合云实践》请在金锄头文库上搜索。
相关知识
移动电商网站建设方案
移动电商app
移动互联网下的电商分析.docx
移动电商APP下载安装
移动电商APP开发-移动电商平台方案定制公司
移动电商的组合拳
移动电商的应用有哪些?(推荐移动电商的10大应用)
移动电商网站开发
移动互联网 广告如何投放?
移动互联网的“约炮经济学”
网址: 移动互联网和电商情景下的混合云实践 https://m.huajiangbk.com/newsview1500859.html
上一篇: (转)探讨12306两地三中心混 |
下一篇: 混合云+AI,百年IBM的第四次 |