首页 >知识讲堂 >网站建设知识>运用经验:新浪微博和Pinterest以及Viacom对Redis数据库

运用经验:新浪微博和Pinterest以及Viacom对Redis数据库

2020-12-31 09:15:03 阅读(223 评论(0)

新浪微博:历史上最大的Redis集群TapeisDead,DiskisTape,FlashisDisk,RAMLocalityisKing.—Jimgrayredis不是成熟的memcache或mysql的替代品,是大型互联网应用架构的良好补充。现在基于Redis进行架构改造的应用越来越多。首先简单公布Redis平台的实际情况:2200 亿commands/day5000亿Read/day500亿Write/day18TBT Memory500 Serversin6IDC20000 instances应该是国内外比较大的Redis使用平台,今天主要从应用的角度来谈Redis服务平台。使用Redis场景1.Counting(计数)计数的应用在另一篇文章中有详细的描述,计数场景优化http://www.xdata.me/?p=这里就不多描述262了。可以预见,很多学生认为把所有的计数都存储在内存中是非常昂贵的。我在这里用一张图表来表达我的观点:在很多情况下,每个人都会想象纯内存使用方案的成本会很高,但实际情况往往会有所不同:COST,对于有一定吞吐需求的应用程序,DB肯定会单独申请、Cache资源,许多担心DB写入性能的学生也会主动将DB更新记录在异步队列中,而这三部分的资源利用率一般不会太高。算下资源,你会惊讶地发现,纯内存的解决方案会更简洁!当你计算资源时,你会惊讶地发现纯内存的解决方案会更简洁!KISS原则对开发非常友好。我只需要建立一个连接池,不用担心数据一致性的维护和异步队列的维护。Cache穿透风险,如果后端使用DB,肯定不会提供很高的吞吐能力,如果Cache停机处理不当,那就是悲剧。大多数初始存储需求,容量小。2.Reversecache面对微博上经常出现的热点,比如最近流行的短链,成千上万的人在短时间内点击跳转,这里经常会出现一些需求,比如我们在快速跳转时判断用户级别,是否有一些账户绑定,性别爱好,已经向他们展示了不同的内容或信息。memcacachee通常使用 Mysql的解决方案,当调用id合法时,可以支撑更大的吞吐量。但是,当调用id无法控制,更多的垃圾用户调用id时,由于memcache没有命中,会大量穿透mysql服务器,瞬间导致连接数疯狂增长,整体吞吐量减少,响应时间减慢。在这里,我们可以用redis记录所有用户判断信息,如stringkeyy:uidint:type,做一个反向cache,当用户在redis中快速获取自己的等级信息时,再去Mcche Mysql层获取全量信息。如图所示:当然,这也不是最优化的场景,比如用Redis做blomfilter,可能会节省更多的内存。3.top10list产品运营总会让您展示最近、最热、点击率最高、活动度最高等条件的toplist。如果使用MC,许多更新更频繁的列表 如果MySQL进行维护,缓存更容易失效,鉴于内存占用较小,使用Redis作为存储也是相当不错的。4.Lastindex用户最近的访问记录也是redislist的好应用场景。lpushlpop自动过期的旧登录记录对开发非常友好。5.RelationList/MessageQueue在这里把两个功能放在最后,因为这两个功能在实际问题上遇到了一些困难,但在某个阶段确实解决了我们的许多问题,所以这里只解释一下。MessageQueue是通过listlpop和lpush接口编写和消耗队列,因为它的性能也可以解决大多数问题。6.FasttransactionwithluaredisLua的功能扩展实际上给Redis带来了更多的应用场景。您可以编写一些command组合作为小型非阻塞事务或更新逻辑,例如:当您收到message推送时,同时,1.给自己增加一个未读对话2。给自己的私信增加一个未读信息3。最后,给发送人一张完成推送信息的收据,这个逻辑可以在Redisserver端完全实现。但需要注意的是,Redis会在aof中记录luascript的所有内容,并将其传输给slave,这对磁盘和网卡来说也是一笔不小的开支。但需要注意的是,Redis会在aof中记录luascript的所有内容,并将其传输给slave,这对磁盘和网卡来说也是一笔不小的开支。7.Insteadofmemcache的许多测试和应用都证明,Redis在性能上并不落后于Memcache,而单线程模型给Redis带来了很强的可扩展性。在许多情况下,Redis对同一数据的内存费用小于memcache的slab分配。Redis提供的数据同步功能实际上是对cache的强大功能扩展。Redis使用的重点1.rdb/aofBackup!超过95%的在线Redis承担后端存储功能。我们不仅将其用作cache,还将其用作k-v存储。它完全取代了后端存储服务(MySQL),因此,数据非常重要。如果出现数据污染和丢失、误操作等情况,将难以恢复。所以备份是非常必要的!为此,我们有共享的hdfs资源作为我们的备份池,希望能够随时还原业务所需的数据。2.Smallitem&Smallinstance!由于Redis单线程模型(严格意义上不是单线程,但认为Request的处理是单线程),大数据结构list,sortedset,hashset的批量处理意味着等待其他请求,因此使用redis的复杂数据结构必须控制其单key-struct的大小。此外,Redis单实例的内存容量也应受到严格限制。单实例内存容量大后,直接带来的问题是故障恢复或Rebuild从库中需要很长时间。更糟糕的是,Redisrewriteaof和Saverdb将带来非常大和长的系统压力,并占用额外的内存,这可能导致严重影响性能的在线故障,如系统内存不足。在线96G/128G内存服务器不建议单实例容量大于20/30G。3.BeenAvailable!Redissentinel(哨兵)更多地用于行业信息和使用http://www.huangz.me/en/latest/storage/redis_code_analysis/sentinel.htmlhttp://qiita.com/wellflat/items/8935016fde25d486d92000行C实现服务器状态检测,自动故障转移等功能。但由于自己的实际结构往往比较复杂,或者考虑的角度比较多,所以@徐琦eryk和我一起做了hypnos项目。然而,由于他们自己的实际结构往往很复杂,或者从更多的角度考虑,@徐琦和我一起做了hypnos项目。hypnos是神话中的睡眠,字面意思是我们的工程师不需要在休息时间处理任何故障。:-)其工作原理如下:Talkischeap,showmeyourcode!稍后将单独写一篇博客详细介绍Hypnos的实现情况。4.InMemoryornot?在沟通后端资源设计时,我们经常忽视对真实用户的评价,因为我们习惯于使用和错误地理解产品定位。也许这是一个历史数据,只有最近一天的数据被访问,把历史数据的容量和最近一天的请求留给内存存储是非常不合理的。因此,当您使用什么样的数据结构存储时,请务必先衡量成本。内存中需要存储多少数据?对用户真正有意义的数据有多少?因为这其实对后端资源的设计非常重要,1G的数据容量和1T的数据容量在设计理念上是完全不同的。1.slavesync改造所有在线master-slave数据同步机制,借鉴了mysqreplication的思路,利用rdbber-slave数据同步机制 aof 作为数据同步的基础,pos简要说明了为什么官方提供的psync不能很好地满足我们的需求:假设有两个来自库B和C,以及A`—B&C,此时,我们发现mastera服务器存在停机隐患,需要重启或A节点直接停机,如果A、B、C不共享rdb和aof信息,C在从库作为B时仍会清除自己的数据,因为C节点只记录与A节点的同步。因此,我们需要有一种方法可以让AA`–B&C结构切换换为A`–B`–虽然psync支持断点续传,但仍不能支持master故障的平滑切换。事实上,我们在定制的Redis计数服务中使用了上述功能的同步,效果非常好,解决了操作和维护的负担,但我们仍然需要推广到所有的Redis服务,如果可能的话,我们也会向官方Redis提出相关的Syncslave改进。2.更适合redisname-systemorproxy的学生发现,除了使用DNS作为命名系统外,我们还记录了zookeper。为什么不让用户直接访问系统,zk或DNS选择其中一个?事实上,这仍然很简单。命名系统是一个非常重要的组成部分,dns是一个相对完善的命名系统。我们做了很多改进和试错。zk的实现仍然相对复杂,我们没有强大的粒度控制。事实上,这仍然很简单。命名系统是一个非常重要的组成部分,dns是一个相对完善的命名系统。我们做了很多改进和试错。zk的实现仍然相对复杂,我们没有强大的粒度控制。我们也在思考什么样的命名系统更符合我们的需要。3.使用后端数据存储大内存必须是成本优化的重要方向,flash磁盘和分布式存储也在我们未来的计划中。二、Pinterest:Pinterest已经成为硅谷最疯狂的故事之一。2012年,基于PC的业务增加了1047%,移动终端增加了1698%。今年3月,其独立访问量飙升至533亿。在Pinterest中,人们关注的是100亿件事——每个用户界面都会查询board或用户是否关注的行为,这导致了极其复杂的工程问题。这也让Redis得到了用武之地。经过多年的发展,Pinterest已成为媒体、社交网络等领域的领导者,其辉煌成就如下:推荐流量高于谷歌 、YouTube和Linkedin的总和与Facebook和Twitter一起成为最受欢迎的三大社交网络参考Pinterest购买的用户比其他网站更高,Pinterest的高规模基于其独立访问量,促成了对IT基础设施的高需求。最近,Pinterest工程经理Abhikhune通过缓存优化了用户体验,分享了公司的用户体验需求和Redis的使用经验。即使是繁殖的应用程序创建者在分析网站的细节之前也不会理解这些特征,所以首先对使用场景有一个大致的了解:首先,对每个粉丝提到的预检查;其次,UI将准确显示用户的粉丝和关注列表页面。即使是繁殖的应用程序创建者在分析网站的细节之前也不会理解这些特征,所以首先对使用场景有一个大致的了解:首先,对每个粉丝提到的预检查;其次,UI将准确显示用户的粉丝和关注列表页面。为了有效地执行这些操作,每次点击都需要一个非常高的性能架构。Pinterest的软件工程师和架构师使用了MySQL和Memcache,但缓存解决方案仍然达到瓶颈;因此,缓存必须扩展,以获得更好的用户体验。在实际操作过程中,工程团队发现缓存只有在用户sub-graph已经在缓存中工作时才能工作。因此。任何使用该系统的人都需要缓存,这导致了整个图片的缓存。与此同时,最常见的问题是“用户A是否关注用户B”的答案往往是否定的,但它被用作缓存丢失,以促进数据库查询,因此他们需要一种新的方法来扩展缓存。最终,他们的团队决定使用Redis来存储整个图表,以便为许多列表提供服务。2.使用Redis存储大量Pinterest列表Pinterest使用Redis作为解决方案,并将性能推到内存数据库级别,为用户保存多种类型的列表:关注者列表你关注的board列表粉丝列表关注你的board用户列表你没有关注的board列表每个board关注者和非关注者Redis为7000万用户存储了以上所有列表,本质上可以说是通过用户ID存储了所有的粉丝图片。鉴于您可以通过类型查看上述列表的数据,分析系统的存储和访问,这些系统看起来更像是事务。鉴于您可以通过类型查看上述列表的数据,并分析系统存储和访问看起来更像事务的概要信息。Pinterest目前的用户列表仅限于10万,初步统计:如果每个用户关注25个board,用户和board之间将有17.5亿的关系。更重要的是,随着系统的使用,这些关系每天都在增加。3.Pinterest的Reids架构和运营通过Pinterest的一位创始人了解到,Pinterest开始使用Python和定制的Django编写应用程序,直到它拥有1800万用户的410TB用户数据。虽然数据存储使用多个存储,但工程师根据用户ID使用8192个虚拟分片,每个分片都在运行

以上就是关于运用经验:新浪微博和Pinterest以及Viacom对Redis数据库的相关介绍,更多运用经验:新浪微博和Pinterest以及Viacom对Redis数据库相关内容可以咨询我们或者浏览页面上的推荐内容。我们将让你对运用经验:新浪微博和Pinterest以及Viacom对Redis数据库有更深的了解和认识。

内容来源:网络,以上内容来源于网络,不代表本站观点,如有侵权,请联系删除。

推荐阅读

java开发是做什么的

JAVA主要是用来干什么的?百战程序员IT问题专业解答java是一种面向对象的编程语言现在我们日常使用的很多软件都是java语言开发的。比如安卓上的各种app,界面都是使用java语言写的。当然java最强大的地方还不是写app的界面,而是...查看详情

用什么软件去做市场?市场管理软件排名

对于市场管理软件来说,是一个十分庞大的数据,所做的行业不同所需要的数据就不一样,比如说销售,在销售中,产品的库存销各种数据,还有每日经营数据对比,及时发现商品数据波动等等,那我们今天就盘点一下市场管理软件都有哪些…查看详情

拼车软件哪个好用又便宜 哪个拼车平台比较靠谱

 现在人们的出行方式都越来越多样化了,拼车算是人们常用的一种出行方式,市面上的拼车软件也是有很多的,下面万商云集小编给大家来详细介绍一下拼车软件哪个好用又便宜 哪个拼车平台比较靠谱方面的内容,希望能帮助到大家解…查看详情

营销|没客户电话也能短信联系,这是什么黑科技?

每到618、双十一和双十二你的手机是不是也会经常收到促销短信呢? 短信群发较于传统的推广方式而言算是一种成本低、速度快、阅读量大而且比较“接地气”的宣传方式之一但许多中小企业却…从未接触过活动的内容编辑重要吗?短信…查看详情

杀毒软件排名,这些可以放心用

现在的工作和生活中都会使用电脑,其中的信息也是比较多的,除了公司内部的信息之外,还有个人的一些隐私,如果不小心受到病毒的感染,那么危害不可小视,甚至还会导致信息泄露影响严重,所以杀毒软件的选择很重要,下面就针对于…查看详情

质量管理软件如何选择?这几款值得尝试

产品的质量是一个企业的生存命脉与基础,本所以说企业对于产品的质量,往往是要求比较严格的,而通过使用质量管理软件,则可以很好的进行质量方面的管理和规范的实施,能够让操作变得更为规范,也是针对于产品的设计人员,还有制…查看详情

已失效的专利可不可以转让?

    依据我国相关法律的规定,向专利管理部门申请专利后,经专利管理部门批准,申请人获得专利权,而专利权是可以依法转让的,那么已失效的专利可不可以转让?下面万商云集小编就给大家来介绍一下这方面的详细内容,希望能帮…查看详情

msf是什么文件

1、什么是MSF文件?2、什么是NLB文件?3、什么是LST文件?MSF是流媒体功能的内容格式为.msf,兼容avi等格式是通过专用工具制作内容分为头文件和动画文件用专门的软件打开如新版的暴风影音NLB是Oracle7数据文件LST是列表文...查看详情

新媒体运营怎么自学 怎么学好新媒体运营

  现在新媒体一运营算是比较热门的一个职业,很多人都转行做新媒体,下面万商云集小编给大家来详细介绍下新媒体运营怎么自学 怎么学好新媒体运营这方面的内容。  01内容的价值性  不管是做文章还是做视频,内容最重要的一…查看详情

盘点好用的微信分销系统,适合创业新手

目前做微信分销系统的很多,商家到底应该如何选择一款适合自己的微分销系统呢?市面上主流的分销系统特别多,主流的微信分销系统哪个好大致包括HiShop销客多等等,企业或者创业新手往往不知道如何挑选。1、微巴人人店分销系统人人店微…查看详情

微信小程序定制开发都需要经过哪些流程

微信庞大的流量资源对于做线上营销的人有着巨大的吸引力,各类小程序层出不穷只为能获得一部分资源。想要在数量众多的微信小程序中占据有利的竞争优势,那进行微信小程序定制开发就是很好的选择。如果你对这一领域还不太清楚,不…查看详情

客户端是什么意思啊

  客户端是计算机网络中的一个术语,通常指的是连接到网络的设备或软件,用于与服务器进行通信和交互。客户端一般用于请求服务器上的资源或服务,例如发送电子邮件、下载文件或访问网站等。在互联网上,客户端是与浏览器或移动…查看详情

如何强制删除文件夹

  在计算机使用过程中,经常会遇到一些无法删除的文件夹,这些文件夹可能由于权限问题、病毒感染、损坏等原因导致不能删除。本文将详细介绍如何强制删除文件夹。  一、使用命令行删除文件夹  命令行是Windows操作系统中一个十…查看详情

网站怎样做流量分析

流量对于网站来说非常重要,网站运营的首要目的就是获得流量,但是流量不同价值也不同,我们需要对流量进行分析,通过流量的分析更好的运营我们的网站,流量的分析主要是流量的来源以及流量在网站上的流向两个方面的分析。通常流…查看详情

飞鱼CRM是什么东西?高效低成本的客户管理系统

让用户接触到广告不难,但想要留住客户,产生最大的投放收益却一直是一项难题,飞鱼CRM系统作为一款优秀的客户管理系统,究竟有哪些作用?下面小万就来详细为大家介绍一下究竟飞鱼CRM是什么东西。 飞鱼CRM是什么东西? 飞鱼C...查看详情

首页

产品

万商学院

客户服务

会员中心

当前站点

h

选择站点

全国站成都

一 客户顾问-张三

已为0个客户提供专业互联网服务咨询
  • 手机号码
  • 验证码图形验证码换一张
  • 短信校验码

    电话咨询

    在线咨询