- ubuntu12.04环境下使用kvm ioctl接口实现最简单的虚拟机
- Ubuntu 通过无线网络安装Ubuntu Server启动系统后连接无线网络的方法
- 在Ubuntu上搭建网桥的方法
- ubuntu 虚拟机上网方式及相关配置详解
CFSDN坚持开源创造价值,我们致力于搭建一个资源共享平台,让每一个IT人在这里找到属于你的精彩世界.
这篇CFSDN的博客文章Discuz!NT千万级数据量上的两驾马车 TokyoCabinet,MongoDB由作者收集整理,如果你对这篇文章有兴趣,记得点赞哟.
特别是像主题表(topic),用户表(user)等,因为对于一个流量和发帖量都很大的论坛而言,在运行几年之后,这两个表的数据量可能会破千万(注:因为帖子表采用分表机制,所以这里暂未涉及,但出于性能考虑,也提供了本文中类似的解决方案)。当时考虑的架构设计中有两种思路来解决这种问题: 一种是采用类似MYSPACE的方式,即按一定记录KEY值(比如用户表的UID)来对大数据表中的记录进行分割,比如前200万用户(即:UID<200w)放入一个表,200-400万的用户放入另一个表,以此类推。当然可以把几个表都放到一个数据库中,也可以放到别的MSSQL数据库上或实例上。但这种方案有一些问题,例如当用户表需要被联表(如LEFT JION)查询时使用,比如我们的帖子表进行分页查询时就需要左联user表,这时如采用分表或分布式布署就可能面临这样的问题,不仅业务逻辑要变化,就连存储过程中也要产生不小的变化,这里还不考虑效率上的问题。当然有人建议可以使用数据冗余的方式,比如在帖子表中冗余用户信息相应字段,但这种方案同样要大幅度的修改即有代码,同时如果用户信息发生变化时,不仅要更新用户表,还要更新帖子表中的相应冗余字段,如果这两者不同步,就会造成数据显示异常,当然在数据库层面增加存储成本也是不得不付出的。 第二种就是使用能处理大数据量表格的第三方工具,比如本文所说的TokyoTyrant,Mongodb等,这类NOSQL软件从一问世就是面向海量数据存储访问的,而且这类软件往往都是开源的,另外通过与打算布署企业版的用户接触,发现虽然他们的服务器配置很高,但数量即不多,所以就要考虑如何最大限度的复用已有的机器资源,而这类NOSQL软件往往都是‘性价比’很高的,即用不多的资源(内存,CPU等)就能达到意想不到的效果。当然我目前对其还是很谨慎的使用,即不会马上把它当做主力数据存储工具,而是辅助MSSQL数据库工具,所以大家在看完本文后会发现,这两个工具在企业版中的角色顶多就是一个高级的MEMCACEHD。不过我的想法很简单,就是任何工具和技术,如果不是很了解它或者它很新,那么必定要有一个“考核期”,如果在‘任间’内它通过考核,才委以重任,如未通过考核,也不会让系统平台承担过多的技术层面上的‘风险’.
综上所述,最终我把方向放到了TokyoTyrant,Mongodb上,之所以选择了这两个工具,主要基于下面因素: 1.海量数据的解决方案应该可以跑在LINUX和WINDOW平台上。当然有人会说Mongodb完全可以跑这两个平台,那还为什么要引入TokyoTyrant呢?其实这里有一些产品的特殊情况要考虑,比如我们的用户中绝大多数对于数据的读写比在 4:1,即5条SQL访问中有4条是SELECT操作,1条是CUD操作,这就造成了读写比例的失衡。虽然Mongodb在读写性能上非常优异和稳定,但在并发读上相对于TokyoTyrant+cabinet还是有一些差距(注:更多内容参见该链接,然后这只限于在我们产品中压力测试环境下的结果,不具备普遍性,所以希望大家具体问题具体分析) 。
2.考虑到有些用户公司是有相应技术储备的,两种方案也便于用户公司进行的技术选型(当然因为采用接口方式,用户完全可以引入其它第三方的NOSQL工具来实现).
好了,说了这么多,开始今天的正文吧。 前面说过,该方案使用了接口方式,这里就先看一下相应的接口声明: 。
可以看到,目前在企业版中,对主题表(dnt_topics),用户表(dnt_users),在线表(dnt_online)以及帖子表(dnt_posts)进行了NOSQL数据支持,所以定义了如下的几个接口(图中): 。
因为目前只是把这类NOSQL工具当作高级的‘缓存’来用,所以接口命名上都带着‘Cache’的字样。 然后我使用了一个叫做DBCacheService的类,提供获取这几个接口实例的方法,比如ICacheTopics的实例代码如下: 。
从上面代码可以看出,使用反射方式获取相应DLL文件(分别是Discuz.EntLib.TokyoTyrant.dll和Discuz.EntLib.MongoDB.dll)中的 类信息并初始化该实例。当然,这里还定义了一个配置文件,也就是EntLibConfigs.GetConfig()这个方法所获取的配置文件信息, 相应 配置文件内容包括: 。
上面是配置文件中‘可复用信息’的基类,下面是具体的配置类实例声明: 。
通过该类,就可以用如下配置文件内容初始化相应的实例了: 。
当然,因为使用的开源的客户源工具在配置上有一定的的差异性(比如命名上等),所以这里有些参数可以对TTCACHE有效,却对MONGODB无效, 不过这并不影响对这两种工具的使用。 这里要说明的是,对于TokyoTrant而言,这里使用的是我开发的这款客户端软件:
。
http://www.cnblogs.com/daizhj/archive/2010/06/08/tokyotyrantclient.html 。
Mongodb使用的是:http://github.com/samus/mongodb-csharp。 这里还有个小插曲,之前园子里有朋友介绍了这个客户端NoRM ,不过在我写了一个LINQ示例并进行压力测试后,发现速度不快,比samus的那个客户端慢了不少,在苦找原因无果的情况下,最终选择了samus,不过在samus中目前也支持LINQ的写法(也算是扩展和尝试吧),如下面的写法(更多具体示例还是参见其官方源码包中的相应内容): 。
不过在使用上述代码进行1500万主题分页时,发现LR的测试周期延长(前者(document方式)从2:10秒延长到后者(linq)2:30秒)和吞吐量降低。 所以这里还是最终延用了samus的document访问方式,参照上面的LINQ写法,下面是document写法,形如: 。
如果在你的项目中非要使用LINQ方式的话,那在这里再要介绍的一个samus的属性绑定功能,这个功能对于那些数据库字段与代码中的属性存在 “大小写”差异的情况下,非常有用,即对相应实体类进行‘别名’的绑定,比如对于主题表(需引入MongoDB.Attributes名空间): 。
上面的MongoAlias属性就是属性别名,它就是MONGODB中所存储的数据字段名称。 介绍到这里,再回到正文。 因为这两个工具都是在数据库层面进行缓存的,所以它对于原有的DISCUZ!NT中的缓存系统而言,与数据库帖的更近,所以对原有的业务逻辑改造, 就停留在了数据访问层"DISCUZ.DATA.dll"中了,其实到这里,就看出了当初为什么要分层,以及分层带来的好处了。 比如在Discuz.Data.Topics这个类中添加了这两个静态变量: 。
前者用户判断是否启用主题缓存,后者则获取相应的缓存服务实例(前面配置文件中已做相应说明)。 这样,在已有的数据访问代码中加入相应的缓存逻辑,比如获取主题信息: 。
当然,因为使用了缓存方式,所以就牵扯到缓存中的数据与数据库中数据的一致性问题,所以对于主题的CUD操作,也要对应有相应的对缓存的操作,这基本上就是一个工作量的问题了。因为无论是TTCACHED,还是MONGODB,都支持更新操作。 比如同样是更新主题附件类型的操作,下面是TTCACHED的写法: 。
下面是MongoDB的写法 。
通过对比可以看出,MONGODB可以对某一字段进行操作,而TTCACEHD则只能通过查询先获取整条记录,然后修改某一‘字段’,之后再整条提交更新,所以单从这一角度讲,MONGDOB要比TTCACHED更新性能要高许多(之后的测试结果也说明了这一点)。 正如之前所说的那样,如用户对于这两个接口实现方案均不满意,那么他可以使用其它类型的NOSQL数据库,只要实现了相应的接口: public interface ICacheTopics public interface ICacheUsers public interface ICacheOnlineUser public interface ICachePosts 并在配置文件中进行相应的配置就可以了,当然本文中代码因为时间问题还是有待考量的,但主要的架构设计思想基本被确定下来了。 当然对于原有的数据库中的记录,如果要使用本方案,我提供了转换工具,用于把数据转到TTCACHED或MONGODB中的任一服务端上。如下: TTCACEHD: MongoDB(目前比TTACEHD多了帖子分表转换功能): 最后在压力测试过程中,还出现了一些小问题,好在对着官方文档,逐步优化解决了,这里要特别说一下MONGDOB,其文件的详细程度要好于TTCACHED,基本上主要的功能都有详细的介绍说明页面,呵呵。当然TTCACHED的诞生时间要比MONGODB早,所以在生产环境下的成功案例也相对多一些。 下面列了一下使用过程中的小问题,仅作记录: TokyoTyrant的使用问题:尽量不要在查询的列表中使用排序操作,因为它的排序效率还不如数据库高。尽量使用索引进行查询 键值操作。2000w记录以下查询效率很高,但更高的数据量上目前没做过压力测试(包括CRUD操作) Mongodb:尽量使用_ID做为查询键值操作,包括排序等,对索引进行优化(单列或多列进行索引).
最后此篇关于Discuz!NT千万级数据量上的两驾马车 TokyoCabinet,MongoDB的文章就讲到这里了,如果你想了解更多关于Discuz!NT千万级数据量上的两驾马车 TokyoCabinet,MongoDB的内容请搜索CFSDN的文章或继续浏览相关文章,希望大家以后支持我的博客! 。
和Discuz!X1.0修改的位置不同,具体操作如下: 打开\template\default\common\header_common.htm文件,找到 <titl
前言: 在PHP+MySQL架构的站点中,本文重点从MySQL的角度去分析如何使Discuz!论坛(或者类似的PHP+MySQL架构的程序)应对大访问量。同时给出一些使用Memcache去减轻MyS
最近的一次应用是基本完成了业务系统,需要整合Discuz进去作为交流版块使用。于是,涉及到用户系统的整合和版面的增删操作。UCenter提供了API进行用户的增删管理,自然可以用,但为了保证用户id
但Discuz的同步登陆问题是个头疼的问题,网上搜搜,类似的文章、贴子无数,也参考过很多的文章,始终没能完美地解决自己系统登陆后同步登陆Discuz的问题;在开发机上正常的,放到服务器上就会出现无法
Discuz 密码错误次数过多导致等待15分钟的解决办法 修改文件:在function/function_member.php找 $return = (!$login || (TIMESTAMP
在论坛后台 => 全局 => 附件设置 => 远程附件:选择“启用远程附件”,然后设置 FTP 帐号信息,如下图所示: 然后设置远程附件的目录,如下图所示: 远程附件的
(1)减少服务器流量 (2)减轻服务器负载 (3)节约 WEB 空间 第1、Discuz!5.5 远程附件的设置方法,如图 1 所示配置 设置方法: 1. 如果某 FTP 帐号对应的
Discuz!7.0是康盛创想(Comsenz)公司于2008年12月份发布的一款论坛BBS建站产品。Discuz!论坛的积分设置很灵活和详细,在论坛后台的工具 => 积分策略向导能够完成论坛
关于DISCUZ!论坛标签SEO优化需要参考百度指数和第三方统计数据,具体的需要注意一下几点: 1.参考百度关键字的时候,不要选择过热的关键字。基本上过热的关键字都在做推广,合理的方法是做。热门关
1):Discuz!对安装环境有什么要求? Discuz! 具备跨平台特性,可以运行于 Linux/FreeBSD/Unix 及微软 Windows 2000/2003 等各种操作系统环境下。推荐
近日,康盛创想BBS与SNS社区产品双剑合璧,推出了Discuz! 7.0和UCenter Home (简称UCHome)1.5。这两款社区产品不仅通过UCenter 1.5用户中心打通了会员中心的
后台操作提示数据库错误! Error:Unknown column 'app1' in 'where clause' Errno:1054 SQL::SELECT * FROM `a10171557
今天一个朋友的Discuz X2论坛需要批量替换帖子的内容,帖子数量上万,一开始是通过设置词语过滤,发现无效果,只能通过数据库批量替换了,具体方法请接着往下看。 Discuz X2论坛
由于discuz x2,ucenter,第三方平台通信,但是由于整个ucenter的同步接口存在很多问题,尤其同步信息那块,问题多多,无奈之下,只能把用户密码修改,注册用户,找回密码等功能放在第三方
在discuz x2后台设置各种用户组个性签名的长度,新手10个字等,但是实际运用中发现,这个限制一直无效。后调试代码发现,实际在提交签名后,字数限制会变成200。只能一步一步的调试,最终发现问题出
内存优化 目前支持的内存优化接口有 Memcache、eAccelerator、Alternative PHP Cache(APC)、Xcache、Redis 五种,优化系统将会依据当前服务器环境
/template/default/common 公共模板目录全局加载 block_forumtree.htm DIY论坛树形列表模块 block_thread.htm
1:批量删除回帖 pre_forum_post 表中存储的是论坛帖子和回复。每增加一个帖子或者回复,pid值+1. first值为1的,代表是主题。first值为0的,代表是回帖。&nb
很多站长长年累月的自己把导航改完又改,只想把自己的版块都一目了然的放上去导航中。 现新版本內置了此功能(虽然是一个一显示不能直接设置使用下级来显示) 设置: (分区) (版块)
1、验证码的产生 1、如何在模板中添加一个验证码 在X2中验证码的模板部分独立为一个模板文件(template/default/common/seccheck.htm),供
我是一名优秀的程序员,十分优秀!