关系型数据库与非关系型数据库、Redis数据库

相比于其他的内存/缓存数据库，redis可以方便的实现持久化的功能（保存至磁盘中）

一、关系数据库与非关系型数据库

1.1 关系型数据库

一个结构化的数据库，创建在关系模型基础上一般面向于记录

SQL语句 (标准数据查询语言) 就是一种基于关系型数据库的语言，用于执行对关系型数据库中数据的检索和操作。

主要有Oracle、MySQL、SQLServer、Microsoft Access、DB2等非关系型数据库

1.2 非关系型数据库

除了主流的关系型数据库外的数据库，都认为是非关系型
包括Redis、MongBD、Hbase、CouhDB等

1.3 关系型数据库和非关系型数据库的区别

1.3.1 数据存储方式不同

关系型数据天然就是表格式的，因此存储在数据表的行和列中。数据表可以彼此关联协作存储，也很容易提取数据。

非关系型数据不适合存储在数据表的行和列中，而是大块组合在一起。非关系型数据通常存储在数据集中，就像文档、键值对或者图结构。你的数据及其特性是选择数据存储和提取方式的首要影响因素。

关系型	依赖于关系模型E-R图，同时以表格形式的方式存储数据
非关系型	除了以表格形式存储之外，通常会以大块的形式组合在一起进行存储数据

1.3.2 扩展方式不同

SQL数据库是纵向扩展，也就是说提高处理能力（增加更多的CPU），使用速度更快速的计算机，这样处理相同的数据集就更快了。因为数据存储在关系表中，操作的性能瓶颈可能涉及很多个表，这都需要通过提高计算机性能来克服。虽然SQL数据库有很大扩展空间，但最终肯定会达到纵向扩展的上限。适用于小规模的数据库或需要快速扩展的情况。
而NoSQL数据库是横向扩展的。因为非关系型数据存储天然就是分布式的，NoSQL数据库的扩展可以通过给资源池添加更多普通的数据库服务器 (节点) 来分担负载。将数据分片存储在多台服务器上，每台服务器负责处理部分数据。通过分区、分片技术来实现数据的水平划分和负载均衡。适用于大规模数据和高并发的场景。

关系	纵向	天然表格式
非关	横向	天然分布式

1.3.2.1横向扩展和复制的常用用途有：

1、读操作的负载均衡。

2、写操作的负载均衡。按信息角色分发，很少更新的表放在一个服务器，频繁更新的表分割到多个服务器上面；按地理区域分割，流量直接定向到最近的服务器。

3、热备份进行灾难避免。配置专门的salve作为热备份。

4、远程复制进行灾难避免。

5、制作备份。在完全不影响master的前提下执行备份。

6、生成报表。创建数据报表会降低服务器性能，影响较大，后台作业可以专门salve执行。

横向扩展只能扩展读操作，不能扩展写操作。分片(sharding)的技术扩展写操作。

同步复制要求master必须等待所有slave的写操作完成。需要额外的同步机制来保证一致性，一般通过两阶段提交(two-phase commit)协议来实现。协议之所以慢，是因为需要4次消息传递，包括事务消息和准备请求的消息，master的提交会被阻塞直到所有slave确认事务。异步复制只需要一条事务消息即可。

异步复制其实是牺牲一致性为代价换取性能

有两个问题：1、master出现故障，事务就会消失；2、slave执行的查询可能返回旧数据。

简单拓扑和树形拓扑用于横向扩展，双主拓扑用于故障转移，环形拓扑和双主结构允许站点本地允许时还能将变更复制到其他站点。

级联复制，添加额外的slave作为中继salve，通过管理一群slave来减轻master上的复制负载。普通salve需要将变更应用到数据库，但不写入二进制日志。relay需要写入二进制日志，但不应用变更。realy使用blackhole引擎，relay会产生额外延迟。

过滤复制事件

1、master上过滤事件，master过滤器，控制哪些被写入二进制日志。无法使用PITR准确恢复数据库。binlog-do-db、binlog-ignore-db，多个数据库需要重复使用选项。

2、salve上过滤事件，slave过滤器，控制哪些在slave上执行。所有变更通过网络传送，浪费带宽。可以过滤数据库，还可以过滤单个表以及使用通配符过滤一组表。replicate-do-db、replicate-ignore-db、replicate-do-table=dbname.tablename、replicate-ignore-table=dbname.tablename、replicate-wild-do-table、replicate-wild-ignore-table。

担心网络流量，可以在master保存完整二进制日志，relay过滤，减少流量。

数据的一致性管理

mysql5.6引入了全局事务标识符(GTID)，master上提交的事务做个标记，等slave获取到这个事务时才在slave上执行查询。

级联部署一致性，，第一是利用全局事务标识符来提升slave，并反复轮询slave有没有处理这个事务；第二是利用函数master-pos-wait函数将maeter到salve路径上的relay都连接起来，保证所有变化都能传递到salve。

1.3.3 对事务的支持性不同

如果数据操作需要高事务性或者复杂数据查询需要控制执行计划，那么传统的SQL数据库从性能和稳定性方面考虑是最佳选择。SQL数据库支持对事务(ACID)原子性细粒度控制，并且易于回滚事务。
虽然NoSQL数据库也可以使用事务操作，但稳定性方面没法和关系型数据库比较，所以它们真正闪亮的价值是在操作的扩展性和大数据量处理方面。

① 关系型：特别适合高事务性要求和需要控制执行计划的任务
② 非关系：此处会稍显弱势，其价值点在于高扩展性和大数据量处理方面

1.3.4 非关系型数据库产生背景

可用于应对Web2.0纯动态网站类型的三高问题。

(1) High performance-------对数据库高并发读写需求
(2) HugeStorage--------------对海量数据高效存储与访问需求
(3) High Scalability && High Availability------- 对数据库高可扩展性与高可用性需求

关系型数据库和非关系型数据库都有各自的特点与应用场景，两者的紧密结合将会给Web2.0的数据库发展带来新的思路。
让关系数据库关注在关系上，非关系型数据库关注在存储上。
例如，在读写分离的MySQL数据库环境中，可以把经常访问的数据存储在非关系型数据库中，提升访问速度。

MySQL高热数据 ----》 redis
web ----》 redis ----》 MySQL
CPU ----》内存/缓存 ----》磁盘

总结

关系型数据库：
实例–>数据库–>表(table)–>记录行(row)、数据字段(column)——》存储数据

非关系型数据库：
实例–>数据库–>集合(collection) -->键值对(key-value)
workdir=/usr/local/mysql

非关系型数据库不需要手动建数据库和集合(表)。

二、Redis简介

Redis是一个开源的、使用C语言编写的NoSQL 数据库。【非关系型数据库】
Redis基于内存运行并支持持久化(支持存储在磁盘)，采用**key-value (键值对)**的存储形式，是目前分布式架构中不可或缺的一环。

2.1 Redis服务器程序的单线程模型

Redis服务器程序是单进程模型

Redis服务在一台服务器上可以同时启动多个Redis进程，Redis的实际处理速度则是完全依靠于主进程的执行效率。若在服务器上只运行一个Redis进程，当多个客户端同时访问时，服务器的处理能力是会有一定程度的下降；若在同一台服务器上开启多个Redis进程，Redis在提高并发处理能力的同时会给服务器的CPU造成很大压力。即：在实际生产环境中，需要根据实际的需求来决定开启多少个Redis进程。

建议可以开2个进程

1、备份
2、抗高并发的同时尽量不给CPU造成太大的压力
若对高并发要求更高一些，可能会考虑在同一台服务器上开启多个进程。若CPU资源比较紧张，采用单进程即可。

单进程快速的原因：

PS ：补充加深一点
使用 epoll（默认） + I/O多路复用机制
首先，Redis 是跑在单进程中的，所有的操作都是按照顺序线性执行的，但是由于读写操作等待用户输入或输出都是阻塞的，所以 I/O 操作在一般情况下往往不能直接返回，这会导致某一文件的 I/O 阻塞导致整个进程无法对其它客户提供服务，而 I/O 多路复用就是为了解决这个问题而出现的。

epoll 机制优势：
1. epoll 没有最大并发连接的限制，上限是最大可以打开文件的数目，这个数字一般远大于 2048, 一般来说这个数目和系统内存关系很大，具体数目可以 cat /proc/sys/fs/file-max 察看。
2. 效率提升， Epoll 最大的优点就在于它只管你“活跃”的连接，而跟连接总数无关，因此在实际的网络环境中， Epoll 的效率就会远远高于 select 和 poll 。
3. 内存拷贝， Epoll 在这点上使用了“共享内存 ”，这个内存拷贝也省略了
I/O多路复用就通过一种机制，可以监视多个描述符，一旦某个描述符就绪，能够通知程序进行相应的操作。

2.2 I/O复用技术介绍

一个线程同时追踪、管理多个连接（原本默认情况下是一个线程对应一个连接）

回调： 预先定义具体的执行过程（定义一个方法），等待调用，在一个线程给执行时，可以根据“触发器”“钩子” 完成回调，回调的目的是提高处理性能和节省资源

2.3 Redis 具有以下几个优点（redis 特性（与其他nosql对比））

(1)、具有极高的数据读写速度：数据读取的速度最高可达到 110000 次/s，数据写入速度最高可达到 81000 次/s。
(2)、支持丰富的数据类型：支持key-value、 Strings、Lists、 Hashes（散列值）、 Sets 及Ordered Sets 等数据类型操作。
ps:
string 字符串（可以为整形、浮点和字符型，统称为元素）
list 列表：（实现队列，元素不唯一，先入先出原则）
set 集合：（各不相同的元素）
hash hash散列值：（hash的key必须是唯一的）
set /ordered sets 集合/有序集合
(3)支持数据的持久化：可以将内存中的数据保存在磁盘中，重启的时候可以再次加载进行使用。
(4)原子性：Redis所有操作都是原子性的。
(5)支持数据备份：即master-salve 模式的数据备份。

丰富的特性 – Redis还支持 publish（消息发布）/subscribe（订阅）, 通知, 设置key有效期等等特性。

Redis作为基于内存运行的数据库，缓存是其最常应用的场景之一。除此之外，Redis常见应用场景：包括获取最新N个数据的操作、排行榜类应用、计数器应用、存储关系、实时分析系统、日志记录。