玩传奇论坛

 找回密码
立即注册

扫一扫,访问移动社区

论坛喇叭+ 发布

01-25 10:01
系统通知全站压缩包解压密码:www.wanmirbbs.com
01-25 10:01
01-25 10:01
查看: 1850|回复: 1
打印 上一主题 下一主题

[文本教程] Sqlite的五大理由!

[复制链接]
跳转到指定楼层
楼主
发表于 2017-11-18 07:54:14 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

马上注册,以游结友!

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
如果你还没听说,SQLite是一款能够实际运作在真实产品环境中的惊艳的数据库。在这篇文章中, 我会列出5大理由来解释为什么我认为你应该在2017年试试 SQLite。

简便管 理

你管理过一个Postgres数据库吗?为了确保数据库服务器得到恰当设置( 共享数据缓冲区,有效缓存大小,工作记忆,维持工作记忆,缓冲机制…)你需要明了相当多的事项。升 级也会是一个可怕的过程,你也许需要离线你的数据库,运行一个程序来阻止它升级,并希望等你重启时 它仍可以运行。更进一步说,你知道你的 postgres 数据库存储在哪吗?你可以指着一个地方说,「这就 是我的数据库吗」?

(现在,我们都知道在很多情况下只有 Postgres (或 MySQL, Oracle, SQL Server等)可以满足应用上的要求。这里我的目的并不是说SQLite另有规定。而是 我只想强调相比较于传统的数据库服务器,管理一个SQLite db数据库的不同点。
SQLite管理 起来非常简便——它是一个单一的文件(或者有时是一个文件 + 事务日志)。文件格式在主要的版本中 非常稳定,所以如果我在SQLite3.0.0版本上(2004年推出的版本)有数据库文件,我可以使用 SQLite 3.10.0版本读出它。如果我想把数据文件装在U盘中随身携带,我可以拷贝文件,或者目前更好的是我可 保存在我的dropbox文件夹。如果我每天晚上都要备份这些文件,我只需把数据库文件同步到S3。如果我 想共享我正与我同事合作的数据分析,我只需发送给他们这个数据库文件的一个我已准备好的副本。数据 库在一个单一的文件中,且保持稳定的格式是SQLite的一大特性。

而且, SQLite设置起来也很方便。 SQLite的功能可以用两种方式来管理:编译标志 和 编译指示语句(运行时 配置)。这里没有指明的配置文件,你只需把你想要的功能构建成库,然后在创建数据库连接时配置这些 运行时选项。

不断改善目前已坚若磐石的稳定性

SQLite是由几个真正的软件工程师大神主动开发。并以惊人的速度不断增加 高质量的新功能。就在前不久SQLite通过 json1拓展来支持JSON数据(获取更多关于在 Python上应用它 的文章,请点击这篇文章)。SQLite还发布了一个改进的全文检索的扩展版本,其中包括使用BM25算法的 结果排序。

除了增加新的功能,SQLite开发者也正在努力使库的使用更高效 。在3.8.11版本,发行说明包含这条宣传语:

SQLite如今的速度是 3.8.0版 本速度的两倍,是 3.3.9版本速度的3倍。
尽管有了这些变化和改进,SQLite鲜少出现 bug。 SQLite测试套件被广泛认为是行业内最佳之一,在开发者发现这个令人印象深刻的文件后,SQLite如何测 试的页面经常出现在HackerNews上。

可拓展性和可控性

我个人最喜欢的特性是它的可扩展性。因为SQLite是由你的应用程序插入的 ,它运行在相同的地址空间,可以代表你执行应用程序代码。无论是Python标准库SQLite驱动,pysqlite ,和替代驱动apsw提供的APIs来定义自定义的SQL函数,聚合函数和排序规则。apsw更进了一步,提供 APIs定义虚拟表和虚拟文件系统!

举一个实际的例子,假设在你的数据表中 有一列存储 URLs,你希望确定哪个是最常见的主机名——如果你正使用不同的数据库,你会被迫去写一 个复杂的正则表达式,一个字符串操作函数的组合,或把数据放入你的应用程序并在代码中进行运算。而 有了SQLite,你可以在Python中定义一个主机名的功能,然后使用它来创建一个简单的计数查询:


from urlparse import urlparse

def hostname(url):
    return urlparse(url).netloc

conn = sqlite3.connect('my-database.db')
conn.create_function('hostname', 1, hostname)  # name, num_params, func
1
2
3
4
5
6
7from urlparse import urlparse

def hostname (url):
    return urlparse(url).netloc

conn = sqlite3.connect('my-database.db')
conn.create_function('hostname', 1, hostname)  # name, num_params, func

SELECT hostname(mytable.url), COUNT (mytable.id) AS ct
FROM mytable
GROUP BY hostname(mytable.url)
ORDER BY ct DESC;
1
2
3
4
SELECT hostname (mytable.url), COUNT(mytable.id) AS ct
FROM mytable
GROUP BY hostname (mytable.url)
ORDER BY ct DESC;
您还可以创建聚合函数,它接受 0..n 值,并 生成一个单个输出值。例子可能是计算标准偏差、通过用一些方式处理值来产生字符串、或者做一些类型 的分类等等。

虚拟表,目前只受apsw支持,允许你在代码中定义一个表,然 后把它当作一个正常的SQL表来查询,即使后台的数据完全是动态的。举例来说,我写了一个简单的虚拟 表,可以允许你像查询SQL表一样来查询Redis.

你也可以写同名的函数,其 中函数返回0..n行结果。正则表达式搜索函数也许是个例子,它处理输入值和产生匹配令牌的行。我写了 一个库,sqlite vtfunc,它使得写这些类型的函数变得极其容易。

SQLite 的每个方面都可以被你的应用程序操作。

Lightning fast

SQLite运行起来很快。它在同一个机器上运行,所以在执行查询和读出 结果时没有网络管理费用。它在同一个地址空间运行,所以没有有线协议,串行化或需要通过UNIX套接字 通信 。SQLite可以在资源匮乏、要求高效率的无线设备上运行。SQLite也支持大量编制标志,允许你移 除不打算用的功能。

SQLite的速度弥补了他的最大的缺陷,就是数据库文件 锁定为写。正因为写数据的速度快到不可思议,只有当存在大量的并发写进程时,数据库的锁定才会成为 一个问题。

WAL ( Write-Ahead Logging  预写式日志记录 ) 模式

3.7.0版本的SQLite添加了一个新的日志记录方法,使用预写日志记录。这 本身不是什么真正值得兴奋的新闻,但这意味着对于 web应用(或任何并发机制)开发者来说,读进程和 写进程不再相互限制。或者换个方式来说,读和写可以发生同时。如果没有有 WAL 模式,为了写这个数 据库,写进程将要求独占访问权,在撰写完成前,这个数据库无法被访问。

下面是一个例子来图解两者的不同,假设我们有两种进程状态,写进程和读进程。写进程开始一个专有事 务(表示有撰写的意图)。接下来,读进程会开启一个事务,然后读进程尝试去发布一个筛选的状态:

Journal mode = “delete” (the default):

Writer: BEGIN EXCLUSIVE
Reader: BEGIN
Reader: SELECT * FROM foo; Error: database is locked
Journal mode = “wal”:

Writer: BEGIN EXCLUSIVE
Reader: BEGIN
Reader: SELECT * FROM foo; Returns table contents
然而,值得注意的 是,即使你不具有WAL模式,写通常发生在毫秒间。这是一个如此短的时间来让你注意到问题,如果你有 非常高的并发或有很长的事务要写。

额外的原因: BerkeleyDB

BerkeleyDB的SQLite的整合甚至可以给需要访问并发数据库的应 用程序开发者们提供更好的性能,因为BerkeleyDB不是锁定整个数据库,而是只需要锁定单个页面。这使 得BerkeleyDB在加载并发数据库时有更高的吞吐量,只要事务没有争夺同一页数据。BerkeleyDB还支持多 版本并发控制(MVCC),它允许读的操作继续发生在正在运作写的事务的数据页。

BerkeleyDB另一个好处是效率的提高。换句话说,BerkeleyDB可以使用更少 的系统资源和执行更少的系统调用。你可以在这份白皮书和简要技术概述中找到更多的细节。

BerkeleyDB的SQL接口是SQLite的一个插入式替换方式,并支持相同的APIs 和功能。BerkeleyDB提供了一些附加功能,比如复制(SQLite有备份实用工具,但我的理解是,它不如 BDB强大)、加密,当然还有包括BerkeleyDB自身所有的功能。

BerkeleyDB 使用起来的一大缺点是对配置值非常敏感,并且获取正确的页面大小、缓存大小等其他设置需要深厚的知 识。另一个缺点是授权许可——阅读更多关于BerkeleyDB的授权许可,可查看Oracle的授权页面。


法律声明:
1. 本站所有资源和素材来源于网络收集,如有侵权内容请联系站长删除处理!
2. 本站大部分下载资源收集于网络,版权归原作者所有,如有侵权请联系删除。
3. 本站提供的素材、源码、等等其他资源,都不包含技术服务支持!
4. 若因线路和服务器问题非本站所能控制范围的故障导致暂停服务期间造成的一切不便与损失,论坛不负任何责任。
5. 注册会员通过任何手段和方法针对论坛进行破坏,我们有权对其行为作出处理。并保留进一步追究其责任的权利。
收藏收藏 分享分享 分享淘帖 支持支持 反对反对
沙发
发表于 2018-6-2 14:29:07 | 只看该作者
报告!别开枪,我就是路过来打酱油的...
懒得打字嘛,点击右侧快捷回复 【乱回复纯数字纯字母将禁言】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

必备工具

地图查看分析转换三合一

目前地图转换 单纯的OB真彩地图转换编...号想必很多人都会, 也有很多工具

南宫地图编辑器v5.0

使用方法,放置传奇客户端DATA文件夹...

Tiles转换工具,支持支持255

支持255地图转换工具!

关于本站

玩传奇论坛 - 专业提供游戏素材、游戏工具、传奇单机、传奇服务端,致力于打造最精品的版本素材分享平台!

Archiver|小黑屋|玩传奇吉ICP备18002996号-1) |网站地图 

GMT+8, 2024-11-16 02:14 , Processed in 0.035415 second(s), 35 queries , Gzip On. 

 Powered by Discuz! X3.2

 © 2001-2013 Comsenz Inc.

返回顶部