Python调用MongoDB使用心得

2011-09-07 19:33

Python调用MongoDB使用心得

by nosqlfan

at 2011-09-07 11:33:11

original http://item.feedsky.com/~feedsky/nosqlfan/~8149226/555157232/6253001/1/item.html

本文是一个Python 使用MongoDB的简单教程,将使用pymongo对MongoDB进行的各种操作进行了简单的汇总,NoSQLFan进行了简单整理,使用Python的同学可以看一看。

下载相应平台的版本,解压即可。为方便使用,将bin路径添加到系统path环境变量里。其中mongod是服务器,mongo是客户shell,然后创建数据文件目录:在c盘下创建data文件夹,里面创建db文件夹。

基本使用:

安装对应语言的Driver,Python 安装 pymongo

$ easy_install pymongo

使用方法总结,摘自官方教程

创建连接

>>> import pymongo
>>> connection=pymongo.Connection('localhost',27017)

切换数据库

>>> db = connection.test_database

获取collection

>>> collection = db.test_collection

db和collection都是延时创建的,在添加Document时才真正创建

文档添加,_id自动创建

>>> import datetime
>>> post = {"author": "Mike",
...         "text": "My first blog post!",
...         "tags": ["mongodb", "python", "pymongo"],
...         "date": datetime.datetime.utcnow()}
>>> posts = db.posts
>>> posts.insert(post)
ObjectId('...')

批量插入

>>> new_posts = [{"author": "Mike",
...               "text": "Another post!",
...               "tags": ["bulk", "insert"],
...               "date": datetime.datetime(2009, 11, 12, 11, 14)},
...              {"author": "Eliot",
...               "title": "MongoDB is fun",
...               "text": "and pretty easy too!",
...               "date": datetime.datetime(2009, 11, 10, 10, 45)}]
>>> posts.insert(new_posts)
[ObjectId('...'), ObjectId('...')]

获取所有collection(相当于SQL的show tables)

>>> db.collection_names()
[u'posts', u'system.indexes']

获取单个文档

>>> posts.find_one()
{u'date': datetime.datetime(...), u'text': u'My first blog post!', u'_id': ObjectId('...'), u'author': u'Mike', u'tags': [u'mongodb', u'python', u'pymongo']}

查询多个文档

>> for post in posts.find():
...   post
...
{u'date': datetime.datetime(...), u'text': u'My first blog post!', u'_id': ObjectId('...'), u'author': u'Mike', u'tags': [u'mongodb', u'python', u'pymongo']}
{u'date': datetime.datetime(2009, 11, 12, 11, 14), u'text': u'Another post!', u'_id': ObjectId('...'), u'author': u'Mike', u'tags': [u'bulk', u'insert']}
{u'date': datetime.datetime(2009, 11, 10, 10, 45), u'text': u'and pretty easy too!', u'_id': ObjectId('...'), u'author': u'Eliot', u'title': u'MongoDB is fun'}

加条件的查询

>>> posts.find_one({"author": "Mike"})

高级查询

>>> posts.find({"date": {"$lt": d}}).sort("author")

统计数量

>>> posts.count()
3

加索引

>>> from pymongo import ASCENDING, DESCENDING
>>> posts.create_index([("date", DESCENDING), ("author", ASCENDING)])
u'date_-1_author_1'

查看查询语句的性能

>>> posts.find({"date": {"$lt": d}}).sort("author").explain()["cursor"]
u'BtreeCursor date_-1_author_1'
>>> posts.find({"date": {"$lt": d}}).sort("author").explain()["nscanned"]
2

附自己总结的一点小心得,仅供参考

缺点

  • 不是全盘取代传统数据库(NoSQLFan:是否能取代需要看应用场景)
  • 不支持复杂事务(NoSQLFan:MongoDB只支持对单个文档的原子操作)
  • 文档中的整个树,不易搜索,4MB限制?(NoSQLFan:1.8版本已经修改为16M)

特点(NoSQLFan:作者在这里列举的很多只是一些表层的特点):

  • 文档型数据库,表结构可以内嵌
  • 没有模式,避免空字段开销(Schema Free)
  • 分布式支持
  • 查询支持正则
  • 动态扩展架构
  • 32位的版本最多只能存储2.5GB的数据(NoSQLFan:最大文件尺寸为2G,生产环境推荐64位)

名词对应

  • 一个数据项叫做 Document(NoSQLFan:对应MySQL中的单条记录)
  • 一个文档嵌入另一个文档(comment 嵌入 post)叫做 Embed
  • 储存一系列文档的地方叫做 Collections(NoSQLFan:对应MySQL中的表)
  • 表间关联,叫做 Reference

来源链接已经404了~暂无法附来源。

相关文章:
写给Python程序员的MongoDB介绍
又一篇给Python程序员的MongoDB教程
Mongodb Mapreduce 初窥
MongoDB 1.4.3 发布
MongoDB 1.4.2 (stable) Released
无觅