AI导航网

技术频道

公众号推荐

微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦！

scrapy自定义pipeline类将采集数据保存到mongodb的代码

时间：2022-09-01分类：MongoDB作者：编程之家原文地址

把写内容过程经常用的一些内容段做个珍藏，下面内容段是关于scrapy自定义pipeline类将采集数据保存到mongodb的内容，应该能对各位有较大用处。
# Standard Python library imports

# 3rd party modules
import pymongo

from scrapy import log
from scrapy.conf import settings
from scrapy.exceptions import DropItem

class MongoDBPipeline(object):
def __init__(self):
self.server = settings['MONGODB_SERVER']
self.port = settings['MONGODB_PORT']
self.db = settings['MONGODB_DB']
self.col = settings['MONGODB_COLLECTION']
connection = pymongo.Connection(self.server, self.port)
db = connection[self.db]
self.collection = db[self.col]

def process_item(self, item, spider):
err_msg = ''
for field, data in item.items():
if not data:
err_msg += 'Missing %s of poem from %sn' % (field, item['url'])
if err_msg:
raise DropItem(err_msg)
self.collection.insert(dict(item))
log.msg('Item written to MongoDB database %s/%s' % (self.db, self.col),
level=log.DEBUG, spider=spider)
return item

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 [email protected] 举报，一经查实，本站将立刻删除。

相关推荐

【主流技术】MongoTemplate 与 Spring Boot 项目集成(附CURD技巧)

MongoTemplate 是Spring Data MongoDB 中的一个核心类，为 Spring 与 MongoDB 数据库的交互提供了丰富的功能集。

MongoTemplate 提供了创建、更新、删除和查询 MongoDB 文档的便利操作，并提供了编...

作者：CodeBlogMan 时间：2024-10-09

【解决方案】项目重构之如何使用 MySQL 替换原来的 MongoDB

笔者今天要分享的是一个项目重构过程中如何将数据库选型由原来的 MongoDB 改为 MySQL 的思考，涉及到业务当前的痛点、选型分析、解决的核心思路，最后会给出简单的 demo。

作者：CodeBlogMan 时间：2024-10-09

mongodb/mongoTemplate.upsert批量插入更新数据的实现

mongodb/mongoTemplate.upsert批量插入更新数据的实现

作者：热爱生活的猴子时间：2022-12-19

Mongodb:安装教程

进入官网下载官网安装点击next勾选同意，点击next点击customer点击修改安装路径个人修改的路径。点击next点击next取消勾选，点击next点击install安装进行中安装完成之后配置在data目录新建db目录在log目录下新建mong...

作者：HaanLen 时间：2022-12-19

MongoDB实验——数据库基本操作头歌

头歌 MongoDB实验——数据库基本操作

作者：海浪～& 时间：2022-12-19

mongodb期末考试总结

期末考试复习总结

作者：弗敢成也.z 时间：2022-12-19

Studio 3T使用教程,本人详细介绍连接Mongodb过程

4：点击 Manually configure my connection settings，然后next。

作者：晨曦之泪时间：2022-12-19

MongoDB的安装(详细教程)

MongoDB 是一个基于分布式文件存储的数据库，主要用于为 web 应用提供可扩展的高性能数据存储解决方案。以下内容是如何在 windows 下安装 MongoDB 的教程，主要参照MongoDB - 学习教程如果想要在 Linux 下安装 Mongo...

作者：多加点辣也没关系时间：2022-12-06

Mongodb实验二——分片集群搭建

mongodb分片式集群搭建本实验在一台电脑上完成，本人自己方法与标准方法略有差异，大家仁者见仁，同时可能你按照一样的步骤下来，会出现各种各样的错误，但希望大家懂得学会去查看日志，查看代码，懂得如何解决问题，...

作者：中意灬时间：2022-11-29

Node.js | Express+MongoDB 实现简易用户管理系统三登录验证之Cookie&Session

在前面的几节中我们已经创建并优化好了简易用户管理系统的项目结构，也对Cookie-Session登录验证的工作原理做了讲解，接下来我们将继续补充这个系统的功能，这一节我们将实战运用来实现这个系统的登录验证功能。

作者：海底烧烤店ai 时间：2022-11-21