微信公众号搜"智元新知"关注
微信扫一扫可直接关注哦!

pytho 玩转Mysql

 

 

小予教你 用python 玩转MysqL

爬虫采集下来的数据除了存储在文本文件、excel之外,还可以存储在数据集,如:MysqL,redis,mongodb等,今天辰哥就来教大家如何使用Python连接MysqL,并结合爬虫为大家讲解。

前提这里认大家已经安装好MysqL

01 MysqL简介

MysqL是关系型数据库支持大型的数据库,可以处理拥有上千万条记录的大型数据库。通过爬虫采集的数据集存储到MysqL后,可以借助MysqL的关联查询将相关的数据一步取出。具体的作用这里就不赘述了,下面开始进入实际操作。

1.安装pyMysqL

通过下面这个命令进行安装

pip install pyMysqL

pyMysqL库:python3链接MysqL

备注:

ps:MysqLdb只适用于python2.x

python3不支持MysqLdb,取而代之的是pyMysqL

运行会报:ImportError:No module named 'MysqLdb'

2.python连接MysqL

import pyMysqL as pmq

localhost是本机IP,这里用localhost表示是当前本机,否则将localhost改为对应的数据库ip。

root是数据库用户名,123456是数据库密码,python_chenge是数据库名。

图上的数据库python_chenge已经建立好(建好之后,才能用上面代码去连接),建好之后,当前是没有表的,现在开始用Python进行建表,插入、查询修改删除等操作(结合爬虫去讲解

02 建表

在存储之前,先通过python创建表,字段有四个(一个主键+电影名称链接,评分

# 创建 movie 表

创建表movie,字段分别为(id ,title ,url ,rate ),CHaraCTER SET utf8 COLLATE utf8_general_ci是字符串编码设置为utf8格式

id是主键primary key,int类型,AUTO_INCREMENT自增,非空not null

title,url 是字符串类型varchar(100),同样非空

评分rate 是带小数的数字,所以是float,同样非空

03 插入数据

爬虫已经采集到数据,python已经建好表,接着可以将采集的数据插入到数据库这里介绍两种方式

### 插入数据

id是自增的,所以不需要在传值进去。

定义好插入数据库方法后,开始往数据库进行存储

for i in json_data['subjects']:

04 查询

1.查询所有

查询表中所有数据

# 查询

2.查询指定的数据

比如查询标题为:唐人街3这一条数据的所有字段

#查询单条

05 更新修改

更新数据,还是以上面:唐人街3为例,id为7,将唐人街3评分从5.5改为6

### 更新

同时看一下数据库

06 删除

同样还是以唐人街为例,其id为7,删除的话咱们可以更新id去删除

def delete(Id):

删除之后,就没有第7条数据了,说明删除成功

版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。

相关推荐