侯体宗的博客
  • 首页
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

Python爬取数据并写入MySQL数据库的实例

Python  /  管理员 发布于 7年前   415

首先我们来爬取 http://html-color-codes.info/color-names/ 的一些数据。

按 F12 或 ctrl+u 审查元素,结果如下:

结构很清晰简单,我们就是要爬 tr 标签里面的 style 和 tr 下几个并列的 td 标签,下面是爬取的代码:

#!/usr/bin/env python# coding=utf-8import requestsfrom bs4 import BeautifulSoupimport MySQLdbprint('连接到mysql服务器...')db = MySQLdb.connect("localhost","hp","Hp12345.","TESTDB")print('连接上了!')cursor = db.cursor()cursor.execute("DROP TABLE IF EXISTS COLOR")sql = """CREATE TABLE COLOR (  Color CHAR(20) NOT NULL,  Value CHAR(10),  Style CHAR(50) )"""cursor.execute(sql)hdrs = {'User-Agent':'Mozilla/5.0 (X11; Fedora; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko)'}url = "http://html-color-codes.info/color-names/"r = requests.get(url, headers = hdrs)soup = BeautifulSoup(r.content.decode('gbk', 'ignore'), 'lxml')trs = soup.find_all('tr') # 获取全部tr标签成为一个列表for tr in trs:    # 遍历列表里所有的tr标签单项 style = tr.get('style') # 获取每个tr标签里的属性style tds = tr.find_all('td') # 将每个tr标签下的td标签获取为列表 td = [x for x in tds] # 获取的列表 name = td[1].text.strip()  # 直接从列表里取值 hex = td[2].text.strip() # print u'颜色: ' + name + u'颜色值: '+ hex + u'背景色样式: ' + style # print 'color: ' + name + '\tvalue: '+ hex + '\tstyle: ' + style insert_color = ("INSERT INTO COLOR(Color,Value,Style)" "VALUES(%s,%s,%s)") data_color = (name, hex, style) cursor.execute(insert_color, data_color) db.commit() # print '******完成此条插入!' print '爬取数据并插入mysql数据库完成...'

运行结果:

$ mysql -u hp -pEnter password: Welcome to the MySQL monitor. Commands end with ; or \g.Your MySQL connection id is 28Server version: 5.7.17 MySQL Community Server (GPL)Copyright (c) 2000, 2011, Oracle and/or its affiliates. All rights reserved.Oracle is a registered trademark of Oracle Corporation and/or itsaffiliates. Other names may be trademarks of their respectiveowners.Type 'help;' or '\h' for help. Type '\c' to clear the current input statement.mysql> use TESTDBReading table information for completion of table and column namesYou can turn off this feature to get a quicker startup with -ADatabase changedmysql> select * from COLOR;+----------------------+--------+----------------------------------------+| Color    | Value | Style         |+----------------------+--------+----------------------------------------+| IndianRed   | CD5C5C | background-color:indianred;   || LightCoral   | F08080 | background-color:lightcoral;   || Salmon    | FA8072 | background-color:salmon;    || DarkSalmon   | E9967A | background-color:darksalmon;   || LightSalmon   | FFA07A | background-color:lightsalmon;   || Crimson    | DC143C | background-color:crimson;    || Red     | FF0000 | background-color:red;     || FireBrick   | B22222 | background-color:fireBrick;   || DarkRed    | 8B0000 | background-color:darkred;    || Pink     | FFC0CB | background-color:pink;     || LightPink   | FFB6C1 | background-color:lightpink;   || HotPink    | FF69B4 | background-color:hotpink;    || DeepPink    | FF1493 | background-color:deeppink;    |...| AntiqueWhite   | FAEBD7 | background-color:antiquewhite;   || Linen    | FAF0E6 | background-color:linen;    || LavenderBlush  | FFF0F5 | background-color:lavenderblush;  || MistyRose   | FFE4E1 | background-color:mistyrose;   || Gainsboro   | DCDCDC | background-color:gainsboro;   || LightGrey   | D3D3D3 | background-color:lightgrey;   || Silver    | C0C0C0 | background-color:silver;    || DarkGray    | A9A9A9 | background-color:darkgray;    || Gray     | 808080 | background-color:gray;     || DimGray    | 696969 | background-color:dimgray;    || LightSlateGray  | 778899 | background-color:lightslategray;  || SlateGray   | 708090 | background-color:slategray;   || DarkSlateGray  | 2F4F4F | background-color:darkslategray;  || Black    | 000000 | background-color:black;    |+----------------------+--------+----------------------------------------+143 rows in set (0.00 sec)

以上这篇Python爬取数据并写入MySQL数据库的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持。


  • 上一条:
    详解Python下ftp上传文件linux服务器
    下一条:
    python实现黑客字幕雨效果
  • 昵称:

    邮箱:

    1条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 在python语言中Flask框架的学习及简单功能示例(0个评论)
    • 在Python语言中实现GUI全屏倒计时代码示例(0个评论)
    • Python + zipfile库实现zip文件解压自动化脚本示例(0个评论)
    • python爬虫BeautifulSoup快速抓取网站图片(1个评论)
    • vscode 配置 python3开发环境的方法(0个评论)
    • 近期文章
    • 在go语言中实现字符串可逆性压缩及解压缩功能(0个评论)
    • 使用go + gin + jwt + qrcode实现网站生成登录二维码在app中扫码登录功能(0个评论)
    • 在windows10中升级go版本至1.24后LiteIDE的Ctrl+左击无法跳转问题解决方案(0个评论)
    • 智能合约Solidity学习CryptoZombie第四课:僵尸作战系统(0个评论)
    • 智能合约Solidity学习CryptoZombie第三课:组建僵尸军队(高级Solidity理论)(0个评论)
    • 智能合约Solidity学习CryptoZombie第二课:让你的僵尸猎食(0个评论)
    • 智能合约Solidity学习CryptoZombie第一课:生成一只你的僵尸(0个评论)
    • 在go中实现一个常用的先进先出的缓存淘汰算法示例代码(0个评论)
    • 在go+gin中使用"github.com/skip2/go-qrcode"实现url转二维码功能(0个评论)
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2016-11
    • 2018-04
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2022-01
    • 2023-07
    • 2023-10
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客