首页 > 编程笔记 > python > python mongodb爬取58网站

python mongodb爬取58网站

时间:2022-05-08

本文章向大家介绍python mongodb爬取58网站，主要内容包括其使用实例、应用技巧、基本知识点总结和需要注意事项，具有一定的参考价值，需要的朋友可以参考一下。

__author__ = 'Lee'

from bs4 import BeautifulSoup
import requests
'''
用这个爬取58中二手的分栏

'''
start_url = 'http://bj.58.com/sale.shtml' #开始的页面
url_host = 'http://bj.58.com'

def get_channel_urls(url):
    wb_data = requests.get(url)
    soup = BeautifulSoup(wb_data.text,'lxml')
    links = soup.select('ul.ym-submnu > li > b > a')
    for link in links:
       page_url = url_host + link.get('href')
       print(page_url)

随机文章

巨头们关注的实时Web：发展与相关技术
碎片化 | 第四阶段-54-hibernate-spring整合流程-视频
OpenDaylight Lithium版本简单应用及流表操作指南
碎片化 | 第四阶段-55-OpenSessionInViewFilter组件配置解决session问题-视频
入门Webpack（上）
碎片化 | 第四阶段-56-ManyToOne和OneToMany映射关系-视频
基于网络流量的SDN最短路径转发应用
碎片化 | 第四阶段-57-hibernate二级缓存-视频
NoSQL篇 | NoSQL从小白到码神之 Redis篇
Neutron和ONOS集成实践
基于OpenDaylight和OVSDB搭建VxLAN网络
史上最强----机器学习经典总结---入门必读
SDNLAB群分享（四）：利用ODL下发流表创建VxLAN网络
Neutron集成ONOS源码分析

本站知识点必读

JavaScript 教程
JavaScript 编辑工具
JavaScript 与HTML
JavaScript 与Java
JavaScript 数据结构
JavaScript 基本数据类型
JavaScript 特殊数据类型
JavaScript 运算符
JavaScript typeof 运算符
JavaScript 表达式
JavaScript 类型转换
JavaScript 基本语法
JavaScript 注释
Javascript 基本处理流程
Javascript 选择结构
Javascript if 语句
Javascript if 语句的嵌套
Javascript switch 语句
Javascript 循环结构
Javascript 循环结构实例
Javascript 跳转语句
Javascript 控制语句总结
Javascript 函数介绍
Javascript 函数的定义
Javascript 函数调用
Javascript 几种特殊的函数
JavaScript 内置函数简介
Javascript eval() 函数
Javascript isFinite() 函数
Javascript isNaN() 函数
parseInt() 与 parseFloat()
escape() 与 unescape()
Javascript 字符串介绍
Javascript length属性
javascript 字符串函数
Javascript 日期对象简介
Javascript 日期对象用途
Date 对象属性和方法
Javascript 数组是什么
Javascript 创建数组
Javascript 数组赋值与取值
Javascript 数组属性和方法