php数据采集(1)
时间:2019-01-14
本文章向大家介绍php数据采集(1),主要包括php数据采集(1)使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
新建单独脚本,如下,浏览器运行即可
页面内容如下,
https://so.gushiwen.org/authors/authorvsw_a7900666497fA1.aspx
一个网页,有多篇文章,
另一篇博客,会介绍 当一个网页只有一篇文章的情况
<?php
header('Content-type:text/html;charset=utf-8');
//连接数据库
$link = @mysql_connect('localhost','root','root');
//判断连接是否成功
if(mysql_errno()){
exit('数据库连接失败'.mysql_error());
}
//选择数据库
mysql_select_db('ceshidaoru');
// 我要遍历一个文件夹
$jid = substr(__FILE__,strrpos(__FILE__,'\\')+1,strrpos(__FILE__,'.')-strrpos(__FILE__,'\\')-1);
showDir("E:/my/20190110/xinqiji");
function showDir( $filedir ){
if(is_dir($filedir)){
//打开目录
$dir = @ dir($filedir);
while (($file = $dir->read())!==false){
if(is_dir($filedir."/".$file) AND ($file!=".") AND ($file!="..")) {
showDir($filedir."/".$file);
} else {
if ($file != "." and $file != ".."){
getDBData($filedir.'/'.$file,$file);
echo $filedir.'/'.$file.'<br>';
//echo $file;
}
}
}
$dir->close();
}else{
getDBData($filedir);
echo $filedir;
}
}
function getDBData($filename,$file) //file指文件名100000.HTML
{
preg_match('/(\d{0,20})\.aspx/',$file,$ids);
$urls=file_get_contents($filename);
// 获取一首诗词
preg_match_all('/<p><a style=([\s\S]*?)<div class="tool">/',$urls,$match);
foreach($match[1] as $val)
{
// 获取标题
preg_match('/target="_blank"><b>([\s\S]*?)<\/b>/',$val,$title);
preg_match('/<div class="contson" id="[\s\S]*?">([\s\S]*?)<\/div>/',$val,$content);
// 插入数据库
$sql2="insert into `caiji`(title,content) values('$title[1]','$content[1]')";
$res = mysql_query($sql2);
}
}
?>
- Andrew Ng机器学习课程笔记--week9(上)(异常检测&推荐系统)
- python程序员开发必备的5大工具,你用过几个?
- Andrew Ng机器学习课程笔记--week8(K-means&PCA)
- Andrew Ng机器学习课程笔记--week7(SVM)
- Pytorch windows10安装教程
- Udacity并行计算课程笔记-The GPU Programming Model
- DeepLearning.ai学习笔记(二)改善深层神经网络:超参数调试、正则化以及优化--Week2优化算法
- DeepLearning.ai学习笔记(二)改善深层神经网络:超参数调试、正则化以及优化--Week1深度学习的实用层面
- 通俗理解决策树中的熵&条件熵&信息增益
- KNN实现手写数字识别
- softmax分类算法原理(用python实现)
- DeepLearning.ai学习笔记(一)神经网络和深度学习--Week4深层神经网络
- 博客园自定义皮肤扁平化设计
- DeepLearning.ai学习笔记(四)卷积神经网络 -- week3 目标检测
- php概述
- php教程
- php环境搭建
- PHP书写格式
- php变量
- php常量
- PHP注释
- php数组
- php字符串 string
- PHP整型 integer
- PHP浮点型 float
- php布尔型
- php数据类型之数组
- php数据类型之对象
- php数据类型之null
- php数据类型之间的转换
- php运算符
- php表达式
- PHP循环控制
- PHP流程控制
- php函数
- php全局变量
- PHP魔术变量
- php命名空间
- php 日期
- PHP包含文件
- php文件
- PHP 文件上传
- php Cookies
- php Sessions
- php email
- php安全email
- php错误处理
- PHP异常处理
- php过滤器
- PHP 高级过滤器
- php json
- php 表单
- PHP MySQL 简介
- PHP 连接 MySQL
- php创建数据库
- php 创建表
- php mysq 插入数据
- PHP MySQL 插入多条数据
- PHP MySQL 预处理语句
- php mysql 读取数据
- php mysql where
- PHP MySQL Order By
- PHP MySQL Update
- PHP MySQL Delete
- php ODBC
- 视频监控系统视频上云解决方案EasyCVR集成海康EHome私有协议系列——设备录像回看说明
- 视频监控系统视频上云解决方案EasyCVR集成海康EHome私有协议系列——报警模块说明
- three.js 制作一个三维的推箱子游戏
- IP摄像头RTSP协议网页无插件直播视频平台EasyNVR如何在直播或录像中添加定制化音频?
- three.js之初探骨骼动画
- three.js 自制骨骼动画(一)
- vue 人脸识别 demo
- 最完整的Explain总结,妈妈再也不担心我的SQL优化了
- three.js 自制骨骼动画(二)
- 记一次keepalived和VIP导致的故障
- three.js 着色器材质之初识着色器
- Python爬虫获取豆瓣电影并写入excel
- 教你用Python自动发送和收取邮件的方法
- Python爬虫 爬取糗事百科段子实例分享
- 用Python做一个游戏辅助脚本,完整编程思路分享!