java 读取网页内容的实例详解
时间:2019-04-07
本文章向大家介绍java 读取网页内容的实例详解,主要包括java 读取网页内容的实例详解使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
java 读取网页内容的实例详解
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.net.*; public class loadurl { public static void main(String args[]) { String a = null; try { String url = "(这里替换成任意网页的网址)"; BufferedReader in = new BufferedReader(new InputStreamReader( new URL(url).openConnection().getInputStream(), "GB2312"));//GB2312可以根据需要替换成要读取网页的编码 while ((a = in.readLine()) != null) { System.out.println(a); } } catch (MalformedURLException e) { } catch (IOException e) { } } }
以上的代码程序是把一个网页的源代码,包括HTML与XML读取到JAVA的一个字符串String a中。
Java中字符串String类型的空间很大,基本能够容纳一个网页源代码的内容。
从网页读取内容同样是对于输入流的操作。
不同于标准的输入源,在:
BufferedReader in = new BufferedReader(new InputStreamReader(...))
InputStreamReader中输入System.in就可以。
此处的输入源应该为:
(new URL(url).openConnection().getInputStream(), "GB2312")
之后的操作与处理与载入标准输入源完全相同。
BufferedReader在JAVA中要求必须捕获IOException异常,而使用URL源除了必须引入java.net.*包之外,还必须捕获MalformedURLException异常。
如有疑问请留言或者到本站社区交流讨论,感谢阅读,希望能帮助到大家,谢谢大家对本站的支持!
- 看到那个Edward 了吗?对!其实它是个Python库
- (35) 泛型 (上) - 基本概念和原理 / 计算机程序的思维逻辑
- 将linux下的rm命令改造成mv到指定的目录下
- (36) 泛型 (中) - 解析通配符 / 计算机程序的思维逻辑
- Python优化第一步: 性能分析实践
- Python云计算框架:OpenStack源码分析之RabbitMQ(二)
- 编程获得CPU的主频
- Python多进程并行编程实践:以multiprocessing模块为例
- 由函数clock想到的
- (34) 随机 / 计算机程序的思维逻辑
- 创建和使用Windows静态链接库
- (37) 泛型 (下) - 细节和局限性 / 计算机程序的思维逻辑
- 快速失败Vs安全失败(Java迭代器附示例)
- Flask-SocketIO 文档译文
- java教程
- Java快速入门
- Java 开发环境配置
- Java基本语法
- Java 对象和类
- Java 基本数据类型
- Java 变量类型
- Java 修饰符
- Java 运算符
- Java 循环结构
- Java 分支结构
- Java Number类
- Java Character类
- Java String类
- Java StringBuffer和StringBuilder类
- Java 数组
- Java 日期时间
- Java 正则表达式
- Java 方法
- Java 流(Stream)、文件(File)和IO
- Java 异常处理
- Java 继承
- Java 重写(Override)与重载(Overload)
- Java 多态
- Java 抽象类
- Java 封装
- Java 接口
- Java 包(package)
- Java 数据结构
- Java 集合框架
- Java 泛型
- Java 序列化
- Java 网络编程
- Java 发送邮件
- Java 多线程编程
- Java Applet基础
- Java 文档注释
- 白话k8s-Pod的组成
- Jaba_Web--JDBC 修改记录操作模板
- h5逐步实现 <<canvas系统>>
- 递归与N皇后问题
- Jaba_Web--JDBC 查询记录操作模板
- Linux下如何删除指定路径下所有的__pycache__文件夹?
- js逐步实现原生flex系统
- POJ 2054 Color a Tree解题报告
- Jaba_Web--JDBC 删除记录操作模板
- POJ 1789 Truck History 最小生成树
- Vector shrink 请求容器降低其容量和size匹配 shrink_to_fit();
- Codeforces Round #677 (Div. 3)
- Java_Web--JDBC 增加记录操作模板
- js逐步实现原生控制系统
- STL 训练 POJ - 1862 Stripies