在Java代码中解析html,获取其中的值方法
时间:2019-04-15
本文章向大家介绍在Java代码中解析html,获取其中的值方法,主要包括在Java代码中解析html,获取其中的值方法使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
有时我们获取到了页面需要在Java代码中进行解析,获取html中的数据,Jsoup是一个很方便的工具。
一、什么是Jsoup?
官网网站:http://jsoup.org/
可在官网下载对应的jar
通俗的将Jsoup就是一个解析网页的东西
二、示例
1、页面,通过查询获取到了一些数据:
2、源码,这是一个table,class="list",通过这些来唯一标识它
3、代码,将html以String的形式传进来,使用Jsoup进行解析:
import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public calss MyTest { public static void demo1(String htmltest) { String html = htmltest; Document doc = Jsoup.parse(html); Elements rows = doc.select("table[class=list]").get(0).select("tr"); if (rows.size() == 1) { System.out.println("没有结果"); }else { System.out.println("--------------------------- 查询结果 ---------------------------"); Element row = rows.get(1); System.out.println("暂存单号:" + row.select("td").get(0).text()); System.out.println("投保单号:" + row.select("td").get(1).text()); System.out.println("保单号:" + row.select("td").get(2).text()); System.out.println("投保人:" + row.select("td").get(3).text()); System.out.println("被保险人:" + row.select("td").get(4).text()); System.out.println("号牌号码:" + row.select("td").get(5).text()); System.out.println("车架号:" + row.select("td").get(6).text()); System.out.println("录单人:" + row.select("td").get(7).text()); System.out.println("投保日期:" + row.select("td").get(8).text()); System.out.println("暂存单状态:" + row.select("td").get(9).text()); System.out.println("状态:" + row.select("td").get(10).text()); System.out.println("-----------------------------------------------------------------"); } } }
4、输出结果:
更多的使用方法可以去详细阅读Jsoup的API
以上这篇在Java代码中解析html,获取其中的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
- HTML 教程
- HTML 简介
- html div 标签介绍
- html span 标签介绍
- html a 超链接标签
- HTML Br换行标签介绍
- HTML P段落标签介绍
- HTML br与p标签区别
- Html H 标题标签
- html px em pt长度单位
- HTML form 标签
- HTML radio 单选框
- HTML B 加粗标签
- HTML strong加粗粗体标签
- HTML em 强调标签
- HTML i 斜体标签
- HTML u下划线标签
- HTML s 删除线标签
- Html img 图片标签
- Html上标注sup与下标注sub标签
- HTML nobr 禁止换行标签
- HTML hr 水平线标签
- HTML label 标签
- HTML input 标签
- HTML textarea 标签
- HTML select下拉列表标签
- HTML checkbox 多选框
- HTML font color 标签
- HTML iframe 框架标签
- HTML Table 表格
- HTML dl dt dd 标签
- HTML ol li有序列表标签
- HTML ul li 无序列表标签
- HTML 注释
- CSS 教程
- CSS 简介
- CSS 语法
- CSS Id 和 Class选择器
- CSS 样式的创建
- CSS background 背景介绍
- CSS 文本样式
- CSS font 字体
- CSS A 链接
- CSS ul ol列表样式
- CSS TABLE 样式
- CSS 框模型
- CSS border 边框
- CSS Outlines 轮廓
- CSS 外边距 Margin
- CSS Padding 内边距
- CSS 分组和嵌套选择器
- CSS 尺寸 (Dimension)
- CSS Display 属性
- CSS Position 定位
- CSS Float 浮动
- CSS 水平对齐(Horizontal Align)
- CSS 组合选择符
- CSS 伪类
- CSS 伪元素
- CSS 导航栏
- CSS 下拉菜单
- CSS 图片廊
- CSS 图像透明/不透明
- CSS sprite 图像拼合技术
- CSS 媒体类型
- CSS 属性选择器
- CSS 实例
- 200行Java代码如何实现依赖注入框架详解
- react router4+redux实现路由权限控制的方法
- pandas数据处理基础之筛选指定行或者指定列的数据
- 对Python字符串中的换行符和制表符介绍
- 浅谈go语言renderer包代码分析
- Linux入侵常用命令之防黑客示例代码
- python操作xlsx文件的包openpyxl实例
- Android Internet应用实现获取天气预报的示例代码
- Angular Renderer (渲染器)的具体使用
- PHP 布尔值的自增与自减的实现方法
- Struts2学习教程之自定义类型转换器的方法
- python实现数据导出到excel的示例--普通格式
- Webpack中publicPath路径问题详解
- Python基于opencv的图像压缩算法实例分析
- 本地HTTPS环境搭建的完整步骤记录