在Java代码中解析html,获取其中的值方法
时间:2019-04-15
本文章向大家介绍在Java代码中解析html,获取其中的值方法,主要包括在Java代码中解析html,获取其中的值方法使用实例、应用技巧、基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
有时我们获取到了页面需要在Java代码中进行解析,获取html中的数据,Jsoup是一个很方便的工具。
一、什么是Jsoup?
官网网站:http://jsoup.org/
可在官网下载对应的jar
通俗的将Jsoup就是一个解析网页的东西
二、示例
1、页面,通过查询获取到了一些数据:
2、源码,这是一个table,class="list",通过这些来唯一标识它
3、代码,将html以String的形式传进来,使用Jsoup进行解析:
import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; public calss MyTest { public static void demo1(String htmltest) { String html = htmltest; Document doc = Jsoup.parse(html); Elements rows = doc.select("table[class=list]").get(0).select("tr"); if (rows.size() == 1) { System.out.println("没有结果"); }else { System.out.println("--------------------------- 查询结果 ---------------------------"); Element row = rows.get(1); System.out.println("暂存单号:" + row.select("td").get(0).text()); System.out.println("投保单号:" + row.select("td").get(1).text()); System.out.println("保单号:" + row.select("td").get(2).text()); System.out.println("投保人:" + row.select("td").get(3).text()); System.out.println("被保险人:" + row.select("td").get(4).text()); System.out.println("号牌号码:" + row.select("td").get(5).text()); System.out.println("车架号:" + row.select("td").get(6).text()); System.out.println("录单人:" + row.select("td").get(7).text()); System.out.println("投保日期:" + row.select("td").get(8).text()); System.out.println("暂存单状态:" + row.select("td").get(9).text()); System.out.println("状态:" + row.select("td").get(10).text()); System.out.println("-----------------------------------------------------------------"); } } }
4、输出结果:
更多的使用方法可以去详细阅读Jsoup的API
以上这篇在Java代码中解析html,获取其中的值方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
- HTML 教程
- HTML 简介
- html div 标签介绍
- html span 标签介绍
- html a 超链接标签
- HTML Br换行标签介绍
- HTML P段落标签介绍
- HTML br与p标签区别
- Html H 标题标签
- html px em pt长度单位
- HTML form 标签
- HTML radio 单选框
- HTML B 加粗标签
- HTML strong加粗粗体标签
- HTML em 强调标签
- HTML i 斜体标签
- HTML u下划线标签
- HTML s 删除线标签
- Html img 图片标签
- Html上标注sup与下标注sub标签
- HTML nobr 禁止换行标签
- HTML hr 水平线标签
- HTML label 标签
- HTML input 标签
- HTML textarea 标签
- HTML select下拉列表标签
- HTML checkbox 多选框
- HTML font color 标签
- HTML iframe 框架标签
- HTML Table 表格
- HTML dl dt dd 标签
- HTML ol li有序列表标签
- HTML ul li 无序列表标签
- HTML 注释
- CSS 教程
- CSS 简介
- CSS 语法
- CSS Id 和 Class选择器
- CSS 样式的创建
- CSS background 背景介绍
- CSS 文本样式
- CSS font 字体
- CSS A 链接
- CSS ul ol列表样式
- CSS TABLE 样式
- CSS 框模型
- CSS border 边框
- CSS Outlines 轮廓
- CSS 外边距 Margin
- CSS Padding 内边距
- CSS 分组和嵌套选择器
- CSS 尺寸 (Dimension)
- CSS Display 属性
- CSS Position 定位
- CSS Float 浮动
- CSS 水平对齐(Horizontal Align)
- CSS 组合选择符
- CSS 伪类
- CSS 伪元素
- CSS 导航栏
- CSS 下拉菜单
- CSS 图片廊
- CSS 图像透明/不透明
- CSS sprite 图像拼合技术
- CSS 媒体类型
- CSS 属性选择器
- CSS 实例
- Android实现通用筛选栏
- Android实现关机后数据不会丢失问题
- Canvas 进阶(五)实现图片滤镜效果
- 将IP地址字符串分割成数组
- android监听器实例代码
- (火狐)Selenium WebDriver测试 NotADirectoryError: [WinError 267] 目录名称无效。
- 浅析Android高斯模糊实现方案
- Android 自定义验证码输入框的实例代码(支持粘贴连续性)
- _countof和sizeof
- Flutter适配深色模式的方法(DarkMode)
- RecyclerView+SnapHelper实现无限循环筛选控件
- 详解Android 8.1.0 Service 中 弹出 Dialog的方法
- 短信收发类无错版JustinIO.cs
- Android快速实现无预览拍照功能
- RecyclerView+PagerSnapHelper实现抖音首页翻页的Viewpager效果