Java8新特性第3章
Stream作为Java8的新特性之一,他与Java IO包中的InputStream和OutputStream完全不是一个概念。Java8中的Stream是对集合功能的一种增强,主要用于对集合对象进行各种非常便利高效的聚合和大批量数据的操作。结合Lambda表达式可以极大的提高开发效率和代码可读性。
假设我们需要把一个集合中的所有形状设置成红色,那么我们可以这样写
如果使用Java8扩展后的集合框架则可以这样写:
第一种写法我们叫外部迭代,for-each调用的依次遍历集合中的元素。这种外部迭代有一些问题:
for循环是串行的,而且必须按照集合中元素的顺序依次进行;
集合框架无法对控制流进行优化,例如通过排序、并行、短路求值以及惰性求值改善性能。
上面这两个问题我们会在后面的文章中逐步解答。
第二种写法我们叫内部迭代,两段代码虽然看起来只是语法上的区别,但实际上他们内部的区别其实非常大。用户把对操作的控制权交还给类库,从而允许类库进行各种各样的优化(例如乱序执行、惰性求值和并行等等)。总的来说,内部迭代使得外部迭代中不可能实现的优化成为可能。
外部迭代同时承担了做什么(把形状设为红色)和怎么做(得到Iterator实例然后依次遍历),而内部迭代只负责做什么,而把怎么做留给类库。这样代码会变得更加清晰,而集合类库则可以在内部进行各种优化。
一、什么是Stream
Stream不是集合元素,它也不是数据结构、不能保存数据,它更像一个更高级的。Stream提供了强大的数据集合操作功能,并被深入整合到现有的集合类和其它的JDK类型中。流的操作可以被组合成流水线(Pipeline)。拿前面的例子来说,如果我只想把蓝色改成红色:
在上调用会生成该集合元素的流,接下来操作会产生只包含蓝色形状的流,最后,这些蓝色形状会被操作设为红色。
如果我们想把蓝色的形状提取到新的List里,则可以:
操作会把其接收的元素聚集到一起(这里是List),方法的参数则被用来指定如何进行聚集操作。在这里我们使用以把元素输出到List中。
如果每个形状都被保存在里,然后我们想知道哪个盒子至少包含一个蓝色形状,我们可以这么写:
操作通过映射函数(这里的映射函数接收一个形状,然后返回包含它的盒子)对输入流里面的元素进行依次转换,然后产生新流。
如果我们需要得到蓝色物体的总重量,我们可以这样表达:
二、Stream vs Collection
流(Stream)和集合(Collection)的区别:
Collection主要用来对元素进行管理和访问;
Stream并不支持对其元素进行直接操作和直接访问,而只支持通过声明式操作在其之上进行运算后得到结果;
Stream不存储值
对Stream的操作会产生一个结果,但是Stream并不会改变数据源;
大多数Stream的操作(filter,map,sort等)都是以惰性的方式实现的。这使得我们可以使用一次遍历完成整个流水线操作,并可以用短路操作提供更高效的实现。
三、惰性求值 vs 急性求值
和这样的操作既可以被急性求值(以为例,急性求值需要在方法返回前完成对所有元素的过滤),也可以被惰性求值(用代表过滤结果,当且仅当需要时才进行过滤操作)在实际中进行惰性运算可以带来很多好处。比如说,如果我们进行惰性过滤,我们就可以把过滤和流水线里的其它操作混合在一起,从而不需要对数据进行多遍遍历。相类似的,如果我们在一个大型集合里搜索第一个满足某个条件的元素,我们可以在找到后直接停止,而不是继续处理整个集合。(这一点对无限数据源是很重要,惰性求值对于有限数据源起到的是优化作用,但对无限数据源起到的是决定作用,没有惰性求值,对无限数据源的操作将无法终止)
对于和这样的操作,我们很自然的会把它当成是惰性求值操作,不过它们是否真的是惰性取决于它们的具体实现。另外,像这样生成值的操作和这样产生副作用的操作都是天然急性求值,因为它们必须要产生具体的结果。
我们拿下面这段代码举例:
这里的和都是惰性的,这就意味着在调用之前不会从数据源中提取任何元素。在操作之后才会把、和放在对数据源一次遍历中。这样可以大大减少维持中间结果所带来的开销。
四、举个栗子
前面长篇大论的介绍概念实在太枯燥,为了方便大家理解我们用Streams API来实现一个具体的业务场景。
假设我们有一个房源库项目,这个房源库中有一系列的小区,每个小区都有小区名和房源列表,每套房子又有价格、面积等属性。现在我们需要筛选出含有100平米以上房源的小区,并按照小区名排序。
我们先来看看不用Streams API如何实现:
如果使用Streams API:
如果你喜欢我的文章,就关注下我的知乎专栏或者在 GitHub 上添个 Star 吧!
知乎专栏:https://zhuanlan.zhihu.com/baron
GitHub:https://github.com/BaronZ88
- 3223: Tyvj 1729 文艺平衡树
- 1212: [HNOI2004]L语言
- POJ 2942Knights of the Round Table(tarjan求点双+二分图染色)
- 算法模板——平衡树Treap
- Java并发编程
- 算法模板——线段树2(区间加+区间乘+区间求和)
- 1798: [Ahoi2009]Seq 维护序列seq
- 【LeetCode 389】 关关的刷题日记30 Find the Difference
- 1708: [Usaco2007 Oct]Money奶牛的硬币
- 1856: [Scoi2010]字符串
- 【LeetCode 409】 关关的刷题日记31Longest Palindrome
- Git的奇技淫巧?
- 3224: Tyvj 1728 普通平衡树
- 【LeetCode 136】 关关的刷题日记32 Single Number
- java教程
- Java快速入门
- Java 开发环境配置
- Java基本语法
- Java 对象和类
- Java 基本数据类型
- Java 变量类型
- Java 修饰符
- Java 运算符
- Java 循环结构
- Java 分支结构
- Java Number类
- Java Character类
- Java String类
- Java StringBuffer和StringBuilder类
- Java 数组
- Java 日期时间
- Java 正则表达式
- Java 方法
- Java 流(Stream)、文件(File)和IO
- Java 异常处理
- Java 继承
- Java 重写(Override)与重载(Overload)
- Java 多态
- Java 抽象类
- Java 封装
- Java 接口
- Java 包(package)
- Java 数据结构
- Java 集合框架
- Java 泛型
- Java 序列化
- Java 网络编程
- Java 发送邮件
- Java 多线程编程
- Java Applet基础
- Java 文档注释
- ubuntu18.04 安装qt5.12.8及环境配置的详细教程
- 安装Ubuntu20.04与安装NVIDIA驱动的教程
- Ubuntu下安装nvidia显卡驱动(安装方式简单)
- Ubuntu 20.04 apt 更换国内源的实现方法
- Android设计模式之单例模式解析
- Android屏蔽软键盘并且显示光标的实例详解
- Android实现底部缓慢弹出菜单
- Ubuntu20的tzselect设置时间失效的问题,树莓派服务器(推荐)
- 安装Ubuntu 20.04后要做的事(小白教程)
- Ubuntu20.04安装Python3的虚拟环境教程详解
- Android编程实现播放视频时切换全屏并隐藏状态栏的方法
- Android UI设计与开发之仿人人网V5.9.2最新版引导界面
- PopupWindow使用方法详解
- Android 中cookie的处理详解
- Android UI设计与开发之ViewPager仿微信引导界面以及动画效果