对于随机数的一些分析
多年前我朋友圈的一个朋友公司年会抽奖出现了下面的这样一幕:CTO现场review代码。本来带着一丝娱乐精神,结果被无限放大了。所以年会中大家都会很自然想review下代码。
比如这种姿势:
然后就开始review代码。
我们就开几个脑洞,来从我的理解来说一下随机数的情况。
生成一个随机数看起来很简单,实则不易,怎么让一个确定的值得到一个不确定的值,这个想起来都有点困难,所以如果自己想实现,结果发现远比自己琢磨的要复杂的多,如果放眼程序领域,就拿Java来说,Java不同版本中对于随机算法的实现是有差别的。
比如Random的方法在JDK6中会使用System.nanoTime()的方式,而在早期的版本是使用currentTimeMillis,相比而言,nanoTime是以毫微秒为单位,而currentTimeMillis返回的是系统当前时间和1970-01-01之前间隔时间的毫秒数。
而且在随机算法的实现细节上,也有一些差别。
关于随机算法,还有一本书,这本书有400多页,涉及的面非常广。
而如果我们不写SQL行不行,肯定可以,因为对于DBA来说,SQL能做任何想做的事情。
比如要得到一个随机数,写SQL其实有很多中写法。比如限定数据的范围是7~12,可以这样写。
mysql> SELECT FLOOR(7 + (RAND() * 6));
+-------------------------+
| FLOOR(7 + (RAND() * 6)) |
+-------------------------+
| 10 |
+-------------------------+
1 row in set
比如限定的数据范围是100以内,可以这样写。
mysql> select truncate(round(rand(),2)*100,0);
+---------------------------------+
| truncate(round(rand(),2)*100,0) |
+---------------------------------+
| 78 |
+---------------------------------+
当然这样只是最基本的实现,还没有考虑到种子函数的影响。
我们暂且抛开实现的复杂度,来看看结合一些场景的不同实现,我临时自造了几个概念,但是意思应该是相通的。
平均随机数
这是一种看起来随机,但是数据分布又可控的方式。
比如1~100我生成10个数字,我可以每10个数字分为1组。每组做一个随机。
这样我对1~10生成一个随机序列,比如第一个随机数是2,我就从20~29里面选择一个数字,下一数字是5,则从50~59里面选出1个数字。
通过这种方式数据的分布方式决定是可控的,但是又保证了随机的特性。
一次性随机数
这类随机数就好比陕西的油泼面一样,简单快捷,一勺油即可搞定。如果我需要10个数字,那么我一次就生成10个随机数字。
看起来实现有些难,其实还好,使用rand()和limit即可。
插入8条数据。
mysql> insert into random values
(1),(2),(40),(30),(20),(9),(15),(21);
Query OK, 8 rows affected
Records: 8 Duplicates: 0 Warnings: 0
默认得到的数据是有序的。
mysql> select *from random;
+----+
| id |
+----+
| 1 |
| 2 |
| 40 |
| 30 |
| 20 |
| 9 |
| 15 |
| 21 |
+----+
8 rows in set
使用rand来得到一个随机序列。
mysql> select *from random order by rand();
+----+
| id |
+----+
| 1 |
| 2 |
| 30 |
| 20 |
| 40 |
| 21 |
| 15 |
| 9 |
+----+
8 rows in set
如果需要截取,就可以使用limit了。
mysql> select *from random order by rand() limit 4;
+----+
| id |
+----+
| 30 |
| 21 |
| 9 |
| 20 |
+----+
4 rows in set
动态随机数
这类随机数的代价最高,需要反复计算。总之不确定性要高很多,但是随机性更大。
比如对100个数中取出10个数,我们每取出一个数,就需要把它排除掉,从列表里重新再取,这样如果是连续的数字 1 2 3也是有可能的。
我们来通过SQL来简答模拟一下抽奖的过程。
初始化表数和数据。
create table lucky_money(id int primary key,money int,status smallint);
存储过程如下:
delimiter $$
create procedure proc_init ()
begin
declare
init_data integer default 1;
while init_data<=1500 do
insert into lucky_money values(init_data,0,0);
set init_data = init_data +1;
end while;
end $$
delimiter ;
call proc_init();
得到的数据是有序的。即员工号。
| 1497 | 0 | 0 |
| 1498 | 0 | 0 |
| 1499 | 0 | 0 |
| 1500 | 0 | 0 |
+------+-------+--------+
1500 rows in set
我们修改状态,随机得到一些数据的变化。
update lucky_money set money=1000,status=1 order by rand() limit 200;
update lucky_money set money=3000,status=1 where status=0 order by rand() limit 80;
update lucky_money set money=5000,status=1 where status=0 order by rand() limit 20;
所以第一轮之后,平均奖金是360元。
mysql> select avg(money) from lucky_money;
+------------+
| avg(money) |
+------------+
| 360.0000 |
+------------+
1 row in set
- Spring源码解析——如何阅读源码
- java获取当前时间和前一天日期
- 国内首个二代基因测序 FPGA 加速方案-背后的技术
- Java基础04 封装与接口
- Maven那点事儿(Eclipse版)
- 【Spring开发】—— Spring注入静态变量
- java判断list为空
- Java基础01 从HelloWorld到面向对象
- Java基础02 方法与数据成员
- 【Spring实战】—— 13 AspectJ注解切面
- EasyUI日期选择框
- Java基础03 构造器与方法重载
- web.xml is missing and <failOnMissingWebXml> is set to true
- 【Spring实战】—— 11 通过AOP为特定的类引入新的功能
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 【DB宝17】使用mysqldump+mysqlbinlog恢复误删除的数据库
- 13-3 vi编辑模式和移动光标
- Tensorflow BatchNormalization详解:2_使用tf.layers高级函数来构建神经网络
- 使用 numpy 切分训练集和测试集
- 反向学习,相对基学习 opposition-based learning 简介
- python获取指定目录下所有文件名os.walk和os.listdir
- 腾讯地图SDK实现点击建筑显示围栏及建筑信息效果
- 【pyspark】parallelize和broadcast文件落盘问题
- 终于知道Kafka为什么这么快了!
- 使用 L2 正则化和平均滑动模型的 LeNet-5MNIST 手写数字识别模型
- Tensorboard 监控指标可视化
- 持久化的基于 L2 正则化和平均滑动模型的 MNIST 手写数字识别模型
- tf.slice函数解析
- 用 Tensorflow 实现简单多层神经网络
- Tensorflow 命名空间与计算图可视化