一文入门DNS?从访问GitHub开始
前言
大家都是做开发的,都有GitHub
的账号,在日常使用中肯定会遇到这种情况,在不修改任何配置的情况下,有时可以正常访问GitHub,有时又直接未响应,来一起捋捋到底是为啥。
GitHub访问的千层套路
以我家里的电脑为例,在不修改任何配置,不启用什么代理工具的情况下,访问GitHub
会得到以下结果:
???
虽然很戳心,但好歹能展示一部分。
从网上搜了一堆乱七八糟的攻略,知道了可以通过修改电脑的Hosts
文件达到正常访问的能力,于是胡搜了一通,
步骤:百度经验
效果如下:
访问效果依然很感人,最近活动数据不显示,整个界面加载都快接近2分钟了,有什么办法没有咧~
站长工具 PING PING PING
都是搞开发的,都会用F12看看网络或者资源请求的地址是什么,以上面耗时最慢的地址为例,域名为:github.githubassets.com
打开站长工具的PING功能,地址为:http://ping.chinaz.com/github.githubassets.com
结果如下:
我发现 185.199.108.154
这个IP地址速度快的一批,于是立马更换 Hosts
中该域名对应的IP地址
再次访问,效果如下:
那句话怎么说的来着?如什么什么般丝滑,我感觉这就非常丝滑~ ?
GitHub项目定时发布最新Hosts
当然了,如果每次访问都得折腾一次,那滋味,简直不要太难受,所以网上已经有人开源了相关的项目,会定时发布最新的 GitHub
IP地址,链接:https://github.com/521xueweihan/GitHub520
本文撰写时的Hosts
# github
185.199.108.154 github.githubassets.com
199.232.68.133 camo.githubusercontent.com
52.168.24.190 github.map.fastly.net
199.232.69.194 github.global.ssl.fastly.net
140.82.112.4 github.com
140.82.112.5 api.github.com
199.232.68.133 raw.githubusercontent.com
199.232.68.133 user-images.githubusercontent.com
199.232.68.133 favicons.githubusercontent.com
199.232.68.133 avatars5.githubusercontent.com
199.232.68.133 avatars4.githubusercontent.com
199.232.68.133 avatars3.githubusercontent.com
199.232.68.133 avatars2.githubusercontent.com
199.232.68.133 avatars1.githubusercontent.com
199.232.68.133 avatars0.githubusercontent.com
该项目会自动发布在指定的地址上,结合软件使用,可以完全自动化,无需持续更新
当然也可以自行手动更改
为什么改了Hosts就能访问GitHub
平常都是百度 + 谷歌,今天非要探究一下原理!咱们一步一步来,首先大家都需要明确一点,在网络的世界中 域名
只是为了便于记忆和识别而存在的一个唯一地址,真正工作的仍然是 IP
Hosts文件是干吗的
简单来说,Hosts文件是存储本机网址域名与其对应的IP地址的一个文件,在网络请求阶段发挥作用
为什么改了Hosts就能生效
这就涉及到了域名解析,因为Hosts文件存放的就是 域名
和 IP
的对应关系,因此它可以在域名解析阶段发挥作用,为什么呢?因为在域名解析的流程中 本机Hosts
解析处于顺序二
即:浏览器解析 -》本机解析
-》XXXX(后面的稍后再提)
所以有时候我们白嫖软件,都会改一下 Hosts
,因为需要把它在线验证的域名指向错误的地址去,另外可能存在一定的浏览器缓存或者本机缓存,可以通过重开浏览器或者 PING
域名来检查更改是否生效。
DNS解析到底是什么玩意?
上文中多次提到解析
,其实说的就是 DNS解析
同时上文也提到过,在网络世界中真正发挥作用的是 IP
,而一般情况下我们访问的都是 域名
,为什么能实现这种效果,就是因为域名与IP地址的对应关系存储在一个叫做 DNS(Domain Name System)
的系统里。DNS是一个全球化的分布式数据库,它所提供的服务就是将域名转换为互联网IP地址。
DNS解析的全部流程
网上的关于流程的图很多,我从中借鉴了一副,如下所示:
- 浏览器缓存:一次请求会首先通过浏览器缓存信息寻找域名映射的IP地址,这也是为什么有时候我们改了本机hosts,需要关闭再打开浏览器才能正常使用,如果找到则返回,没找到则继续到下一级
- 本机系统缓存:即上文中提到的,通过
hosts
文件来映射域名和IP,在上古时期有很多垃圾软件会悄咪咪的修改系统的 hosts文件,达到DNS劫持
的目的,即把淘宝域名指向另一个IP
,然后部署一个高仿的淘宝商城,静静等你输入账号,密码,然后凉凉... - 本地域名解析服务系统:本地域名系统LDNS一般都是本地区的域名服务器。离你的位置都比较近,Windows系统使用命令
ipconfig
就可以查看,在Linux和Mac系统下,直接使用命令cat /etc/resolv.conf
来查看LDNS服务地址。LDNS一般都缓存了大部分的域名解析的结果,大部分的解析工作到这里就差不多已经结束了 以下即是所谓的递归解析
- 根域名解析:本地域名解析服务系统无法解析时,会向
13根
发起域名解析请求 说明: 所谓的 13根,指的是根域名服务器,是架构因特网所必须的基础设施。根服务器主要用来管理互联网的主目录,由于DNS解析中采用的是UDP协议,仅能传递512字节的有效报文,因此只能构建出A-M 13个根服务器,而真正工作运行肯定不止13台服务器,而是包含很多服务器镜像的 - 根域名解析服务器返回
gTLD (Generic top-level domain)
给本地解析服务器,即该域名所属的顶级域及其所在的服务器,顶级域名即如:.com .cn等等 - 本地解析服务器已知顶级域名服务器地址后,发起解析请求
- 顶级域名解析服务器返回
权限域名服务器
信息给本地解析服务器,权限域名服务器
即如:taobao.com - 本地解析服务器已知权限域名服务器地址后,发起解析请求
- 权限域名服务器返回域名对应的IP地址给本地解析服务器
- 本地解析服务器缓存相关信息,并返回给用户
是不是有点绕?咱们来整个图吧,递归解析
如下所示:
再问一遍为什么改Hosts就可以访问GitHub
了解了上文之后,对于这个问题就更好回答了,因为GitHub毕竟为外国的网站,咱们访问时有一层 DNS污染
,即把对应的域名指向了不可达的IP上,或者禁止访问的IP上,因此很多时候无法使用
修改Hosts文件后即避免了DNS污染,直达目标IP,即可正常访问了,当然了,这种方法是全部通用吗?
答案:肯定不是,因为刚才也提到了,网关层是可以控制某些IP禁止访问的
整一个工具来验证一下猜想,顺便看看我们的整个请求流程:
软件名:BestTrace
我请求的域名是 github.githubassets.com
,最终请求接收方IP和我Hosts配置的IP一致,那我换一个 facebook.com
可以看到,当请求到达 221.183.46.249 这个IP时,整个请求就被拦截下来了,因此这并不是万能的办法
除了访问GitHub,还有什么时候可能用到呢?
比如下载 IDEA插件
时,如果发现老是刷新不出来插件库,或者下载失败,就可以通过PING工具去配置最佳IP,方便下载~
DNS除了解析还能做什么
智能DNS
网络请求交由域名解析服务器来处理,分配到最佳的服务器IP上
例如:请求的源头是电信还是联通等,如果是电信则将解析的IP分流到电信对应的IP上,或者返回距离最近的服务器IP地址
反向代理水平扩展
典型的互联网架构中,可以通过增加web-server
来扩充web层的性能,但反向代理nginx仍是整个系统的唯一入口
如果系统吞吐超过nginx的性能极限,那么将难以扩容,此时就需要dns-server
来配合水平扩展。
即DNS解析服务器有序的把域名解析到不同的网关层,每次DNS解析请求,轮询返回不同的ip,这样就能实现nginx的水平扩展,这个方法叫 “DNS轮询”
最后
参考资料:
博客园 DNS解析全过程分析:https://www.cnblogs.com/kongtongshu/p/11069559.html
除了解析域名,DNS还能干吗:
https://blog.csdn.net/shenjian58/article/details/107273629/
- 2018年值得关注的200场机器学习会议
- Linux开机启动(bootstrap)
- 剑指OFFER之树的子结构(九度OJ1520)
- 万物智联慧结成网:信息技术驱动物流产业转型升级
- 用Qt写软件系列五:一个安全防护软件的制作(1)
- Linux文件管理
- 为什么区块链会成为消除数字化营销障碍的解决方案
- TinyOS和Deluge的安装模拟(二)
- Kubernetes的服务网格(第4部分):通过流量切换持续部署
- QTableView表格视图的列宽设置
- OpenProcess打开进程返回错误的问题
- Python标准库01 正则表达式 (re包)
- 剑指OFFER之栈的压入、弹出序列(九度OJ1366)
- Python标准库03 路径与文件 (os.path包, glob包)
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法
- 「查缺补漏」巩固你的Nginx知识体系
- 超级帐本合约调用——fabric SDK Node调用TBaaS的合约
- TBaaS合约调用_fabric SDK Node 不使用Connection Profile
- helm安装、使用、实践
- 浅析asp .net core 中间件
- 玩转jenkins - 在自己的服务器上安装jenkins
- CPU有个禁区,内核权限也无法进入!
- Java bytecodes
- 云原生分布式深度学习初探
- 【原创】经验分享:一个Content-Length引发的血案(almost....)
- SAP Spartacus里使用Observable访问Component数据
- SAP Spartacus的b2cLayoutConfig
- python判断工作日,节假日
- Shell高级用法之重定向绑定
- 使用Pyspark进行特征工程时的那些坑