另类SEO分享:利用JS封装iframe躲过搜索引擎的抓取

时间:2022-05-05
本文章向大家介绍另类SEO分享:利用JS封装iframe躲过搜索引擎的抓取,主要内容包括现在,张戈来说明如何用 JS 代码封装这段 iframe,制作 js 版本:、接下来,张戈来实测一下躲过搜索爬虫的效果:、基本概念、基础应用、原理机制和需要注意的事项等,并结合实例形式分析了其使用技巧,希望通过本文能帮助到大家理解应用这部分内容。

前言:很多博友不仔细看完内容就直接认为用 iframe 不好之类的云云,而实际上本文就是教你在必须使用 iframe 的时候,该如何躲过搜索引擎的抓取,避免不利于 SEO 的情况!

那么,何为“必须要用 iframe 的时候”?我举个简单的例子:一些主题分享网站,很多时候会使用 iframe 框架调用主题作者的网站来做主题演示,这时候就会产生大量的 iframe 框架,那么本文的方法就可以派上用场了!

导读:了解一点 seo 的站长,应该都知道爬虫都不喜欢 iframe 或 frame,因为蜘蛛访问一个网址时所抓取的 HTML 是调用其他网页的 HTML 文件的代码,并不包含任何的文字内容,也就是说你这个网页的内容是什么,蜘蛛弄不清楚。有人可能会说搜索引擎的蜘蛛也能跟踪爬取所调用的 HTML 文件啊。对,是能跟踪爬取,但是跟踪这一部分内容通常不是完整的页面。搜索引擎更不能判断哪部分是主框架哪一部分是被调用的文件。随着搜索技术的发展也不一定永远无法解决这种问题,但是这么多的网站蜘蛛不会因为你一个网站而费那个劲。所以,当你一定要用到一个 iframe 框架的时候,张戈推荐你继续往下看。

从用 iframe 调用快递 100 制作快递查询,到自己推出互推联盟 iframe 调用代码,张戈算是对 iframe 这玩意摸得有那么一点透彻了。

记得,在互推联盟推出自适应 iframe 代码的时候,冯耀宗博友曾有如下评论:

后来,偶然的测试让我灵光一现,想到用 JS 封装 iframe 的方法,来避开搜索引擎的抓取。当时,我是测试用 JS 封装 CSS 代码,想简单的加密下自己的劳动成果。不想,突然就想到了,既然 JS 可以输出 CSS,那 JS 应该也可以输出 iframe 啊!实际测试发现,我的想法是可行的!通过 JS 输出 iframe 代码,可以完美实现直接调用 iframe 代码的效果!

下面以互推联盟为例子,公布方法:

张戈最开始推出的 iframe 自适应调用代码如下:

<iframe style="padding: 0px; width: 100%;" height="480" src="http://zhangge.net/bokehutui" frameborder="no" border="0" marginwidth="0" marginheight="0" scrolling="no"></iframe>

现在,张戈来说明如何用 JS 代码封装这段 iframe,制作 js 版本:

首先,新建一个 JS 文件,在里面输入以下内容并保存:

括号中即为原 iframe 的内容,要注意的是首尾是双引号,而 iframe 里面需要改为单引号!否则无法输出!

document.write("<iframe style='padding: 0px; width: 100%;' height='480' src='//zhangge.net/bokehutui' frameborder='no' border='0' marginwidth='0' marginheight='0' scrolling='no'></iframe>");

然后,将这个 js 文件上传到服务器

比如互推联盟调用的 js 最终地址为:http://zhangge.net/hutui.js 

最后,将如下语句写到你想调用 iframe 的地方

如果存在旧的 iframe 代码,请直接替换掉即可,如果发现界面不理想,请编辑第二步的 JS 文件来调整 iframe 大小。

<script type="text/javascript" src="http://zhangge.net/hutui.js" ></script>

如此一来,就完美实现了原来直接用 iframe 框架调用的效果。

接下来,张戈来实测一下躲过搜索爬虫的效果:

① 打开站长工具的搜索蜘蛛、机器人模拟抓取工具:http://tool.chinaz.com/Tools/Robot.aspx

② 输入用 JS 部署 iframe 代码的页面,比如 MOREOPEN 博客调用的互推联盟页面:http://moreopen.info/electunion

③如图,这个页面存在很多外部链接,若不做处理,蜘蛛肯定可以爬到这个 iframe。

但是经过 JS 封装后,则会得到如下了抓取结果:

如上图所示,结果中并不存在该页面互推联盟的任何内容, 证实了这个方法的可行性!当然,感兴趣的站长也可以用自己的站点亲自测试下效果。

最后,“国际惯例”式的总结下:

综上事实证明,通过 JS 封装 iframe 代码,确实可以完美骗过搜索引擎的抓取,让鱼和熊掌不再难以取舍!

而且,无外链输出、无权重流失,也是张戈博客的通用互推联盟页面被众多站长调用的重要原因之一!很多博主可能以为张戈弄这个互推联盟赚到了多少多少外链,其实不然!张戈在这里必须澄清一下,用 JS 调用的互推联盟,完全不会成为张戈博客的外链!不相信的朋友可以去用工具测试被调用的页面就知道了!

最后,给联盟打个广告:互推联盟欢迎健康合法、积极向上的独立博客的加入!有你更加精彩!详情=>