html转md,博客一键保存本地exe可视化界面文件
说明
项目连接
1.码云:https://gitee.com/pythonywy/html_to_md (码云由于上传文件大小限制现在exe不是最新的,最新的再github上)
2.github:https://github.com/a568972484/html_to_md
功能介绍
- 功能一:批量爬取博客园首页的所有随笔字典并保存JSON文件,且随笔全部转成MD格式文件
- 功能二:输入指定随笔网址把随笔内容转成MD并且保存
- 功能三:爬取某个分目录下博客
由于不同博客具有不同的见状性`要根据博客能让进行适当的修改就可以使用此程序
程序没有加入多进程
与多线程
进去增加博客园的负担
爬取内容请不要用做商业用途
初衷主要是为了帮助博主把已上传的随笔下载至本地方便修改
更新日志
2019.7.20
增加了功能
功能介绍:爬取某个分目录下博客
版本升级至5.0,增加了可视化界面可视化界面exe程序,增加了见状性,
只需下载exe运行即可
温馨提示:
程序由可能会被流氓杀毒软件屏蔽请自行恢复
绝对无毒的,没有添加任何恶意信息
运行程序第一功能和第三功能会因为博客数量多出现卡顿,由于本人对程序理解还不深刻没能找到解决办法,请大家见谅请不要关闭程序,结束后会自动出现数据的
都是自学的一些模块可能会有点理解不到位请大家见谅,需要原代码的解压密码私聊我就好了.
核心代码在'core_code.py'中注释都加全了
再次强调
该程序只为了帮助学习
码云名称:YWY
码云链接:https://gitee.com/pythonywy
github_id:a568972484
github_url:https://github.com/a568972484
作者博客:小小咸鱼ywy
博客链接:`https://www.cnblogs.com/pythonywy
希望得到大家相关体验,好进行后续的改进,谢谢
description
Function introduction
- function 1: batch access to all the essay dictionaries on the homepage of blog garden and save JSON files, and convert all the essays into MD format files
- function 2: input the specified essay website to convert the essay contents to MD and save Since different blogs have different perspectives, you can use this program to make the appropriate changes according to the blog Do not add 'multi - process' and 'multi - threaded' to add to the burden of the blog park Crawl content 'please do not use it for commercial purposes' The original intention is to help bloggers download the uploaded essays to the local site for easy modification Run 'run.py' when in use
update log
2019.7.20
Added functionality
Function description: crawl a subdirectory under the blog
Version 5.0, added visual interface visual interface exe program, increased visibility
Just run exe
#Tips:
Program by may be rogue antivirus software shield please restore
Absolutely non-toxic, without adding any malicious information
The first function and the third function of running the program will appear because of the number of blog card, because I understand the program is not deep did not find a solution, please forgive me please do not close the program, the end will automatically appear data
Some modules are self-taught may not understand a little bit in place, please forgive me, need the original code to extract password private chat on me.
The core code is commented out in 'core_code.py'
again
Code cloud name :YWY
Yards cloud link: https://gitee.com/pythonywy
Github_id: a568972484
github_url:https://github.com/a568972484
Author's blog: little salted fish ywy
Blog links: ` https://www.cnblogs.com/pythonywy
hope to get relevant experience, so as to carry out subsequent improvements,thanks
- 想尝试搭建图像识别系统?这里有一份TensorFlow速成教程
- 如何查看集成Sentry后Hive作业的真实用户
- 如何在Impala中实现拉链表
- 多图见证模拟机器人的逆天成长:论进化策略在强化学习中的应用
- Hue禁止用户下载数据问题分析
- 如何在RedHat6上使用Bind搭建DNS服务
- 如何使用Cloudera Manager升级Spark2.1版本至Spark2.2
- Cloudera Manager分发Parcel异常分析
- 如何在Hue中配置Impala的负载均衡
- 35行代码实现千万级别字典的快速去重
- PIMS三个漏洞+里程密最新版V2.3 SQL注入漏洞
- 如何在Redhat7.3安装CDH5.14
- CDSW1.3的新功能
- 如何在Hue中配置HiveServer2的负载均衡
- HTML 教程
- HTML 简介
- html div 标签介绍
- html span 标签介绍
- html a 超链接标签
- HTML Br换行标签介绍
- HTML P段落标签介绍
- HTML br与p标签区别
- Html H 标题标签
- html px em pt长度单位
- HTML form 标签
- HTML radio 单选框
- HTML B 加粗标签
- HTML strong加粗粗体标签
- HTML em 强调标签
- HTML i 斜体标签
- HTML u下划线标签
- HTML s 删除线标签
- Html img 图片标签
- Html上标注sup与下标注sub标签
- HTML nobr 禁止换行标签
- HTML hr 水平线标签
- HTML label 标签
- HTML input 标签
- HTML textarea 标签
- HTML select下拉列表标签
- HTML checkbox 多选框
- HTML font color 标签
- HTML iframe 框架标签
- HTML Table 表格
- HTML dl dt dd 标签
- HTML ol li有序列表标签
- HTML ul li 无序列表标签
- HTML 注释
- CSS 教程
- CSS 简介
- CSS 语法
- CSS Id 和 Class选择器
- CSS 样式的创建
- CSS background 背景介绍
- CSS 文本样式
- CSS font 字体
- CSS A 链接
- CSS ul ol列表样式
- CSS TABLE 样式
- CSS 框模型
- CSS border 边框
- CSS Outlines 轮廓
- CSS 外边距 Margin
- CSS Padding 内边距
- CSS 分组和嵌套选择器
- CSS 尺寸 (Dimension)
- CSS Display 属性
- CSS Position 定位
- CSS Float 浮动
- CSS 水平对齐(Horizontal Align)
- CSS 组合选择符
- CSS 伪类
- CSS 伪元素
- CSS 导航栏
- CSS 下拉菜单
- CSS 图片廊
- CSS 图像透明/不透明
- CSS sprite 图像拼合技术
- CSS 媒体类型
- CSS 属性选择器
- CSS 实例