自己做的一个小程序 可采集、导出、模板、配置
去年老婆要开个店铺,卖化妆品的,不过输入数据的时候真的头疼,因为我们是没有货源的,都是从代理那里找图片、介绍等,不过好在代理有个网站,闲来无事,就开发了这个小程序。
程序的功能:
1、采集数据
2、可配置的,只要输入一定的条件就能采任何东西了。
3、可导出成csv格式
4、可把数据导入到淘宝助手。
5、采集图片到本地。
6、可修改宝贝内容
7、可使用模板来进行描述
用了这个程序,1000多个商品,只用了一会就全部搞定了,不过还有些小bug,也懒得改了,自己用的反正。
先看看配置文件:
1<?xml version="1.0" encoding="utf-8" ?>
2<configuration>
3 <configSections>
4 <sectionGroup name="userSettings" type="System.Configuration.UserSettingsGroup, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" >
5 <section name="MyCollection.CollectSetting" type="System.Configuration.ClientSettingsSection, System, Version=2.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" allowExeDefinition="MachineToLocalUser" requirePermission="false" />
6 </sectionGroup>
7 </configSections>
8 <connectionStrings>
9 <add name="MyCollection.Properties.Settings.MyCollectConnectionString"
10 connectionString="Data Source=.SQLEXPRESS;AttachDbFilename=|DataDirectory|MyCollect.mdf;Integrated Security=True;Connect Timeout=30;User Instance=True"
11 providerName="System.Data.SqlClient" />
12 </connectionStrings>
13 <userSettings>
14 <MyCollection.CollectSetting>
15 <setting name="SaveImagePath" serializeAs="String">
16 <value>D:办公淘游馆香水彩妆商品图片</value>
17 </setting>
18 <setting name="SaveCSVPath" serializeAs="String">
19 <value>D:办公淘游馆香水彩妆描述模板</value>
20 </setting>
21 <setting name="HtmlTemplet" serializeAs="String">
22 <value>D:办公淘游馆香水彩妆描述模板wenwen.html</value>
23 </setting>
24 </MyCollection.CollectSetting>
25 </userSettings>
26</configuration>
SaveImagePath:保存图片到本地的路径
SaveCSVPath:导出文件所在目录
HtmlTemplet:宝贝描述模板文件
大概的界面:
主界面
显示此项目中的采集的数据
单个商品的详细内容,用的是winform的Edit,感觉还不错。
下面是进行采集的配置,界面如下:
如果用过动易那种采集系统的话,应该对此还比较熟悉,大致的话都是通过截取指定地方获取数据的。大家也可以看看实例。
在采集中,我没有使用WebRequest,因为我测试下来XmlHttp好像更快一点,而且不仅仅是一点点。
在Collect.cs中,是一个采集的类库,我想应该能满足一些读者的需求了。
程序原先用2005开发的,不过我这次转换了一下,可能要2008才能打开了:P
东西很小,不过当时因为刚接触2.0,所以东西写的不好,也没时间去改了,今天拿上来献丑,希望大家也能继续拓展这个程序,如果觉得好,需要改进,大家也可以随意改动,不过最好能通知我下,谢谢了:)
PS:做网站这么多年,我的了解,做采集做的成功的,应该属大旗网和去哪儿这2个网站。
PS2:今天发表的Exception第三篇,写的实在太糟了,真对不起大家,后面我会改进一下的,不过最近真的很忙:(
- 串口通信控制器的Verilog HDL实现(一) 顶层模块
- 双口同步RAM
- 单口RAM
- Python 基础:类与函数
- 论 Python 装饰器控制函数 Timeout 的正确姿势
- 巧用 SecureCRT 实现复杂的 ssh 登录过程自动化
- pyDes 实现 Python 版的 DES 对称加密/解密
- 流水灯
- Chrome 自动化交互利器:用 tampermonkey 向页面注入自定义 Javascript
- 一次小折腾:PyCharm 调用 Cygwin Python 找不到 time、sys 等内置模块
- 网站数据统计分析之二:前端日志采集是与非
- Linux Shell 从入门到删除根目录跑路指南
- SSD Win8 系统盘 4K 无损对齐历险记
- 详解 MySQL 5.7 新的权限与安全问题
- JavaScript 教程
- JavaScript 编辑工具
- JavaScript 与HTML
- JavaScript 与Java
- JavaScript 数据结构
- JavaScript 基本数据类型
- JavaScript 特殊数据类型
- JavaScript 运算符
- JavaScript typeof 运算符
- JavaScript 表达式
- JavaScript 类型转换
- JavaScript 基本语法
- JavaScript 注释
- Javascript 基本处理流程
- Javascript 选择结构
- Javascript if 语句
- Javascript if 语句的嵌套
- Javascript switch 语句
- Javascript 循环结构
- Javascript 循环结构实例
- Javascript 跳转语句
- Javascript 控制语句总结
- Javascript 函数介绍
- Javascript 函数的定义
- Javascript 函数调用
- Javascript 几种特殊的函数
- JavaScript 内置函数简介
- Javascript eval() 函数
- Javascript isFinite() 函数
- Javascript isNaN() 函数
- parseInt() 与 parseFloat()
- escape() 与 unescape()
- Javascript 字符串介绍
- Javascript length属性
- javascript 字符串函数
- Javascript 日期对象简介
- Javascript 日期对象用途
- Date 对象属性和方法
- Javascript 数组是什么
- Javascript 创建数组
- Javascript 数组赋值与取值
- Javascript 数组属性和方法