jamesliu | ||
江湖豪侠
![]() ![]() ![]() 性别: 男
积分:1573 阅读权限:1223
帖子: 247
加入时间: 2010/5/8
最后登录: 2018/6/16
|
如何网页代码里面没有 class= 或 id= 元素,可以采集吗? |
|
|
wjlsir | ||
江湖新秀
![]() ![]() ![]() 性别: 男
积分:92 阅读权限:12
帖子: 1
加入时间: 2014/3/4
最后登录: 2014/3/14
|
使用css路径模式来定位要获取的内容网页的具体内容时出错(还是此例),请大家看看到底哪里错了?详细内如请移步"http://www.wojilu.com/space/wjlsir/blog8086/post/716"
|
|
|
fei7777 | ||
江湖新秀
![]() ![]() ![]() 性别: 男
积分:94 阅读权限:14
帖子: 2
加入时间: 2014/2/20
最后登录: 2014/7/21
|
|
|
|
fei7777 | ||
江湖新秀
![]() ![]() ![]() 性别: 男
积分:94 阅读权限:14
帖子: 2
加入时间: 2014/2/20
最后登录: 2014/7/21
|
||
|
过错 | ||
江湖新秀
![]() ![]() ![]() 性别: 保密
积分:72 阅读权限:12
帖子: 1
加入时间: 2015/8/14
最后登录: 2018/2/24
|
采集功能 实例 以2015年8月的 http://ent.163.com/special/00031HA4/ch_news.html为例 第一步 1 列表网址 http://ent.163.com/special/00031HA4/ch_news.html 2 编码 默认 3 链接集合设置(css路径方式) #news-flow-content 按id取更快 4匹配链接模板设置(通配符方式) http://ent.163.com/**/*/*.html 第二步 列表中随便选一个标题 编码默认 匹配规则 #epContentLeft |
|
|