最近有朋友想要采集优酷的视频标题和缩略图 (哈哈, 并非商业目的). 找到我帮忙, 考虑到有我刚刚发布的SpiderStudio, 我毫不犹豫的答应了.
首先在网页上视频的基本结构为:
div.v- div.v-meta-title //标题- div.v-thumb / img //缩略图
对应的JQuery表达式为:
$("div.v").find("div.v-meta-title"); $("div.v").find("div.v-thumb img");
然后运行SpiderStudio, 编写相关脚本:
public void Run() {Logger.ClearAll();var vList = Default.SelectNodes("div.v");foreach(var v in vList){Logger.Log(v.SelectSingleNode("div.v-meta-title").Text());Logger.Log(v.SelectSingleNode("div.v-thumb img").Attr("src"));} }
运行, 得到结果:
这里有我几篇文章介绍如何在C#脚本中运用JQuery, 供大家参考:
API - 使用Default对象 - 基础篇
示例 - 如何翻页
示例 - 向百度说 Hello world! 并获得回应