通用网站内容爬虫抓取工具,可批量抓取任意站点的小说、论坛内容等并保存为TXT文档
< 脚本怠惰小说下载器的反馈
有些网站反爬,我试的只有东方永页机的强制拼页可以获取小说全文。不过内容在iframe里,小说下载器好像获取不了。下面是jq获取iframe内容的一种写法,也许有用:var allStr = ""; $("html,iframe").contents().find(":not(style,script,noscript)").each(function() { var addStr = $(this).clone().children().remove().end().text().replace(/\s+/g, " ") if (addStr.replace(/[^一-鿯0-9]/g, "").length > 6) { allStr += ""; } allStr += addStr + " "; });
设置页勾选“下载前显示章节筛选排序窗口”,下载时可选用iframe解析内容
手机上那个窗口太大了,看不了,有这个功能就行
登录以发表回复。
有些网站反爬,我试的只有东方永页机的强制拼页可以获取小说全文。不过内容在iframe里,小说下载器好像获取不了。
下面是jq获取iframe内容的一种写法,也许有用:
var allStr = "";
$("html,iframe").contents().find(":not(style,script,noscript)").each(function() {
var addStr = $(this).clone().children().remove().end().text().replace(/\s+/g, " ")
if (addStr.replace(/[^一-鿯0-9]/g, "").length > 6) {
allStr += "
";
}
allStr += addStr + " ";
});