Follow

有没有什么python爬虫教程非常好上手那种……照猫画虎套也能套那种……

nihongonosensei.net/?page_id=1
这里面链接点进去是链接列表,需要把每一个链接下的主要内容节点部分(类似节点截图)保存为html[裂开] 或者一步到位pdf。就可以拿去打印了……

· · Web · 3 · 1 · 0

这种需求一般估价多少?程序员接私活的话。

N1-N5

@lucyli 很久很久以前有软件能干这个,要不妳上GitHub搜一下,我感觉应该有人做过了

@loikein @lucyli DownThemAll
对格式有要求的话可以用scrapy写一个

@dmonad @loikein

就是这个,俺下好了,然后用的vscode 的Ctrl+shift+F 对所有文件进行匹配同样的不需要的内容,然后删除。(会正则匹配会轻松很多,可惜俺……

最后整体满意?各种试错,用时差不多2小时。

然后遇到新问题了,html批量转换为pdf。

- calibre有人说打包成zip 转换成pdf,出现错误。
- 乱七八糟软件下载和在线上传处理暂时不想尝试
- chrome批量操作……没找到console贴贴码😭
- ……

我看我得第二个了(

@loikein @dmonad

找了个 html2pdf.com 还可以……因为我也就先做N4N5 82个文件,一次20也就做四次……

你这两第一个pandoc我想尝试来着,结果卡在下载……(恨墙第N次

@lucyli 今天看到这个,不知道妳还需不需要总之……

【自荐】保存多个网页为电子书--BookIt Desktop - 发现频道 - 小众软件官方论坛
meta.appinn.net/t/topic/23426

@loikein 哈哈哈哈,这个不错的,感谢,日语目前搁置了一个月,英语还没断。

Sign in to participate in the conversation
Mastodon

Server run by the main developers of the project 🐘 It is not focused on any particular niche interest - everyone is welcome as long as you follow our code of conduct!