什么是网络协议?网络协议指的是计算机网络中互相通信的对等实体之间交换信息时所必须遵守的规则的集合,是网络上所有设备(网络服务器、计算机及交换机、路由器、防火墙等)之间通......
五种保存网页内容的方法分析
浏览网页时,经常遇到一些好的内容,想把它保存下来。保存网页内容的方法很多,这里着重介绍一下自己最常使用的几种方式,并进行简单的分析。
常用的五种方法
1、直接保存网页
在浏览器上直接Ctrl+S保存网页(全部),这种方法完全原样的将网页复制下来了,网页上面的任何图片、文字等内容,包括CSS、js等样式全部保存下来。
这是完全复制式保存网页,但零碎文件太多,不好做进一步归纳整理。而且很难迁移到客户端进行阅读,比如用手机或平板上的阅读软件进行阅读。
2、直接复制到onenote
将网页内容直接复制,然后直接Ctrl+V粘贴到onenote,自由选择内容,粘贴后仍然保留原样式,而且放在onenote中,管理极其方便。个人觉得没什么缺点,这是自己最常用的一种方式。
3、生成PDF文件
生成PDF,能保留一部分样式,生成的都是文字版PDF,而且PDF在各个平台都能阅读。主要是操作也很方便,一般安装一个浏览器插件就能很方便的生成PDF。
缺点一是会丢点很多样式,页面不美观。差一点的插件甚至会把图片都给你切分到两个页面上。
缺点二是很多广告弹窗等等不需要的都变成图片保留下来了。
4、复制并制作为epub
如果有时间,有精力,将文章内容复制,并制作成epub。这种方式对于保存网页自然是最完美的,但同时也是最耗费精力的,而且需要具备一定的技能,很多人并不会制作epub。
做成epub的好处很多,首先,内容最精确,需要什么就复制什么;其次,可以将样式全部保留;最后,在各个平台进行阅读都非常方便。
但是确实太耗费精力了,除非你认为那段内容非常有收藏价值,愿意花时间去做这个事,那就靠自己去衡量了。
5、百度收藏为文章
百度收藏最大的优点是保存的都是页面的主要内容区,其他无关的部分就直接去掉了,页面看起来非常干净。
缺点一是样式变化太大,比如有些图文排版优美的网页,百度收藏后基本上丢掉了所有样式,有的表格直接把表格线都弄没了,阅读时极不方便。
缺点二是保留什么内容完全是由百度搜藏内部识别的,一般保留的都是一个页面上的主要内容(具体机制未深究),但它识别的有些时候未必是完整的,尤其是论坛这种页面,百度收藏可能仅仅会保留一楼的文章内容,而下面的楼层可能就直接忽略了,但往往下面的楼层也有很多有意义的内容是需要保留的。
总结
具体选择哪种方法,看自己的实际需求。个人经验是,五种方法各有各的好处,平时都会用到。onenote是最常用的;其次是生成PDF;然后是保存网页,然后是百度收藏;少数情况,遇到特别有价值很想收藏下来的内容会花时间做成专门的epub文件保留。
标签: 保存网页内容的方法
相关文章
- 详细阅读
-
区块链核心技术体系架构的网络层主要包括什么详细阅读
区块链核心技术体系架构的网络层主要包括:A、网络管理B、P2P网络C、HTD、发现节点E、心跳服务网络管理网络管理包括对硬件、软件和人力的使用、综合与协调,以便对网络资源进行监视......
2022-04-28 328 区块链核心技术
-
软件调试的目的是什么详细阅读
软件调试的目的是:改正错误。软件调试的概念软件调试是泛指重现软件缺陷问题,定位和查找问题根源,最终解决问题的过程。软件调试通常有如下两种不同的定义:定义1:软件调试是为了......
2022-04-28 359 软件调试
- 详细阅读
- 详细阅读