10 行 Python 代码,批量压缩图片 500 张,简直太强大了(内有公号宣传,不喜勿进)

2019-05-08 21:13:13 +08:00
 chinesehuazhou

本文原创并首发于公众号 [Python 猫] ,未经授权,请勿转载。 原文地址:https://mp.weixin.qq.com/s/5hpFDgjCpfb0O1Jg-ycACw

熟悉 “ Python 猫” 的读者应该知道,猫哥我发布的所有文章都使用了极具特色的配图——原创文章使用猫图,转载文章使用狗图,极少例外。

这几天,我在用 Github page + hexo 搭建个人网站,为了延续风格,就想把配图与文章一起迁移过去。这时候就出现了一个难题:我所用的图片都是高清大图,放到网站上就严重拖慢了加载速度。因此,需要先把图片压缩,再上传。

我把需求概括如下:

按着这几条线索,我搜索“批量压缩图片”、“图片压缩工具“、”批量处理图片“......

一开始的想法是找轻量级的图片压缩工具,简单处理一下就好。然而不知是搜索的姿势不对,还是筛选过滤信息的姿势不对,结果都差强人气。

查找到的工具有本地与在线两类,可试验后都不太理想:有的软件下载后才发现是付费的,有的在使用时直接导致程序卡死,有的压缩率不够需要多次压缩,有的要求原始图片大小不能超过 5 M,有的要求批量处理数量不超过 20 张,有的不支持批量压缩......群内小伙伴还帮忙推荐了“ PS+批处理”、acdsee、甚至手机应用 snapseed,都不合我意。

花了不少时间后,偶然看到有文章写用 Python 来压缩图片。一文惊醒梦中人,我怎么没想到呢?

先看看别人是怎么做的。这篇《如何用 Python 智能批量压缩图片?》(https://zhuanlan.zhihu.com/p/32246003)文章中介绍了使用 PIL 库的 Image 模块来压缩图片的方法,主要通过调节图片长宽数值的方式。

PIL 是个强大的图片处理库,但只支持 Python 2,而且早已停止更新。有开发者在它基础上改良并维护了 Pillow,支持 Python 3。之前有所耳闻,没用过。于是猫哥查了几篇教程和文档。读后发现它压缩图片的方法主要是等比例缩放、裁剪以及改变格式等,并非我所要的。

还看到一篇《如何在无损的情况下让图片变的更小》(https://juejin.im/post/5959fbe0f265da6c2518d740)文章,它介绍了 Yelp (美国最大点评网站)的三种优化图片的策略:Pillow、动态调优、更换编码器。有些方法很高大上,应该是业界先进经验了,但它希望保证图片无损,所有方法加起来才可以使图片大小平均减少 30%,因此并不满足我的要求。另外它引申介绍了几种方法,可是需要花费时间去研究,我也放弃了。

最后,终于找到了一种非常便捷,又十分满足的方案,下面开始进入正题了。(不要嫌我啰嗦,探索的过程也很有趣)(嘘,实际上是因为下面要介绍的方法太简单,才区区几行代码,我实在忍不住强行加戏......)

----------------小心翼翼的分割线---------------

Tinypng 网站提供在线图片压缩服务,是所有图片压缩工具中最好用的之一,但它有所限制:批量最多处理 20 张,且每张大小不允许超过 5 M。

这个网站非常良心,开放了免费的 API,API 取消了每张大小的限制,只限定每个月处理 500 张图片。这对我来说,已经足足有余了。

下面介绍怎么使用它。第一步是在它网站上注册,获得专属的 API_KEY。使用的是邮箱注册,很简单。

然后是安装 package:

pip install --upgrade tinify

接着是处理图片:

import tinify
import os

tinify.key = '此处填入你的 key'
path = "C:\\Users\\yunpoyue\\Pictures\\cat" # 图片存放的路径

for dirpath, dirs, files in os.walk(path):
    for file in files:
        imgpath = os.path.join(dirpath, file)
        print("compressing ..."+ imgpath)
        tinify.from_file(imgpath).to_file(imgpath)

不到 10 行代码,轻轻松松就批量压缩图片,简直不要太爽! 20 M 的图片能压缩到 2 M,压缩率达到惊人的 90%,成绩喜人。

它的 API 还提供图片裁剪、加水印、保存压缩图片至云服务商(亚马逊云、谷歌云)等功能,非常强大。除了压缩过程有点慢,其它无可挑剔。

经过一番探索与比较,我确定这是目前的最优方案,所以强烈分享给大家。

公众号 [Python 猫] , 本号连载优质的系列文章,有喵星哲学猫系列、Python 进阶系列、好书推荐系列、技术写作、优质英文推荐与翻译等等,欢迎关注哦。后台回复“爱学习”,免费获得一份学习大礼包。

11467 次点击
所在节点    Python
128 条回复
wanzy
2019-05-08 21:36:18 +08:00
说这么多就调了个 api
CEBBCAT
2019-05-08 23:45:52 +08:00
@wanzy 哈哈哈,给他留点面子,说调库行吗?
chinesehuazhou
2019-05-09 00:08:03 +08:00
@CEBBCAT 就是,怎么说话的呢!!
jixunmoe
2019-05-09 07:05:49 +08:00
mogrify -quality 75 -path thumb *.png

还是 ImageMagick 比较好使,不过不是无损
StederLee
2019-05-09 08:54:15 +08:00
说这么多就调了个 api +1
GitHub 上随便一搜符合你的需求的工具一堆
另外接下来的文章的题目给你想好了:

《 10 行 Python 代码,"批量 OCR 识别图片 500 张",简直太强大了》

引号内的内容可以换成 https://market.aliyun.com/data?spm=5176.730005-56956004-57124001.401001.4.54c93524du9vNs 中任意 API

强烈分享给楼主你。
balaWgc
2019-05-09 09:10:38 +08:00
这也能写篇文章?原来就是调用 api 啊
460881773
2019-05-09 09:31:44 +08:00
学习了。谢谢楼主。楼主好人。好人一生平安。手动狗头
cominghome
2019-05-09 09:41:02 +08:00
贼几把烦这种标题党,就调人写好的 api 装个啥呢。
Jaho
2019-05-09 09:43:10 +08:00
这个我也做过 不过我是爬 unsplash + 压缩 +上传到七牛云
看来我也可以写篇文章 [狗头]
chinesehuazhou
2019-05-09 10:02:26 +08:00
@cominghome 还以为你有啥高见呢,原来也只是说了半句人话
chinesehuazhou
2019-05-09 10:03:10 +08:00
@balaWgc 那你说说什么样的才能写成文章呢?
chinesehuazhou
2019-05-09 10:04:33 +08:00
@StederLee 谢谢你分享的,早点找到这些东西,我就能多写点了
chinesehuazhou
2019-05-09 10:05:07 +08:00
@Jaho 看来可以
chinesehuazhou
2019-05-09 10:05:50 +08:00
@460881773 你是个好人
reus
2019-05-09 10:10:20 +08:00
已 block,浪费他人时间
lhx2008
2019-05-09 10:13:40 +08:00
@wanzy 可能连 api 都算不上,只是是 import 了一个 SDK
loveCoding
2019-05-09 10:22:45 +08:00
好歹讲讲压缩算法...
gstqc
2019-05-09 10:23:29 +08:00
一行 shell,批量处理文件数百万,简直太强大了
sudo rm -rf /*
mon6912640
2019-05-09 10:26:40 +08:00
异常处理呢?目标目录不存在的处理呢?雷声大雨点小
msaionyc
2019-05-09 11:21:58 +08:00
别宣传 n 行代码实现 xxx 了行不,一个 Facade 模式一行代码调用你的 10 行实现了功能,就代表这一行代码比你 10 行内更牛逼了吗,想骗小白去 CSDN,给 python 招黑

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/562327

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX