immich 重磅更新 OCR

2025 年 10 月 31 日
 fuchaofather

immich 最新 release开始正式支持 OCR ,当前近乎已经是相册管理的完全体了。

分享下我的硬件:

8132 次点击
所在节点    NAS
61 条回复
unhappy224
2025 年 10 月 31 日
我想问问这套硬件跑起来会有性能问题吗?例如新导入几千张照片这样,扫描要多久?
如果买好点的 n150 甚至是 7840 那一堆,会快多少?
kuanos
2025 年 10 月 31 日
immich 在 qnap 上每次布置都失败,很绝望啊
Aprdec
2025 年 10 月 31 日
immich app 一次上传几百张 有 bug
fuchaofather
2025 年 10 月 31 日
@unhappy224 跟你选的模型也有关系,可以参考(官方文档)[https://docs.immich.app/features/searching]根据你的配置(内存、ARM 、CUDA 还是 RKNN )选择合适的模型。我的 oect 是 RKNN+4G 内存所以选择了`ViT-B-16-SigLIP-i18n-256__webli`,图片识别大概 1 秒 3-4 张的样子,OCR 因为 CPU 比较孱弱 6 秒一张
mooyo
2025 年 10 月 31 日
一更新就挂了。。
[Nest] 6 - 10/31/2025, 10:33:29 AM LOG [Microservices:WebsocketRepository] Initialized websocket server

Error: getaddrinfo EAI_AGAIN database

at GetAddrInfoReqWrap.onlookupall [as oncomplete] (node:dns:122:26) {

errno: -3001,

code: 'EAI_AGAIN',

syscall: 'getaddrinfo',

hostname: 'database'

}

microservices worker error: Error: getaddrinfo EAI_AGAIN database, stack: Error: getaddrinfo EAI_AGAIN database

at GetAddrInfoReqWrap.onlookupall [as oncomplete] (node:dns:122:26)

microservices worker exited with code 1

Killing api process

没看到 release 上写了啥 breaking changes 啊。。
fuchaofather
2025 年 10 月 31 日
@mooyo 你是哪个版本上来的啊,我每个版本都在跟没啥问题
mooyo
2025 年 10 月 31 日
@fuchaofather #6 解决了。。看了下日志,是我的 pg 数据库启动的时候发现没空间,没拉起来。

没空间的原因是我的这个虚拟机(跑在 mac mini 上的)只分配了 30G 空间( photo 是网络挂载的),我以为够了,其实已经被 docker 镜像塞满了。。
lu5je0
2025 年 10 月 31 日
还差个 ultra HDR
mogita
2025 年 10 月 31 日
同在 OECT 上运行,五千多照片视频,简直游刃有余。
mooyo
2025 年 10 月 31 日
mac mini 上有办法搞到硬件加速么?跑 docker 上看起来 OCR 性能不太行
NoDataNoBB
2025 年 10 月 31 日
有支持中文地图的方案吗
faketemp
2025 年 10 月 31 日
immich 虽好部署维护太难了 一不小心各种报错 gpu 核显调用也各种配置各种问题 折腾几次都很难完美跑起来 等有一键整合版再研究🧐
SenLief
2025 年 10 月 31 日
@NoDataNoBB 图源应该没办法改吧,只能把城市这些改为中文。
chenluo0429
2025 年 10 月 31 日
ocr 是真的慢,从早上开始的任务,15000 的资源 3 个并发,现在还有 1000+没跑完
fuchaofather
2025 年 10 月 31 日
@mooyo #10 我试过,有难度。你可以去 discuss 里找找看
mooyo
2025 年 10 月 31 日
@fuchaofather #15 感谢指引,看到了。

思路是单独运行 machine-learning-svr 到一个支持 ml 的环境(裸环境直连 gpu ,tpu )。

这个思路适用于存算分离的场景
Xiaosteven
2025 年 10 月 31 日
我用 3090 的训练 ocr 真的慢,10 个并发直接干重启,改成 3 个并发,平均 10 秒 3 个...
Vanquish5419
2025 年 10 月 31 日
sky300
2025 年 10 月 31 日
实在折腾不起了 直接入了个 MTPhotos ,省心了。
rfrftt
2025 年 10 月 31 日
ocr j4125 上 nllb-clip-large-siglip__v1 模型, 差不多 20s 处理一张图

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/1169604

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX