求助: PHP 提取大段字符串中的 img ,然后将处理过的 src 替换回去

2018-06-02 17:53:26 +08:00
 ainpy
具体需求是,把 A 程序数据库的文章批量导入 B 程序数据库,

这样会有一个问题,A 程序里 content 的图片的格式是 img src=/upload/xxx/xxx.jpg

需要写个方法下载 content 里的图片(需要提取 img,然后在 /upload 前加上域名)、改变 src 的值(将下载的图片的路径写到 content 对应的 img)替换

目前的思路是

正则匹配出 content 里的所有 img,然后下载,得到路径,替换原 content 对应的 img src

想的通, 写不出来, 尴尬了


例:
$str =
"<p>V 站的程序员都好牛 b</p>,<img src=\"/uploads/allimg/170427/10330HO4-0.jpg\"> 巴拉巴拉 <img src=\"/uploads/allimg/170427/10330HO5-1.png\"> <div>你们最帅了</div>";

要得到的结果,
下载$str 里的图片,得到路径,重写 src
2925 次点击
所在节点    PHP
11 条回复
zjsxwc
2018-06-02 18:00:33 +08:00
html parser 了解下
ainpy
2018-06-02 18:04:04 +08:00
我不是要写爬虫啊, 我是在 php 链接远程数据库,拿到数据后需要提取字符串里的图片,然后下载图片到本地,得到路径后,替换字符串里对应图片的地址,然后入库。
DavidNineRoc
2018-06-02 18:12:09 +08:00
一楼说的对
DavidNineRoc
2018-06-02 18:12:19 +08:00
掘金的效果?
update
2018-06-02 18:19:04 +08:00
付费解决吧
laobaozi
2018-06-02 18:31:54 +08:00
做过整个数据库迁移的 只能一条一条处理
laobaozi
2018-06-02 18:34:28 +08:00
首先正则匹配 content 所有的 src 安按顺序下载图片并上传 再依次替换
laobaozi
2018-06-02 18:37:12 +08:00
或者 旧站点的所有图片按原来的层级全部下载到复制到新站点的某个目录 这样只需要只修改 content
demonchang
2018-06-02 19:12:11 +08:00
whyiyhw
2018-06-02 20:25:56 +08:00
手册正则替换里面 preg_match_all 的第一个例子,你可以看下,我之前为了拿富文本编辑器内容里面的文字和图片,也被正则卡了半天。
Junjunya
2018-06-04 00:01:56 +08:00
……看了半天,难道不是一个简单的 正则匹配 img 的 src 然后替换的操作么?

<?php

$str =
"<p>V 站的程序员都好牛 b</p>,<img src=\"/uploads/allimg/170427/10330HO4-0.jpg\"> 巴拉巴拉 <img src=\"/uploads/allimg/170427/10330HO5-1.png\"> <div>你们最帅了</div>";
$b= preg_replace("/<img src=\"(.*?)\"(.*?)\>/i", '<img src="' . 'http://baidu.com' . '$1" $2 />', $str);
echo $b;

是这个样子么

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/459858

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX