cruzzz
2024-05-02 23:17:13 +08:00
我不懂代码,但我之前做的事情和你说的类似。我有 A 站(图片反代站,信息丰富,)一枚,然后我想再搞个 B 站,用来做布局精简,顺便拿来测试一些 SEO 手段,看看能否导致 SEO 毁灭。 就去找 GPT 要了一些代码,它给我的代码就类似这样
// 创建上下文
$context = stream_context_create([
'http' => [
'follow_location' => false, // 禁止自动跟随重定向
],
]);
// 获取 HTML 内容
$htmlLines = file($url, false, $context);
$html = implode("", $htmlLines);
// 创建 DOMDocument 对象并加载 HTML 内容
$dom = new DOMDocument();
$dom->loadHTML($html);
// 创建 DOMXPath 对象
$xpath = new DOMXPath($dom);
// 使用 XPath 查询表达式获取所有 article 元素
$articles = $xpath->query('//article');
// Initialize the result array
$result = array();
// 遍历每个 article 元素
foreach ($articles as $article) {
前提就是,网页地址和模板相对来说很好找规则,否则这个 dom 不容易定位。
这样的效果就是:B 站重新搞个模板,布局换一换,数据全都是临时去 A 站请求的。
然后……谷歌还收录了几万个,现在养了一段时间,bing+google 的日 IP 也上 1K 了= =