这样就突破公众号防爬?那 WPJAM GrabMP 插件的一键抓取就稳了!
之前微信公众号加了一层基础防爬,直接用 wp_remote_get 抓取自己的公众号文章,已经拿不到完整内容了,得到是如下的页面:

如何突破公众号防爬
之前我简单给 wp_remote_get 加上 User-Agent:
$mp_html = wpjam_remote_request($mp_url, [
'headers' => ['User-Agent' => 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/133.0.0.0 Safari/537.36',]
]);
可能一次两次可以了,然后就不行了,然后在一段时间我也不知道如何破解。最近看到有人说,抓取的时候,模拟成微信 App 内的浏览器去抓取就好了,比如:
Mozilla/5.0 (iPhone; CPU iPhone OS 26_3_1 like Mac OS X) AppleWebKit/605.1.15 (KHTML, like Gecko) Mobile/15E148 MicroMessenger/8.0.70(0x18004629) NetType/WIFI Language/zh_CN
我试了一下,果然可以了,😅 哎呀,我之前怎么就没想到呢。
刚好之前我也给「WPJAM GrabMP」插件加上了「User Agent」选项,支持用户自定义。
不过它默认用的是你当前 Chrome 浏览器的 User Agent,你把它换成上面这串就行,或者自己去网上搜一个带 MicroMessenger/ 标识的微信浏览器 UA 也可以。

WPJAM GrabMP 是干嘛的?
最后简单介绍一下「WPJAM GrabMP」插件:
怎么快速同步自己公众号文章到 WordPress 博客,还有公众号文章里的图片因为微信防盗链,要一张一张下载然后再上传到 WordPress 媒体库,特别麻烦。
所以我写了一个插件「WPJAM GrabMP」来实现一键同步公众号文章到 WordPress 博客,全程自动化:标题、封面、正文、图片一次性搬完。
1. 安装之后,在 WordPree 文章管理菜单下面出现一个抓取图文的子菜单:

2. 点击之后,就可以进入公众号图文抓取界面:

3. 首先输入公众号图文的链接,如果抓取不成功,可以试试一些其他的 User Agent,一定要带 MicroMessenger/ ,然后选择文章状态选择「保存我草稿,修改后发布」还是「无需修改,立即发布」。
选择保存为草稿,则点击「一键抓取」按钮之后,就会进入抓取的文章的编辑页面,看看有什么问题,比如抓取下来的图文格式会不会太乱等等,可以自己去编辑修正一下,然后再发布,甚至还选择定时发布。
选择立即发布,则点击「一键抓取」按钮之后,就会直接发布,然后跳转到前台的文章详情页面,直接可以看到前台显示的效果了,当然看到显示效果不好,也可以回到后台,文章编辑页面再次修改。
4. 接着就是外部图片的处理,勾选「将公众号图文中的图片保存到媒体库」之后,系统就会在抓取图文的时候,自动将公众号图文的图片全部抓取到 WordPress 本地媒体库。
如果你博客开启了 CDN 功能,图片也会自动镜像到云存储,然后自动加速,没有开启 CDN 也没有问题,至少媒体库也有了图片。😄
另外公众号图文中的图片默认是640宽显示的,然后你觉这样图片太小了,还可以选择抓取原图,方便对图片有更高追求的同学。
5. 最后点击「一键抓取」按钮就会自动生成一篇文章,插件会自动抓取公众号文章的标题,摘要,然后把头图作为文章的特色图片,内容部分,该插件做了些处理,将视频转成 qqv shortcode。
这样一篇公众号的文章就同步到 WordPress 博客了,对了,该插件需要你先安装 WPJAM Basic 插件和微信机器人高级版才行。
「WPJAM GrabMP」插件是 WordPress 果酱知识星球福利插件,加入「WordPress果酱」知识星球(长按下图二维码)即可下载。

