盾茄网:接上一篇文章PHP教程之获取网站ico文件地址后,再分享一下如何获取网站tdk(标题,关键词,描述)等内容,百度一搜也有很多方法,但是呢,都是各有不同,用别人的接口不如自己写一个接口,一劳永逸,因为用别人的接口也不知道什么时候会失效,下面就一起看看怎么获取网站的TDK吧。
$array = get_meta_tags("https://www.lkba.cn/"); var_dump($array);
使用自带的get_meta_tags方法即可快速获取,但是不能获取标题,不过关键词和描述及其他一些meta值也能获取,可以自己试试。还有就是get_meta_tags 方法默认是 utf-8 编码,如果遇到 gbk、gb2312编码,则会出现乱码,需要自己用mb_convert_encoding方法转换一下编码,也可以在php文件添加如下代码:
header("content-type:text/html; charset=gb2312");
前提是得知道页面默认编码。
这里的办法就是直接获取整个页面,然后正则匹配tdk的规则获取内容。
对于抓取网页,就不用多说,如果file_get_contents获取网页失败,就用curl方法获取。
获取网页后,然后开始匹配meta标签,由于meta标签有几种不同的写法,所以获取起来也是不一样,在此分享一个比较全面的方法。
此处为隐藏内容,请评论后查看隐藏内容,谢谢!
如果您已经评论了,请点击 刷新 后查看资源哦~
博主专注于Z-BLOG网站搭建、网站优化以及电脑故障排查、重装、优化、维修系统等,QQ/WX:2126245521(请注明来意)
下一篇:PHP教程之获取网站状态码
Copyright © 2020-2023 Jack作品 Reserved.
Powered By Z-Blog Sitemap | 蜀ICP备2023025269号-1
Processed : 0.035 SQL : 24
本文暂无评论 - 欢迎您