正值表达式匹配html标签的属性值

站长资源 2026/7/22 佚名

18 1538 18

DDR爱好者之家 Design By 杰米

正则表达式是做文本解析工作必不可少的技能。如Web服务器日志分析，网页前端开发等。很多高级文本编辑器都支持正则表达式的一个子集，熟练掌握正则表达式，经常能够使你的一些工作事半功倍。例如统计代码行数，只需一个正则就搞定。嵌套Html标签的匹配是正则表达式应用中一个比较难的话题，因为它涉及到的正则语法比较多，也比较难。因此也就更有研究的价值。

今天由于工作的需求，需要获取html标签的属性值，立即想到了正则表达式，标签如下：

<circle id="ap_test" cx="200" cy="2000" r="2" stroke="black" stroke-width="0" fill="red"/>
<circle id="ap_test" cx="201" cy="2001" r="2" stroke="black" stroke-width="0" fill="red"/>
<circle id="ap_test" cx="202" cy="2002" r="2" stroke="black" stroke-width="0" fill="red"/>
<circle id="ap_test" cx="203" cy="2003" r="2" stroke="black" stroke-width="0" fill="red"/>

需要获取<circle />标签的cx、cy的属性值，想了一会写出了一个：

$circle是上面的circle标签的内容

preg_match_all('/<\s*circle\s+[^>]*")(.*")(.*"color: #ff0000">下面给大家介绍下正则匹配闭合HTML标签（支持嵌套）
任何复杂的正则表达式都是由简单的子表达式组成的，要想写出复杂的正则来，一方面需要有化繁为简的功底，另外一方面，我们需要从正则引擎的角度去思考问题。关于正则引擎的原理，推荐《Mastering Regular Expression》中文名叫《精通正则表达式》。挺不错的一本书。
OK，先确定我们要解决的问题——从一段Html文本中找出特定id的标签的innerHTML。
这里面最大的难点就是，Html标签是支持嵌套的，怎么能够找到指定标签相对应的闭合标签呢？
我们可以这样想，先匹配最前面的起始标签，假设是div吧（<div），接着一旦遇到嵌套div，就“压入堆栈”，后面如果遇到div闭合标签了，就“弹出堆栈”。如果遇到闭合标签的时候，堆栈里面已经没有东西了，那么匹配结束，此结束标签为正确的闭合标签。
我之所以能够这样去思考，是因为我了解过正则的特性，我知道正则中的平衡组能够实现我刚才说的“堆栈”操作。所以，如果我们要编写复杂正则表达式，需要对正则的一些高级特性至少有所了解，这样我们思考问题才有个方向。
================================
匹配任意闭合HTML标签的正则表达式：




<("htmlcode">

<("htmlcode">

<("']?)footer(?(Quote)\k<Quote>)[^>]*?(/>|>((?<Nested><\k<HtmlTag>[^>]*>)|</\k<HtmlTag(?<-Nested>)|.*?)*</\k<HtmlTag)


这个正则匹配任意id为footer的HTML标签



                                
                                
                                    匹配标签的正则表达式,正则表达式匹配标签 
                                DDR爱好者之家 Design By 杰米

广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）
免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！

DDR爱好者之家 Design By 杰米

评论“正值表达式匹配html标签的属性值”

暂无评论...

更新日志

2026年07月22日

搜索

关键字搜索

正值表达式匹配html标签的属性值

去掉字符串前后所有空格的正则表达式

Java正则表达式提取字符的方法实例

评论“正值表达式匹配html标签的属性值”

更新日志

友情链接