邀朋友种豆,一起分享吧
喜欢购买正品行货?那就去品牌街

用正则表达式获得指定标签的内容

来自:种豆 时间:2017-12-29 阅读:672次 原文链接
对如下一段Html代码,设计一个正则表达式,要求匹配item里的title而不匹配channel里的title。 <channel>
<title>这里的内容不需要提取</title>
</channel>
<item>
<title>这里是需要提取的内容</title>
</item>
<item>
<title>《卖火柴的小女孩》</title>
</item>
<item>
<title>安娜</title>
</item>
<item>
<title>使用正则表达式获得指定标签内容的解决方案</title>
</item>
1.匹配title标签 /<title>[\s\S]*?<\/title>/gi 首先是title标签,内容为任意字符若干个,然后是title结束标签。这个正则已经能匹配到所有的title标签。
2.做一下简单的修改 /<title>[^<>]*?<\/title>/gi因为title里面不应该再嵌有其它标签,这个正则同样是匹配所有标题的内容,最后再加上不去匹配channel中的title。
3.整个正则表达式 /<title>[^<>]*?<\/title>(?!\s*<\/channel>)/gi (?!\s*<\/channel>)表示要匹配字符串的后面不能跟着若干个空格和一个channel的结束标签。

 
关于种豆 ┊ 联系我们 ┊ 免责声明 ┊ 发帖须知 ┊ 请提意见 ┊ 站点地图
本站为个人爱好兴趣分享网站,不代表本人观点,如有侵权请联系QQ3371650278进行处理
sowsoy.com 版权所有 Copyright©2010-2020 浙ICP备10212932号
Email:sowsoy#hotmail.com