超強變態的正則(\w)((?=\1\1\1)(\1))+講解

 更新時間:2020-02-26 19:43:02   作者:佚名   我要評論(0)

這個正則出自這個網站 http://www.regexlab.com/zh/regref.htm
正向預搜索:"(?=xxxxx)","(?!xxxxx)"
格式:"(?=xxxxx)",在被匹配的字符串中,它對所

這個正則出自這個網站 http://www.regexlab.com/zh/regref.htm

正向預搜索:"(?=xxxxx)","(?!xxxxx)"

格式:"(?=xxxxx)",在被匹配的字符串中,它對所處的 "縫隙" 或者 "兩頭" 附加的條件是:所在縫隙的右側,必須能夠匹配上 xxxxx 這部分的表達式。因為它只是在此作為這個縫隙上附加的條件,所以它并不影響后邊的表達式去真正匹配這個縫隙之后的字符。這就類似 "\b",本身不匹配任何字符。"\b" 只是將所在縫隙之前、之后的字符取來進行了一下判斷,不會影響后邊的表達式來真正的匹配。

點擊測試 舉例1:表達式 "Windows (?=NT|XP)" 在匹配 "Windows 98, Windows NT, Windows 2000" 時,將只匹配 "Windows NT" 中的 "Windows ",其他的 "Windows " 字樣則不被匹配。

點擊測試 舉例2:表達式 "(\w)((?=\1\1\1)(\1))+" 在匹配字符串 "aaa ffffff 999999999" 時,將可以匹配6個"f"的前4個,可以匹配9個"9"的前7個。這個表達式可以讀解成:重復4次以上的字母數字,則匹配其剩下最后2位之前的部分。當然,這個表達式可以不這樣寫,在此的目的是作為演示之用。

例子:例如 999999999 或 666666

1、(\w)((?=\1\1\1)(\1))+

最后的+號意思是一個或多個 意思就是 666666之匹配前四個6,而999999999只匹配前面7個,后面反正要留兩個
因為用了(?=\1\1),每次只匹配兩個,但保證右側有99,每次都取兩個,每次都包括之前的一個

(\w)((?=\1\1\1)(\1))+在999999999 中實際上是被匹配了6次。
第一次:(\w)取出第一個9,(?=\1\1\1)限定第2個9到第4個9,(\1)取出第2個9,得到99
第二次:(?=\1\1\1)限定第3個9到第5個9,(\1)取出第3個9,得到999
第三次:(?=\1\1\1)限定第4個9到第6個9,(\1)取出第4個9,得到9999
第四次:(?=\1\1\1)限定第5個9到第7個9,(\1)取出第5個9,得到99999
第五次:(?=\1\1\1)限定第6個9到第8個9,(\1)取出第6個9,得到999999
第六次:(?=\1\1\1)限定第7個9到第9個9,(\1)取出第7個9,得到9999999

2、(\w)((\1)(?=\1\1))+

第一次 \w取出第一個9,\1再取1個9就是 99 后面緊跟兩個9才符合條件 所有第一次就是99
第二次 從第3個9到第四個9, 開始就\1 再取一個 999
第三次 匹配從第4-6個9   取一個 9999
第四次 從第5-7個9取一個 取一個99999
第五次 從第6-8個9 取一個 是  999999
第六次 從第7-9個9 后面仍滿足取一個是 9999999
第七次  第8個開始右側已經不夠三個9了,所有取消匹配,匹配之前的7個9

3、 (?<=<(\w+)>).*(?=<\/\1>)

詳細解釋下:?<=和?=都表示零寬斷言,一個匹配后面一個匹配前面,
對應到上面的例子中,亦即.*前面必須要有<(\w+)>,后面必須要有<\/\1>。
零寬斷言不體現到最終的匹配結果中。
再細看下,<(\w+)>匹配<tag>類型,\w表示數字、字母、下劃線;<\/\1>中\/匹配斜杠/,
\1表示捕獲組,亦即從正則表達式左邊開始的第一個小括號中的內容,注意這里不包含零寬斷言的括號,在上例中表示(\w+)中的部分。
中間的.*表示任意多個非換行符。

總結下:匹配類似<tag>content</tag>格式中的content部分

不過經過測試網頁版的js匹配不到,還是Regex Match Tracer中比較好用,推薦大家下載學習

網頁版看不到效果

用軟件就可以

所有大家在使用的時候,要測試你的語言是否支持。

正則表達式看懂的最好方法就是一步步分開解析:

1)以 '.*' 為分界,前面括號中的內容可以劃分為  ‘?<=' 和 ‘<(\w+)>',其中‘<(\w+)>'表示匹配尖括號里面是字母、數字或下劃線的內容,類似<span>,外面還要加個括號是要實現分組;而‘?<='用到的是零寬斷言語法,表示的是斷定‘<(\w+)>'后面有或沒有內容,而且與內容的間隔寬度為零。
2)再看' .* '后面的部分,括號里面的內容可以分為 ‘?=' 和 ‘<(\/\1>',其中‘?='用零寬斷言表示匹配‘<(\/\1>'前面的部分,而對于‘<(\/\1>',‘\/'匹配‘/'符號,類似</span>,這里可能有些同學不太明白‘\1'是什么意思?這里用到的是捕獲分組的思想,上述提到的‘<(\w+)>'外面加個小括號就表示一個分組,對于正則表達式的分組結果,索引 0表示匹配的整個內容,而1表示的是第1個子分組,所以這里的'\1'指向的就是前面的第一個分組‘<(\w+)>',\2表示重復第2個子項,\n表示重復第n個子項;
3).* 就比較簡單了,表示的是匹配 除了換行符意外的任意字符0次或多次。
綜上,改表達式匹配的是類似html標簽這種內容的,如<body>你好,正則!</body>

下面是腳本之家小編寫的打算將不帶style的span替換為空的正則。

str=str.replace(/<span\s*?(?!:style)>(.[^<>]*)<\/span>/ig,"$1");

不可能用的,要不所有的內容都亂了。

文中相關測試工具

JavaScript正則表達式在線測試工具

Regex Match Tracer

下面接這個為大家分享這幾個高級規則

預搜索,不匹配;反向預搜索,不匹配
前面的章節中,我講到了幾個代表抽象意義的特殊符號:"^","$","\b"。它們都有一個共同點,那就是:它們本身不匹配任何字符,只是對 "字符串的兩頭" 或者 "字符之間的縫隙" 附加了一個條件。理解到這個概念以后,本節將繼續介紹另外一種對 "兩頭" 或者 "縫隙" 附加條件的,更加靈活的表示方法。

正向預搜索:"(?=xxxxx)","(?!xxxxx)"

格式:"(?=xxxxx)",在被匹配的字符串中,它對所處的 "縫隙" 或者 "兩頭" 附加的條件是:所在縫隙的右側,必須能夠匹配上 xxxxx 這部分的表達式。因為它只是在此作為這個縫隙上附加的條件,所以它并不影響后邊的表達式去真正匹配這個縫隙之后的字符。這就類似 "\b",本身不匹配任何字符。"\b" 只是將所在縫隙之前、之后的字符取來進行了一下判斷,不會影響后邊的表達式來真正的匹配。

點擊測試 舉例1:表達式 "Windows (?=NT|XP)" 在匹配 "Windows 98, Windows NT, Windows 2000" 時,將只匹配 "Windows NT" 中的 "Windows ",其他的 "Windows " 字樣則不被匹配。

點擊測試 舉例2:表達式 "(\w)((?=\1\1\1)(\1))+" 在匹配字符串 "aaa ffffff 999999999" 時,將可以匹配6個"f"的前4個,可以匹配9個"9"的前7個。這個表達式可以讀解成:重復4次以上的字母數字,則匹配其剩下最后2位之前的部分。當然,這個表達式可以不這樣寫,在此的目的是作為演示之用。

格式:"(?!xxxxx)",所在縫隙的右側,必須不能匹配 xxxxx 這部分表達式。

點擊測試 舉例3:表達式 "((?!\bstop\b).)+" 在匹配 "fdjka ljfdl stop fjdsla fdj" 時,將從頭一直匹配到 "stop" 之前的位置,如果字符串中沒有 "stop",則匹配整個字符串。

點擊測試 舉例4:表達式 "do(?!\w)" 在匹配字符串 "done, do, dog" 時,只能匹配 "do"。在本條舉例中,"do" 后邊使用 "(?!\w)" 和使用 "\b" 效果是一樣的。

反向預搜索:"(?<=xxxxx)","(?<!xxxxx)"

這兩種格式的概念和正向預搜索是類似的,反向預搜索要求的條件是:所在縫隙的 "左側",兩種格式分別要求必須能夠匹配和必須不能夠匹配指定表達式,而不是去判斷右側。與 "正向預搜索" 一樣的是:它們都是對所在縫隙的一種附加條件,本身都不匹配任何字符。

舉例5:表達式 "(?<=\d{4})\d+(?=\d{4})" 在匹配 "1234567890123456" 時,將匹配除了前4個數字和后4個數字之外的中間8個數字。由于 JScript.RegExp 不支持反向預搜索,因此,本條舉例不能夠進行演示。很多其他的引擎可以支持反向預搜索,比如:Java 1.4 以上的 java.util.regex 包,.NET 中System.Text.RegularExpressions 命名空間,以及本站推薦的最簡單易用的 DEELX 正則引擎。

到此這篇關于超強變態的正則(\w)((?=\1\1\1)(\1))+講解的文章就介紹到這了,更多相關正則表達式高級規則內容請搜素腳本之家以前的文章或下面相關文章,希望大家以后多多支持腳本之家!

相關文章

最新評論

老快3投注技巧 新疆11选五5最热的号 澳博瑞特配资 内蒙古十一选五平台 黑龙江福彩p62中奖号码 有没有用真钱打麻将的app 湖北十一选五走势一定牛 贵州11选5一定牛遗漏 三分彩玩法介绍 黑龙江11选5前三走势图 2020全年资料内部 排列七开奖号码是多少 多乐彩11选5规则 黑龙江6+1开奖 内蒙古11选五任五遗漏一定牛 排列五直播网易 时时彩软件能提现吗