1. 首页
  2. IT资讯

怎样写一个能够校验复杂规则的正则表达式?

“u003Cdivu003Eu003Ch1u003E写在前面u003Cu002Fh1u003Eu003Cpu003E每当提到正则表达式,身边很多朋友的反应是这样的:u003Cu002Fpu003Eu003Cpu003E“那玩意儿最好不要用,没法维护!”,u003Cu002Fpu003Eu003Cpu003E“太复杂,不常用,学不来” ….u003Cu002Fpu003Eu003Cpu003E不可否认,正则的表达形式,让人看起来的确有些难以理解,如果某天你接手维护一段代码,当你满怀好奇地打开代码文件,发现里面很多代码长成这个样子:u003Cu002Fpu003Eu003Cpreu003Elet funCallRegExp = u002F(^(\s+)?(((?!(class|function))([a-zA-Z_][a-zA-Z0-9_]*))(\(((\s+)?((?!(class|function))([a-zA-Z_][a-zA-Z0-9_]*))(\s+)?)(,((\s+)?((?!(class|function))([a-zA-Z_][a-zA-Z0-9_]*))(\s+)?))*\)))(\s+)?(,(\s+)?(((?!(class|function))([a-zA-Z_][a-zA-Z0-9_]*))(\(((\s+)?((?!(class|function))([a-zA-Z_][a-zA-Z0-9_]*))(\s+)?)(,((\s+)?((?!(class|function))([a-zA-Z_][a-zA-Z0-9_]*))(\s+)?))*\)))(\s+)?)*)$u002Fgm;u003Cbru003Eu003Cu002Fpreu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp3.pstatp.comu002Flargeu002Fpgc-imageu002F3ce6246edb4342868e5eff28e8f3b431″ img_width=”224″ img_height=”221″ alt=”怎样写一个能够校验复杂规则的正则表达式?” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Cpu003E显然,这样的代码是无法维护的。但是我可以从中揣测出来,它一定是做了一个比较复杂的验证。其实对于这种使用正则做复杂校验的情况,并不等同于洪水猛兽,也是有迹可循的,下面我就给出一种情况,并给出解决方案,希望可以抛砖引玉。u003Cu002Fpu003Eu003Ch1u003E问题来了u003Cu002Fh1u003Eu003Cpu003E现在有一种类似于函数调用的语法,这种调用大概是这样的:u003Cu002Fpu003Eu003Cpreu003Esum(param1, param2), avg(score)u003Cbru003Eu003Cu002Fpreu003Eu003Cpu003E下面列出了接近30多个case来描述对这个语法的各种限制:u003Cu002Fpu003Eu003Cpreu003Edescribe(“validate”, () => {u003Cbru003E it(“不同方法的调用用逗号分隔,逗号两侧可用空格分隔,也可不分隔”, () => {u003Cbru003E expect(validate(“sum(param1),avg(score)”)).toBe(true);u003Cbru003E expect(validate(“sum(param1) ,avg(score)”)).toBe(true);u003Cbru003E expect(validate(“sum(param1) , avg(score)”)).toBe(true);u003Cbru003E expect(validate(“sum(param1) avg(score)”)).toBe(false);u003Cbru003E expect(validate(“sum(param1)avg(score)”)).toBe(false);u003Cbru003E });u003Cbru003E it(“整个语句开头或末尾不能出现逗号或无关文字(空格除外)”, () => {u003Cbru003E expect(validate(” sum(param1),avg(b)”)).toBe(true);u003Cbru003E expect(validate(” sum(param1),avg(b) “)).toBe(true);u003Cbru003E expect(validate(“sum(param1),avg(b) “)).toBe(true);u003Cbru003E expect(validate(“a sum(test),avg(a)”)).toBe(false);u003Cbru003E expect(validate(” sum(param1),avg(b)12″)).toBe(false);u003Cbru003E expect(validate(“sdf sum(param1),avg(b) sdf”)).toBe(false);u003Cbru003E });u003Cbru003E it(“函数名&参数:字母或者下划线打头,可由字母数字下划线组成”, () => {u003Cbru003E expect(validate(“sum(a)”)).toBe(true);u003Cbru003E expect(validate(“sum(a0)”)).toBe(true);u003Cbru003E expect(validate(“_sum(a0)”)).toBe(true);u003Cbru003E expect(validate(“_sum0(_a0)”)).toBe(true);u003Cbru003E expect(validate(“_sum0(_)”)).toBe(true);u003Cbru003E expect(validate(“_sum0(1)”)).toBe(false);u003Cbru003E expect(validate(“_sum0(1a)”)).toBe(false);u003Cbru003E expect(validate(“2aa(a)”)).toBe(false);u003Cbru003E });u003Cbru003E it(“函数名&参数:不能包含保留字 class || function”, () => {u003Cbru003E expect(validate(“afunctiona(a,b)”)).toBe(true);u003Cbru003E expect(validate(“functiona(a,b)”)).toBe(true);u003Cbru003E expect(validate(“class(a), a(a,b)”)).toBe(false);u003Cbru003E expect(validate(“function(a,b)”)).toBe(false);u003Cbru003E expect(validate(“function(a,b)”)).toBe(false);u003Cbru003E expect(validate(“sum(a,function)”)).toBe(false);u003Cbru003E expect(validate(“sum(class,b)”)).toBe(false);u003Cbru003E expect(validate(“class1(a,b)”)).toBe(true);u003Cbru003E expect(validate(“function1(a,b)”)).toBe(true);u003Cbru003E });u003Cbru003E it(“参数间可以存在空格”, () => {u003Cbru003E expect(validate(“sum(a ,b ,c)”)).toBe(true);u003Cbru003E expect(validate(“sum( a , b ,c)”)).toBe(true);u003Cbru003E expect(validate(“sum( a , b ,c) , avg(d,e , fff)”)).toBe(true);u003Cbru003E });u003Cbru003E it(“函数调用可以不传参数”, () => {u003Cbru003E expect(validate(“sum()”)).toBe(true);u003Cbru003E expect(validate(“sum( )”)).toBe(true);u003Cbru003E });u003Cbru003E});u003Cbru003Eu003Cu002Fpreu003Eu003Ch1u003E解决方案u003Cu002Fh1u003Eu003Cpu003E越是复杂的问题,越需要对这个问题进行拆解,将它转换为一系列简单的子问题,这些简单的子问题,我们可以很容易的使用正则给出解决方案,然后将这些方案逐一组合起来,也就形成了最终方案。u003Cu002Fpu003Eu003Cpu003E在这里,可以把我们需要验证的内容拆成一下的部分:u003Cu002Fpu003Eu003Cpu003E0 . 空格 = 可以出现0个或多个空格u003Cu002Fpu003Eu003Cpu003E1 . 参数 = 由字母或下划线开头,字母数字或下划线组成u003Cu002Fpu003Eu003Cpu003E2 . 无保留字参数 = 参数 && 不包含关键词u003Cu002Fpu003Eu003Cpu003E3 . 可包含空格参数 = 无保留字参数 && 参数头尾可以出现0个或多个空格 u003Cu002Fpu003Eu003Cpu003E4 . 参数集 = 多个参数的组合,参数可以是 1 个或多个u003Cu002Fpu003Eu003Cpu003E5 . 参数块 = 参数集 + 左右括号 ,可以没有参数集,此时括号内为空,但可以出现0个或多个空格 eg . sum() or sum( )u003Cu002Fpu003Eu003Cpu003E6 . 函数名 = 无保留字参数 u003Cu002Fpu003Eu003Cpu003E7 . 函数调用 = 函数名+参数块u003Cu002Fpu003Eu003Cpu003E8 . 可包含空格的函数调用 = 函数调用 && 函数调用头尾可以出现0个或多个空格 u003Cu002Fpu003Eu003Cpu003E9 . 多函数调用 = 多个函数调用的组合,函数调用可出现1个或多个u003Cu002Fpu003Eu003Cpu003E10. 最终结果 = 多函数调用 && 头尾不包含除空格外的其它内容u003Cu002Fpu003Eu003Cpu003E有了以上的的思路,验证方案就已经呼之欲出了,贴出代码:u003Cu002Fpu003Eu003Cpreu003Efunction validate(inputStr) {u003Cbru003E u002Fu002F 0. 空格 = 可以出现0个或多个空格u003Cbru003E const spaceOrEmpty = ` *`; u002Fu002F 匹配多个空格或空u003Cbru003E u002Fu002F 1. 参数 = 由字母或下划线开头,字母数字或下划线组成u003Cbru003E const param = `[a-zA-Z_][a-zA-Z0-9_]*`;u003Cbru003E u002Fu002F 2. 无保留字参数 = 参数 && 不包含关键词u003Cbru003E const paramWithoutReservedWords = `(?!\\bclass\\b|\\bfunction\\b)(${param})`;u003Cbru003E u002Fu002F 3. 可包含空格参数 = 无保留字参数 && 参数头尾可以出现0个或多个空格u003Cbru003E const paramWithSpaceWithoutReservedWords = `${spaceOrEmpty}${paramWithoutReservedWords}${spaceOrEmpty}`;u003Cbru003E u002Fu002F 4. 参数集 = 多个参数的组合,参数可以是 1 个或多个u003Cbru003E const params = `(${paramWithSpaceWithoutReservedWords}(,${paramWithSpaceWithoutReservedWords})*)`;u003Cbru003E u002Fu002F 5. 参数块 = 参数集 + 左右括号 ,可以没有参数集,此时括号内为空,但可以出现0个或多个空格 eg . sum() or sum( )u003Cbru003E const paramsBlock = `\\(${params}?${spaceOrEmpty}\\)`;u003Cbru003E u002Fu002F 6. 函数名 = 无保留字参数u003Cbru003E const funName = paramWithSpaceWithoutReservedWords;u003Cbru003E u002Fu002F 7. 函数调用 = 函数名+参数块u003Cbru003E const funCall = `${funName}${paramsBlock}`;u003Cbru003E u002Fu002F 8. 可包含空格的函数调用 = 函数调用 && 函数调用头尾可以出现0个或多个空格u003Cbru003E const funCallWithSpace = `${spaceOrEmpty}${funCall}${spaceOrEmpty}`;u003Cbru003E u002Fu002F 9. 多函数调用 = 多个函数调用的组合,函数调用可出现1个或多个u003Cbru003E const multipleFunCall = `${funCallWithSpace}(,${funCallWithSpace})*`;u003Cbru003E u002Fu002F 10.最终结果 = 多函数调用 && 头尾不包含除空格外的其它内容u003Cbru003E const finalFunCall = `^${multipleFunCall}$`;u003Cbru003E const reg = new RegExp(finalFunCall);u003Cbru003E return reg.test(inputStr);u003Cbru003E}u003Cbru003Eu003Cu002Fpreu003Eu003Cdiv class=”pgc-img”u003Eu003Cimg src=”http:u002Fu002Fp1.pstatp.comu002Flargeu002Fpgc-imageu002F75880c770de84ab195c5af3cfe8280fd” img_width=”1474″ img_height=”484″ alt=”怎样写一个能够校验复杂规则的正则表达式?” inline=”0″u003Eu003Cp class=”pgc-img-caption”u003Eu003Cu002Fpu003Eu003Cu002Fdivu003Eu003Ch1u003E后记u003Cu002Fh1u003Eu003Cpu003E以上每一步验证的具体细节,我就没有在细述了,我相信还有其它的写法,而且不同的人可能还有不同的拆解方案,但我更想表达的是在面对复杂问题时,我们要学会利用降维的思想 ,自顶而下,把问题转化为许多细小的问题,u003Cu002Fpu003Eu003Cpu003E这些小的问题都是易于解决的,最终再将这些小问题组合起来,终窥其全貌!!!u003Cu002Fpu003Eu003Cu002Fdivu003E”

原文始发于:怎样写一个能够校验复杂规则的正则表达式?

主题测试文章,只做测试使用。发布者:℅傍ㄖ免沦陷dε鬼,转转请注明出处:http://www.cxybcw.com/11230.html

联系我们

13687733322

在线咨询:点击这里给我发消息

邮件:1877088071@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

QR code