--- title: 正则表达式重新入门(2) date: 2018-12-24 10:11:46 categories: - JavaScript tags: - 正则表达式 --- ### 修饰符 修饰符是作用于整个表达式的附加属性 对于两种创建RegExp对象的方式 有各自对应的指定修饰符的语法 ```javascript let reg1 = /^\w+$/g let reg2 = new RegExp('^\\w+$', 'g') ``` + `g` : 全局搜索, 对应RegExp对象中的**global**属性 + `i` : 忽略大小写, 对应RegExp对象中的**ignoreCase**属性 + `m` : 多行搜索, 对应RegExp对象中的**multiline**属性 #### 关于multiline g全局搜索 和 i忽略大小写都很容易理解 `m`多行搜索, 有以下的特性 + 字符串中没有换行符(可以是\r\n或者\n), m修饰符没有作用 + 正则表达式中没有^或$匹配字符串的开头或结尾, m修饰符没有作用 > 多行字符串的语法 1. 可以在字符串中加入\n 2. 可以使用ES6的字符串模板语法 ```javascript var str1 = `ab cd` // 等价于 var str2 = `ab\ncd` ``` 正则表达式多行匹配 ```javascript const singleline = /^ab/ const multiline = /^ab/m var str1 = `ef ab` var str2 = `ab ef` singleline.test(str1) // false multiline.test(str1) // true singleline.test(str2) // true multiline.test(str2) // true ``` 对于具备multiline属性的正则对象 `^`由原本的匹配整个字符串的开头, 变为匹配每一行的开头 `$`由原本的匹配整个字符串的结尾, 变为匹配每一行的结尾 所以^和$都没有的, 添加m修饰符是不起作用的 #### RegExp对象中的其他属性 + lastIndex : 当前表达式匹配内容的最后一个字符的下一个位置 + source : 正则表达式的文本字符串 ### RegExp对象内置方法 #### test test方法用于检测一个字符串是否匹配指定的正则, 返回true或false ```javascript const reg1 = /\d/ reg1.test('12') // true reg1.test('12') // true reg1.test('12') // true const reg2 = /\d/g reg2.test('12') // true reg2.test('12') // true reg2.test('12') // false ``` test的检测功能本身很简单, 但是正则加上`g`修饰符之后, 表现就有了变化 当这个正则对象是全局搜索时 每次执行test方法 + 如果返回true, 那么**lastIndex属性就会更新至当前匹配内容的下一个字符的索引** 比如第一次执行reg2.test('12'), 返回true, lastIndex就变为1 下次执行test的时候, 就会从lastIndex开始找, 而不是从字符串的头部开始找 + 如果返回false, 那么**lastIndex属性就会重置为0** 所以第三次调用reg2.test('12')的时候, 才会返回false #### exec 这个方法用于使用正则表达式对字符串执行搜索 如果字符串中找不到匹配的结果则返回null 否则返回一个数组 + 第一个元素是在字符串当中匹配到的子串 + 第二个元素是第一分组对应的子串(如果有第一分组) + 第三个元素是第二分组对应的子串(如果有第二分组) …… ![exec方法](/images/JavaScript/regex/reg.exec1.jpg) 如果正则对象具备全局搜索, 特点和test类似 也会更新RegExp对象的lastIndex ![exec方法](/images/JavaScript/regex/reg.exec2.jpg) 所以如果要逐个获取每次的匹配结果 只要RegExp对象具备全局搜索, 循环执行exec即可 ### String对象中的方法 #### search 方法返回第一个匹配结果的索引,查找不到返回-1 search方法会忽略g标志,总是从字符串的开头进行检索 例如 ```javascript var reg = /\d[a-z]/ 'a1an2n'.search(reg) // 1 '1234'.search(reg) // -1 ``` #### match 如果正则表达式不带g 那么与exec方法的执行结果完全相同 如果正则表达式带g 返回的就是逐次匹配结果构成的数组 (相当于是逐次执行exec, 把每次执行结果的第一个元素拿出来, 全都放进一个数组里) ![match方法](/images/JavaScript/regex/match.jpg) #### split split方法用于把一个字符串使用正则分隔为若干个字符串组成的数组 ```javascript '1a2b3c'.split(/\d/) // ["", "a", "b", "c"] ``` > 需要注意的是如果头部或尾部存在匹配该正则的部分, 就会多出一个空串 split的参数也可以传入一个字符串, 就会把字符串的内容作为原义字符放入正则当中执行处理 #### replace 正则带g就替换所有, 不带就替换第一个 ```javascript var str = "2018-11-26"; str.replace(/-/,'/'); // "2018/11-26" str.replace(/-/g,'/'); // "2018/11/26" ``` replace的第二个参数还可以传入一个函数 **没有分组的情况** 例如, 我要把字符串里面所有的整数都找出来, 全都乘以2 ```javascript // match是匹配到的字符串 // index是匹配到的位置索引 // origin是原字符串 'a1b2c3'.replace(/\d+/g, (match, index, origin) => { return match * 2 }) // "a2b4c6" ``` match当然是字符串类型, 这里只是借用了js的隐式类型转换, 对字符串做乘法直接转换为Number, 无法完成转换的就是NaN **有分组的情况** ```javascript // $1是第一分组, $2是第二分组 '1a2b3c4d'.replace(/(\d)([a-z])/g, (match, $1, $2, index, origin) => { return $1 * 2 + $2 }) // "2a4b6c8d" ``` 如果有更多分组, 那么函数被调用时就会传入更多参数