blog-web/source/_posts/JavaScript/正则表达式重新入门(2).md

---
title: 正则表达式重新入门(2)
date: 2018-12-24 10:11:46
categories:
  - JavaScript
tags:
  - 正则表达式
---

### 修饰符
修饰符是作用于整个表达式的附加属性
对于两种创建RegExp对象的方式
有各自对应的指定修饰符的语法

```javascript
let reg1 = /^\w+$/g
let reg2 = new RegExp('^\\w+$', 'g')
```

<!-- more -->
+ `g` : 全局搜索, 对应RegExp对象中的**global**属性
+ `i` : 忽略大小写, 对应RegExp对象中的**ignoreCase**属性
+ `m` : 多行搜索, 对应RegExp对象中的**multiline**属性

#### 关于multiline
g全局搜索 和 i忽略大小写都很容易理解
`m`多行搜索, 有以下的特性

+ 字符串中没有换行符(可以是\r\n或者\n), m修饰符没有作用
+ 正则表达式中没有^或$匹配字符串的开头或结尾, m修饰符没有作用

> 多行字符串的语法
1. 可以在字符串中加入\n
2. 可以使用ES6的字符串模板语法
```javascript
var str1 = `ab
cd`
// 等价于
var str2 = `ab\ncd`
```

正则表达式多行匹配
```javascript
const singleline = /^ab/
const multiline = /^ab/m

var str1 = `ef
ab`
var str2 = `ab
ef`

singleline.test(str1) // false
multiline.test(str1) // true

singleline.test(str2) // true
multiline.test(str2) // true
```
对于具备multiline属性的正则对象
`^`由原本的匹配整个字符串的开头, 变为匹配每一行的开头
`$`由原本的匹配整个字符串的结尾, 变为匹配每一行的结尾

所以^和$都没有的, 添加m修饰符是不起作用的


#### RegExp对象中的其他属性
+ lastIndex : 当前表达式匹配内容的最后一个字符的下一个位置
+ source : 正则表达式的文本字符串

### RegExp对象内置方法

#### test
test方法用于检测一个字符串是否匹配指定的正则, 返回true或false
```javascript
const reg1 = /\d/
reg1.test('12') // true
reg1.test('12') // true
reg1.test('12') // true

const reg2 = /\d/g
reg2.test('12') // true
reg2.test('12') // true
reg2.test('12') // false
```
test的检测功能本身很简单, 但是正则加上`g`修饰符之后, 表现就有了变化
当这个正则对象是全局搜索时
每次执行test方法
+ 如果返回true, 那么**lastIndex属性就会更新至当前匹配内容的下一个字符的索引**
比如第一次执行reg2.test('12'), 返回true, lastIndex就变为1
下次执行test的时候, 就会从lastIndex开始找, 而不是从字符串的头部开始找
+ 如果返回false, 那么**lastIndex属性就会重置为0**

所以第三次调用reg2.test('12')的时候, 才会返回false

#### exec
这个方法用于使用正则表达式对字符串执行搜索

如果字符串中找不到匹配的结果则返回null
否则返回一个数组
+ 第一个元素是在字符串当中匹配到的子串
+ 第二个元素是第一分组对应的子串(如果有第一分组)
+ 第三个元素是第二分组对应的子串(如果有第二分组)
……

![exec方法](/images/JavaScript/regex/reg.exec1.jpg)

如果正则对象具备全局搜索, 特点和test类似
也会更新RegExp对象的lastIndex

![exec方法](/images/JavaScript/regex/reg.exec2.jpg)

所以如果要逐个获取每次的匹配结果
只要RegExp对象具备全局搜索, 循环执行exec即可

### String对象中的方法

#### search
方法返回第一个匹配结果的索引，查找不到返回-1
search方法会忽略g标志，总是从字符串的开头进行检索

例如
```javascript
var reg = /\d[a-z]/

'a1an2n'.search(reg) // 1
'1234'.search(reg) // -1
```

#### match
如果正则表达式不带g
那么与exec方法的执行结果完全相同

如果正则表达式带g
返回的就是逐次匹配结果构成的数组
(相当于是逐次执行exec, 把每次执行结果的第一个元素拿出来, 全都放进一个数组里)

![match方法](/images/JavaScript/regex/match.jpg)


#### split
split方法用于把一个字符串使用正则分隔为若干个字符串组成的数组
```javascript
'1a2b3c'.split(/\d/) // ["", "a", "b", "c"]
```
> 需要注意的是如果头部或尾部存在匹配该正则的部分, 就会多出一个空串

split的参数也可以传入一个字符串, 就会把字符串的内容作为原义字符放入正则当中执行处理


#### replace
正则带g就替换所有, 不带就替换第一个
```javascript
var str = "2018-11-26";

str.replace(/-/,'/');  // "2018/11-26"
str.replace(/-/g,'/');  // "2018/11/26"
```

replace的第二个参数还可以传入一个函数

**没有分组的情况**
例如, 我要把字符串里面所有的整数都找出来, 全都乘以2
```javascript
// match是匹配到的字符串
// index是匹配到的位置索引
// origin是原字符串
'a1b2c3'.replace(/\d+/g, (match, index, origin) => {
  return match * 2
})
// "a2b4c6"
```
match当然是字符串类型, 这里只是借用了js的隐式类型转换, 对字符串做乘法直接转换为Number, 无法完成转换的就是NaN

**有分组的情况**
```javascript
// $1是第一分组, $2是第二分组
'1a2b3c4d'.replace(/(\d)([a-z])/g, (match, $1, $2, index, origin) => {
  return $1 * 2 + $2
})
// "2a4b6c8d"
```
如果有更多分组, 那么函数被调用时就会传入更多参数