Algorithm - Regular Expression
Created by : Mr Dk.
2018 / 10 / 11 09:04
Nanjing, Jiangsu, China
1. About
正则表达式 是对字符串操作的一种逻辑公式。用事先定义好的一些特定字符的组合,组成一个 规则字符串 ,用来表达对字符串的一种 过滤逻辑 。
可达到如下的目的:
- 匹配 - 给定的字符串是否符合正则表达式的过滤逻辑
- 截取 - 通过正则表达式,从字符串中获取需要的特定部分
2. Feature
- 灵活性 - 只需写出表达式
- 逻辑性 - 对于刚接触的人比较晦涩难懂
- 功能性 - 可以迅速用简单的方式达到字符串的复杂控制
3. Metacharacter 元字符
在正则表达式中具有特殊意义的专用字符
Meta-character | Description |
---|---|
\ | 转义符,如 \n 匹配换行符,\\n 匹配 \n |
^ | 匹配输入行首 |
$ | 匹配输入行尾 |
* | 匹配前面的子表达式任意次,等价于 {0,} |
+ | 匹配前面的子表达式一次或多次(≥ 1),等价于 {1,} |
? | 匹配前面的子表达式 0 次或 1 次,等价于 {0,1} |
{n} | 匹配确定的 n 次 |
{n,} | 至少匹配 n 次 |
{n,m} | 至少匹配 n 次,最多匹配 m 次 |
. | 匹配除 \r 和 \n 之外的任何单个字符 |
x丨y | 匹配 x 或 y |
[xyz] | 字符集合,匹配所包含的任意字符 |
[^xyz] | 负值字符集合,匹配不包含的任意字符 |
[a-z] | 字符范围,匹配指定范围内的任意字符 |
[^a-z] | 负值字符范围,匹配不在指定范围内的任意字符 |
\b | 匹配一个单词的边界 (单词和空格间的位置) |
\B | 匹配非单词边界 |
\d | 匹配一个数字字符,等价于 [0-9] |
\D | 匹配一个非数字字符,等价于 [^0-9] |
\f | 匹配一个换页符 |
\n | 匹配一个换行符 |
\r | 匹配一个回车符 |
\s | 匹配任何不可见字符 |
\S | 匹配任何可见字符 |
\t | 匹配一个制表符 |
\w | 匹配包括 _ 的任意单词字符 |
\W | 匹配任意非单词字符 |
...... | ...... |
4. Example
判断输入的用户名是否合法:用户名必须是 3 - 10 位的英文字母或数字。
// 在 JS 中使用 /Reg/ 来定义正则表达式
var userNameReg = /^[a-zA-Z0-9]{3,10}$/;
var username1 = "12";
var username2 = "12.";
var username3 = "123";
var username4 = "123456789a";
var username5 = "1234axz7789";
console.log(userNameReg.test(username1)); // false
console.log(userNameReg.test(username2)); // false
console.log(userNameReg.test(username3)); // true
console.log(userNameReg.test(username4)); // true
console.log(userNameReg.test(username5)); // false
在 Java 中,似乎不需要使用 ^
和 $
。
5. Summary
用这东西可以避免模式匹配的时候写一大堆 if-else
逻辑。