Tổng quan về Regular Expression
Bài viết Tổng quan về Regular Expression Aki sẽ giới thiệu cho các bạn các kiến thức căn bản về Regular Expression cũng như tập hợp các ký hiệu thường dùng trong Regular Expression.
1. Regular expression là gì ?
Regular expresion (RE – biểu thức chính quy) bắt nguồn từ ngôn ngữ Perl, xuất hiện và được ứng dụng rất nhiều trong các ngôn ngữ lập trình.
Regular expression có thể hiểu đơn giản là một biểu thức dùng để mô tả một mẫu chuỗi nào đó (mẫu: các chuỗi văn bản tuân theo một quy luật sắp xếp nhất định). Ví dụ
- dd/mm/yyyy là mẫu mô tả ngày tháng năm
- xxxx@gmail.com là mẫu mô tả địa chỉ email
2. Regular expression có thể làm được gì ?
Biểu thức chính quy giúp giảm bớt những dòng mã trong quá trình xử lý chuỗi bằng những biểu thức ngắn gọn nhưng đem lại kết quả như mong đợi
Regular expression thường được sử dụng trong các trường hợp
- Kiểm tra giá trị các phần tử của Form
- Xử lý các yêu cầu phức tạp trong chuỗi (bóc tách, thay đổi nội dung, loại bỏ ký tự, …)
3. Tập hợp các ký hiệu thường dùng trong Regular expression:
STT | Ký hiệu | Ý nghĩa |
1 | ^ | Tìm kiếm giá trị từ đầu chuỗi nguồn |
2 | $ | Tìm kiếm giá trị từ cuối chuỗi nguồn |
3 | \ | Tìm kiếm các giá trịđặt biệt trong chuỗi |
4 | . | Đại diện cho một ký tự bất ký |
5 | [] | Tìm tập hợp các ký tự |
6 | – | Lấy các ký tự trong một khoảng nào đó (thường dùng với ký hiệu []) |
7 | ^ | Nếu một ký tự ^ đứng trước một ký tự hay tập hợp có nghĩa là phủ định của ký hiệu hay tập hợp đó |
8 | (A|B|C) | Lựa chọn các giá trị A hoặc B hoặc C |
9 | * | 0 hoặc nhiều lần xuất hiện |
10 | + | 1 hoặc nhiều lần xuất hiện |
11 | ? | 0 hoặc 1 lần xuất hiện |
12 | {n,m} | Số lần xuất hiện của ký tự từ n đến m lần |
13 | *? | 0 lần xuất hiện |
14 | +? | 1 lần xuất hiện |
15 | ?? | 0 lần xuất hiện |
16 | \w | Tương đương [A-z0-9_] |
17 | \W | Tương đương [^A-z0-9_] |
18 | \s | Tập hợp những ký tự khoảng trắng |
19 | \S | Tập hợp những ký tự không là ký tự khoảng trắng |
20 | \d | [0-9] Tập hợp những ký tự từ 0 đến 9 |
21 | \D | [^0-9] Tập hợp những ký tự không thuộc từ 0 đến 9 |
22 | \A | ^ Tìm kiếm giá trị từ đầu chuỗi nguồn |
23 | \Z | $ Tìm kiếm giá trị từ cuốichuỗi nguồn |
24 | \b | Tìm ở vị trí biên của một từ |
25 | \B | Tìm ở vị trí không phải biên của một từ |
Qua bài viết Tổng quan về Regular Expression thì các bạn đã nắm được những kiến thức căn bản nhất về biểu thức chính quy, ngoài ra chúng ta cũng được làm quen với các ký hiệu thường được dùng trong biểu thức chính quy. Trong bài viết sau Aki sẽ giới thiệu chi tiết và cách dùng của từng loại ký hiệu này.
Comments
Post a Comment