Tổng quan về Regular Expression

Bài viết Tổng quan về Regular Expression Aki sẽ giới thiệu cho các bạn các kiến thức căn bản về Regular Expression cũng như tập hợp các ký hiệu thường dùng trong Regular Expression.

1. Regular expression là gì ?

Regular expresion (RE – biểu thức chính quy) bắt nguồn từ ngôn ngữ Perl, xuất hiện và được ứng dụng rất nhiều trong các ngôn ngữ lập trình.
Regular expression có thể hiểu đơn giản là một biểu thức dùng để mô tả một mẫu chuỗi nào đó (mẫu: các chuỗi văn bản tuân theo một quy luật sắp xếp nhất định). Ví dụ
  • dd/mm/yyyy là mẫu mô tả ngày tháng năm
  • xxxx@gmail.com là mẫu mô tả địa chỉ email

2. Regular expression có thể làm được gì ?

Biểu thức chính quy giúp giảm bớt những dòng mã trong quá trình xử lý chuỗi bằng những biểu thức ngắn gọn nhưng đem lại kết quả như mong đợi
Regular expression thường được sử dụng trong các trường hợp
  • Kiểm tra giá trị các phần tử của Form
  • Xử lý các yêu cầu phức tạp trong chuỗi (bóc tách, thay đổi nội dung, loại bỏ ký tự, …)

3. Tập hợp các ký hiệu thường dùng trong Regular expression:

STTKý hiệuÝ nghĩa
1^Tìm kiếm giá trị từ đầu chuỗi nguồn
2 $ Tìm kiếm giá trị từ cuối chuỗi nguồn
3 \ Tìm kiếm các giá trịđặt biệt trong chuỗi
4 . Đại diện cho một ký tự bất ký
5 [] Tìm tập hợp các ký tự
6 – Lấy các ký tự trong một khoảng nào đó (thường dùng với ký hiệu [])
7 ^ Nếu một ký tự ^ đứng trước một ký tự hay tập hợp có nghĩa là phủ định của ký hiệu hay tập hợp đó
8 (A|B|C) Lựa chọn các giá trị A hoặc B hoặc C
9 * 0 hoặc nhiều lần xuất hiện
10 + 1 hoặc nhiều lần xuất hiện
11 ? 0 hoặc 1 lần xuất hiện
12 {n,m} Số lần xuất hiện của ký tự từ n đến m lần
13 *? 0 lần xuất hiện
14 +? 1 lần xuất hiện
15 ?? 0 lần xuất hiện
16 \wTương đương [A-z0-9_]
17 \WTương đương [^A-z0-9_]
18 \sTập hợp những ký tự khoảng trắng
19 \STập hợp những ký tự không là ký tự khoảng trắng
20 \d[0-9] Tập hợp những ký tự từ 0 đến 9
21 \D[^0-9] Tập hợp những ký tự không thuộc từ 0 đến 9
22 \A^ Tìm kiếm giá trị từ đầu chuỗi nguồn
23 \Z$ Tìm kiếm giá trị từ cuốichuỗi nguồn
24 \bTìm ở vị trí biên của một từ
25 \BTìm ở vị trí không phải biên của một từ
Qua bài viết Tổng quan về Regular Expression thì các bạn đã nắm được những kiến thức căn bản nhất về biểu thức chính quy, ngoài ra chúng ta cũng được làm quen với các ký hiệu thường được dùng trong biểu thức chính quy. Trong bài viết sau Aki sẽ giới thiệu chi tiết và cách dùng của từng loại ký hiệu này.
Series Navigation

Comments

Popular Posts