CODEDRAGON ㆍDevelopment/Regular Expression
정규 표현식(정규식;Regular Expressions)
· ≒ 정규식(正規式) ≒ Regex ≒ regexp
· 1960년대에 전산 이론에서 컴퓨터가 이해할 수 있는 언어를 고안하면서 나온 오래된 언어입니다.
· 문자열을 처리하는 모든 곳에서 사용되어 지며 복잡한 문자열을 처리할 때 사용하는 기법입니다.
· 언어을 표현 할 수 있는 문자식입니다.
· 특정한 규칙을 가진 문자열의 패턴(pattern)을 표현하는 데 사용하는 표현식(Expression)으로 텍스트에서 특정 글자나 단어, 문자열에서 특정 패턴을 검색하거나 치환할 때 사용합니다.
· 정규 표현식은 많은 텍스트 편집기와 프로그래밍 언어에서 문자열의 검색과 치환을 위해 지원하고 있는 와일드 카드 표현식입니다.
· 특히 펄(Perl)과 Tcl은 언어 자체에 강력한 정규 표현식을 구현하고 있습니다.
· 정규 표현식은 문자열을 토큰으로 변환하는 과정에서 텍스트를 좌에서 우로 검사하면서 여러 규칙과 일치될 문자의 수량을 다양하게 시도하는 처리하는데 가장 적합합니다. 또한, 파싱에도 사용됩니다.
· 특정 문자나 문자열로 문자열을 다루는 것에 문자뿐 만이 아니고 특수 문자로 다룰 수 있고 이들을 조합하여 다룰 수 있는 조건식(pattern)을 제공하여 더 세밀한 방법으로 문자들을 검색할 수 있게 합니다.
· 정규식 처리기가 해석할 수 있도록 정해진 문법에 따라 사용하여야 합니다
https://en.wikipedia.org/wiki/Regular_expression
유래
정규표현식은 컴퓨터 과학의 정규 언어로부터 유래하였으나 구현체에 따라서 정규 언어보다 더 넓은 언어를 표현할 수 있는 경우도 있으며, 심지어 정규 표현식 자체의 문법도 여러 가지 존재하고 있습니다. 이 중 표준화된 것으로는 POSIX의 확장 정규 표현식이 있으며, 표준화되지는 않았지만 펄의 정규 표현식과 그 대체 구현인 PCRE도 널리 사용됩니다.
정규화
데이터를 일정한 규칙에 따라 변형하여 이용하기 쉽게 만드는 것을 의미합니다.
'Development > Regular Expression' 카테고리의 다른 글
정규 표현식 플래그(flags) 구성 요소(생략 가능) (0) | 2019.01.22 |
---|---|
정규 표현식 리터럴 (0) | 2019.01.21 |
Dot(.), a.b, a[.]b (0) | 2018.07.18 |
regular expressions 101 - 정규표현식을 만들어주는 사이트 (0) | 2018.07.04 |
정규 표현식 특징 (0) | 2018.06.28 |