정규 표현식(정규식;Regular Expressions), 유래, 정규화

CODEDRAGON Development/Regular Expression

반응형


 

정규 표현식(정규식;Regular Expressions)

·       정규식(正規式) Regex regexp

·       1960년대에 전산 이론에서 컴퓨터가 이해할 있는 언어를 고안하면서 나온 오래된 언어입니다.

·       문자열을 처리하는 모든 곳에서 사용되어 지며 복잡한 문자열을 처리할 사용하는 기법입니다.

·       언어을 표현 있는 문자식입니다.

·       특정한 규칙을 가진 문자열의 패턴(pattern) 표현하는 사용하는 표현식(Expression)으로 텍스트에서 특정 글자나 단어, 문자열에서 특정 패턴을 검색하거나 치환 사용합니다.

·       정규 표현식은 많은 텍스트 편집기와 프로그래밍 언어에서 문자열의 검색과 치환을 위해 지원하고 있는 와일드 카드 표현식입니다.

·       특히 (Perl) Tcl 언어 자체에 강력한 정규 표현식을 구현하고 있습니다.

·       정규 표현식은 문자열을 토큰으로 변환하는 과정에서 텍스트를 좌에서 우로 검사하면서 여러 규칙과 일치될 문자의 수량을 다양하게 시도하는 처리하는데 가장 적합합니다. 또한, 파싱에도 사용됩니다.

·       특정 문자나 문자열로 문자열을 다루는 것에 문자뿐 만이 아니고 특수 문자로 다룰 있고 이들을 조합하여 다룰 있는 조건식(pattern) 제공하여 세밀한 방법으로 문자들을 검색할 있게 합니다.

·       정규식 처리기가 해석할 있도록 정해진 문법에 따라 사용하여야 합니다

 

 

 

https://en.wikipedia.org/wiki/Regular_expression

 



유래

정규표현식은 컴퓨터 과학의 정규 언어로부터 유래하였으나 구현체에 따라서 정규 언어보다 넓은 언어를 표현할 있는 경우도 있으며, 심지어 정규 표현식 자체의 문법도 여러 가지 존재하고 있습니다. 표준화된 것으로는 POSIX 확장 정규 표현식 있으며, 표준화되지는 않았지만 펄의 정규 표현식과 대체 구현인 PCRE 널리 사용됩니다.

 

 

 

정규화

데이터를 일정한 규칙에 따라 변형하여 이용하기 쉽게 만드는 것을 의미합니다.