Python 정규식으로 문자열에서 특정 문자만 남기기
Python 정규식으로 문자열에서 특정 문자만 남기기
Python에서 정규식을 사용하여 문자열에서 특정 문자만 남기고 나머지를 제거하는 방법을 알아보겠습니다. 예를 들어, 영문자, 숫자, 밑줄(_), 하이픈(-), <, 그리고 공백을 제외한 모든 문자를 제거하는 방법을 살펴보겠습니다.
정규식 치환 예제
다음은 정규식을 사용하여 문자열에서 특정 문자만 남기고 나머지를 제거하는 예제입니다:
Python
import re
text = "Hello, World! 1234 @#$%^&*()_+-<> "
# 정규식을 사용하여 영문자, 숫자, 밑줄, 하이픈, <, 공백을 제외한 모든 문자 치환
result = re.sub(r'[^A-Za-z0-9_<\-\s]', '', text)
print(result) # "Hello World 1234 _-<> "
AI가 생성한 코드입니다. 신중하게 검토하고 사용하세요. FAQ의 자세한 정보.
코드 설명
모듈 임포트: re 모듈을 임포트합니다.
문자열 정의: 예제로 사용할 문자열을 정의합니다.
정규식 패턴: [^A-Za-z0-9_<\-\s] 패턴을 사용하여 영문자, 숫자, 밑줄, 하이픈, <, 공백을 제외한 모든 문자를 빈 문자열로 치환합니다.
[^...]: 대괄호 안에 있는 문자들을 제외한 모든 문자를 매칭합니다.
A-Za-z: 모든 영문자.
0-9: 모든 숫자.
_: 밑줄.
-: 하이픈.
<: < 문자.
\s: 공백 문자.
치환 및 출력: re.sub() 함수를 사용하여 치환하고 결과를 출력합니다.
결론
이 방법을 사용하면 문자열에서 특정 문자만 남기고 나머지를 제거할 수 있습니다. 정규식을 활용하면 다양한 문자열 처리 작업을 효율적으로 수행할 수 있습니다.
이 포스트가 도움이 되길 바랍니다! 다른 질문이 있으면 언제든지 알려주세요. 😊