[Python] 주민등록번호로 연령, 연령대 구하기
·
데이터핸들링/데이터전처리
고객번호가 문자열일 때 처리하는 방법 from datetime import datetimedef calculate_age_from_id(id_number): if isinstance(id_number, str) and len(id_number) >= 2: # 문자열인지 및 앞 2자리 확인 two_digit_year = int(id_number[:2]) # 주민등록번호의 앞 2자리 current_year = datetime.today().year current_century_year = int(str(current_year)[-2:]) # 현재 연도의 마지막 두 자리 # 출생 연도를 2000년대와 1900년대로 구분하여 계산 if t..
[Python] merge,concat 데이터 join하기(=합치기) feat. 이제 행 중복 오류를 곁들인...
·
데이터핸들링/데이터전처리
데이터 전처리를 하다 보면 여러 테이블을 하나의 테이블로 합쳐서 사용하는 경우가 많다. 파이썬에서 데이터프레임을 결합하는 방법은 크게 두 가지, concat과 merge가 있다. 이 두 가지의 차이점과 어떤 상황에서 무엇을 쓰는 게 유리한지,그리고 merge를 사용할 때 행 데이터가 중복으로 나오는 문제의 이유와 해결 방법을 정리해 보려고 한다! 1. concatconcat은 여러 데이터프레임을 축(axis)을 기준으로 결합하는 기능을 제공한다. 주로 데이터프레임을 수직(행 방향) 또는 수평(열 방향)으로 간단하게 연결할 때 사용된다.사용할 때 적합한 경우: 데이터프레임의 구조가 동일하거나 비슷할 때, 즉 같은 열을 가진 여러 데이터프레임을 단순히 이어붙이고 싶을 때 유용하다. 예를 들어, 같은 형식의 ..