[Python] 주민등록번호로 연령, 연령대 구하기
·
데이터핸들링/데이터전처리
고객번호가 문자열일 때 처리하는 방법 from datetime import datetimedef calculate_age_from_id(id_number): if isinstance(id_number, str) and len(id_number) >= 2: # 문자열인지 및 앞 2자리 확인 two_digit_year = int(id_number[:2]) # 주민등록번호의 앞 2자리 current_year = datetime.today().year current_century_year = int(str(current_year)[-2:]) # 현재 연도의 마지막 두 자리 # 출생 연도를 2000년대와 1900년대로 구분하여 계산 if t..
[Python, 구글스프레드시트] 날짜 형식 변경
·
데이터핸들링/데이터전처리
안녕하세요, 저는 데이터전처리를 하면서 은근히 시간을 뺏기게 되는 부분이 있는데요,바로 날짜 형식 변경 입니다. 데이터를 처리하면서 시계열 분석, 일자별 집계, 코호트분석 등 날짜가 기준이 되어야하는 경우가 빈번하게 발생합니다.그럴 때, 코드가 잘 돌아가다가도 오류가 발생하면 어김없이 형식이 맞지 않을 때가 많아요.  그래서 제가 자주 쓰는 구글스프레드시트와 파이썬 기준으로 날짜 형식 변경에 대해 어떻게 처리하는지 말씀드리겠습니다. 1. 구글 스프레드시트1.1 기본 날짜 형식 변경구글 스프레드시트에서는 다양한 기본 날짜 형식을 제공합니다. 날짜가 포함된 셀을 선택합니다. 상단 메뉴에서 [서식] > [숫자] > [날짜]를 선택합니다. 원하는 날짜 형식을 선택1.2 DATEVALUE 함수 활용DATEVALU..
[Python] merge,concat 데이터 join하기(=합치기) feat. 이제 행 중복 오류를 곁들인...
·
데이터핸들링/데이터전처리
데이터 전처리를 하다 보면 여러 테이블을 하나의 테이블로 합쳐서 사용하는 경우가 많다. 파이썬에서 데이터프레임을 결합하는 방법은 크게 두 가지, concat과 merge가 있다. 이 두 가지의 차이점과 어떤 상황에서 무엇을 쓰는 게 유리한지,그리고 merge를 사용할 때 행 데이터가 중복으로 나오는 문제의 이유와 해결 방법을 정리해 보려고 한다! 1. concatconcat은 여러 데이터프레임을 축(axis)을 기준으로 결합하는 기능을 제공한다. 주로 데이터프레임을 수직(행 방향) 또는 수평(열 방향)으로 간단하게 연결할 때 사용된다.사용할 때 적합한 경우: 데이터프레임의 구조가 동일하거나 비슷할 때, 즉 같은 열을 가진 여러 데이터프레임을 단순히 이어붙이고 싶을 때 유용하다. 예를 들어, 같은 형식의 ..