[Python] merge,concat 데이터 join하기(=합치기) feat. 이제 행 중복 오류를 곁들인...
·
데이터핸들링/데이터전처리
데이터 전처리를 하다 보면 여러 테이블을 하나의 테이블로 합쳐서 사용하는 경우가 많다. 파이썬에서 데이터프레임을 결합하는 방법은 크게 두 가지, concat과 merge가 있다. 이 두 가지의 차이점과 어떤 상황에서 무엇을 쓰는 게 유리한지,그리고 merge를 사용할 때 행 데이터가 중복으로 나오는 문제의 이유와 해결 방법을 정리해 보려고 한다! 1. concatconcat은 여러 데이터프레임을 축(axis)을 기준으로 결합하는 기능을 제공한다. 주로 데이터프레임을 수직(행 방향) 또는 수평(열 방향)으로 간단하게 연결할 때 사용된다.사용할 때 적합한 경우: 데이터프레임의 구조가 동일하거나 비슷할 때, 즉 같은 열을 가진 여러 데이터프레임을 단순히 이어붙이고 싶을 때 유용하다. 예를 들어, 같은 형식의 ..