[VSCODE] GitHub 연동 및 사용방법
·
데이터핸들링/Tool
Git과 GitHub 개요Git이란?Git은 분산 버전 관리 시스템(VCS)으로, 소프트웨어 개발 프로젝트의 소스 코드 변경 사항을 추적하고 관리하는 도구1. Git의 주요 특징 로컬 저장소와 원격 저장소 개념 사용 브랜치를 통한 병렬 개발 지원커밋을 통한 변경 사항 기록머지를 통한 브랜치 통합GitHub란?GitHub는 Git 저장소를 호스팅하는 웹 기반 플랫폼으로,Git의 기능을 확장하여 추가 기능을 제공 웹 인터페이스를 통한 저장소 관리 협업 도구 (이슈 트래커, 풀 리퀘스트 등)프로젝트 관리 기능소셜 네트워킹 요소 (팔로우, 스타 등)VS Code에서 Git 사용하기 1. GitHub 연동계정 버튼 클릭 (우측 하단)  → "Sign in to sync settings" 선택 → 브라우저에서 Gi..
[SQL] Window 함수 사용법
·
데이터핸들링/데이터전처리
윈도우 함수란?행마다 계산한 값, 즉 행간의 관계에 대해 집계할 수 있는 함수 입니다. SELECT WINDOW_FUNCTION(ARGUMENTS)OVER ([PARTITION BY 컬럼] [ORDER BY 컬럼] [ROWS BETWEEN ...])FROM 테이블명; WINDOW_FUNCTION: 사용할 윈도우 함수를 지정ARGUMENTS: 함수에 따라 0개 이상의 인수를 설정PARTITION BY: 데이터를 소그룹으로 나누는 기준이 되는 컬럼을 지정ORDER BY: 결과를 정렬할 기준이 되는 컬럼을 지정ROWS BETWEEN: 윈도우 프레임을 설정하는 옵션으로, 어떤 행을 포함할지를 정의   주요 윈도우 함수 유형순위 RANK(): 동일한 값에 동일한 순위를 부여하며, 순위가 비어있지 않도록 합니다. ..
[Python] 주민등록번호로 연령, 연령대 구하기
·
데이터핸들링/데이터전처리
고객번호가 문자열일 때 처리하는 방법 from datetime import datetimedef calculate_age_from_id(id_number): if isinstance(id_number, str) and len(id_number) >= 2: # 문자열인지 및 앞 2자리 확인 two_digit_year = int(id_number[:2]) # 주민등록번호의 앞 2자리 current_year = datetime.today().year current_century_year = int(str(current_year)[-2:]) # 현재 연도의 마지막 두 자리 # 출생 연도를 2000년대와 1900년대로 구분하여 계산 if t..
[Python, 구글스프레드시트] 날짜 형식 변경
·
데이터핸들링/데이터전처리
안녕하세요, 저는 데이터전처리를 하면서 은근히 시간을 뺏기게 되는 부분이 있는데요,바로 날짜 형식 변경 입니다. 데이터를 처리하면서 시계열 분석, 일자별 집계, 코호트분석 등 날짜가 기준이 되어야하는 경우가 빈번하게 발생합니다.그럴 때, 코드가 잘 돌아가다가도 오류가 발생하면 어김없이 형식이 맞지 않을 때가 많아요.  그래서 제가 자주 쓰는 구글스프레드시트와 파이썬 기준으로 날짜 형식 변경에 대해 어떻게 처리하는지 말씀드리겠습니다. 1. 구글 스프레드시트1.1 기본 날짜 형식 변경구글 스프레드시트에서는 다양한 기본 날짜 형식을 제공합니다. 날짜가 포함된 셀을 선택합니다. 상단 메뉴에서 [서식] > [숫자] > [날짜]를 선택합니다. 원하는 날짜 형식을 선택1.2 DATEVALUE 함수 활용DATEVALU..
[VSCODE] 깃허브 git push / git pull
·
데이터핸들링/Tool
안녕하세요, Git의 핵심 기능인 push와 pull에 대해 자세히 알아보겠습니다. 이 두 명령어는 원격 저장소와 로컬 저장소 간의 코드 동기화를 위해 필수적인 도구입니다.Git Push: 로컬 변경사항을 원격으로 전송하기 Git push는 로컬 저장소의 커밋을 원격 저장소로 전송하는 명령어 코드 변경사항을 GitHub에 업로드(Push)하거나 최신 변경사항을 가져오는(Pull) 방법입니다. 1. Pushgit push git push origin main 이 명령어는 'origin'이라는 원격 저장소의 'main' 브랜치로 현재 브랜치의 커밋을 전송합니다. 주요 옵션: --all: 모든 브랜치를 푸시합니다. --tags: 태그를 함께 푸시합니다. -f 또는 --force: 원격 브랜치를 강제로 덮어씁..
[VSCODE] Git Hub 레파지토리 변경하는 법
·
데이터핸들링/Tool
VSCODE 터미널을 켜고 아래 명령어를 작성한다. git remote remove origin  변경할 깃허브의 레파지토리주소와 사용자명을 입력한다git remote add origin https://github.com/사용자명/새레포지토리이름.git  레파지토리가 잘 변경되었는지 확인한다.git remote -v
깃허브 contributions color 잔디 색상
·
데이터핸들링/Tool
갑자기 깃허브 잔디 색상이 바뀌어서 뭐지?! 했더니 할로윈 이벤트로 이렇게 귀여워졌다...!  Happy Halloween! 깃허브 계정을 새로 팠더니 이전 내역이 없어서 더 많이 알록달록했으면 두 배 더 귀여웠을테지만.. 내년 할로윈까지 열심히 채워 놓을게 딱 기다려
[Python] merge,concat 데이터 join하기(=합치기) feat. 이제 행 중복 오류를 곁들인...
·
데이터핸들링/데이터전처리
데이터 전처리를 하다 보면 여러 테이블을 하나의 테이블로 합쳐서 사용하는 경우가 많다. 파이썬에서 데이터프레임을 결합하는 방법은 크게 두 가지, concat과 merge가 있다. 이 두 가지의 차이점과 어떤 상황에서 무엇을 쓰는 게 유리한지,그리고 merge를 사용할 때 행 데이터가 중복으로 나오는 문제의 이유와 해결 방법을 정리해 보려고 한다! 1. concatconcat은 여러 데이터프레임을 축(axis)을 기준으로 결합하는 기능을 제공한다. 주로 데이터프레임을 수직(행 방향) 또는 수평(열 방향)으로 간단하게 연결할 때 사용된다.사용할 때 적합한 경우: 데이터프레임의 구조가 동일하거나 비슷할 때, 즉 같은 열을 가진 여러 데이터프레임을 단순히 이어붙이고 싶을 때 유용하다. 예를 들어, 같은 형식의 ..