파이썬 수치형 데이터 범주형으로 바꾸기(quantile 함수 활용)
quantile 함수를 이용하면 해당 컬럼의 십분위 값을 알 수 있습니다. 반복문으로 해당 행을 분위값으로 분류합니다.
quantile 함수를 이용하면 해당 컬럼의 십분위 값을 알 수 있습니다. 반복문으로 해당 행을 분위값으로 분류합니다.
apply 함수 시리즈에 함수를 적용시켜주는 함수 시리즈.apply(함수) for문으로 작성해야하는 코드를 더 간결하게 할 수 있게 해줍니다.
map 함수 리스트나 튜플 등 여러 데이터에 돌아가며 함수를 적용시켜주는 함수 map(함수, 복수개의 데이터(리스트, 튜플 등) ) for문으로 작성해야하는 코드를 더 간결하게 할 수 있게 해줍니다.
일반적인 반복문으로 리스트를 생성하는 방법입니다.
x축을 날짜로 그래프를 그릴 때 datetime의 마이크로초단위까지 모두 노출되는 경우가 있다. 데이터프레임을 확인해보면 %Y-%m-%d 포멧이다.
판다스를 사용하다보면 여러개의 데이터 파일을 불러와야하는 경우가 있습니다. 따로따로 불러와도 되지만 csv파일이 5개가 넘어가는 순간부터 번거로워지기 시작합니다. (공공데이터 분석을 하다 시도별로 나뉘여저있는 csv파일을 불러와 합치느라 애먹었던 경험이 있습니다.)
반복문으로 변수를 생성하려다 보면 생각대로 안되는 경우가 발생한다. 포맷팅해서 반복문으로 변수를 생성하고 싶은데 안된다.
판다스의 read_gbq 기능을 이용하면 빅쿼리에서 데이터를 불러올 수 있습니다.