파이썬 apply와 lambda함수의 활용

Updated: July 25, 2021

1 minute read

apply 함수

df = pd.read_csv('./datas/test.csv', nrows=10)
df

조건이 없는 단순 연산일 경우 아래처럼 간단하게 함수 적용이 가능합니다.

df['ID']*2

   0
   2
   4
   6
   8
  10
  12
  14
  16
  18
Name: ID, dtype: int64

def multi_two(x):
    return x*2

multi_two(df['ID'])

   0
   2
   4
   6
   8
  10
  12
  14
  16
  18
Name: ID, dtype: int64

같은 연산을 apply로도 가능합니다.

def multi_two(x):
    return x*2

df['ID'].apply(multi_two)

   0
   2
   4
   6
   8
  10
  12
  14
  16
  18
Name: ID, dtype: int64

하지만 조건부로 데이터에 연산을 적용할 경우, for문이라 apply가 꼭 필요합니다. 데이터 프레임에 인덱스가 짝수일 경우 아이디에 2를 곱해주는 코드를 작성해봅니다.

df = pd.read_csv('./datas/test.csv', nrows=10)

for i in df.index:
    if i%2 == 0:
        df.loc[i,'ID'] = df.loc[i,'ID'] *2
df['ID']

   0
   1
   4
   3
   8
   5
  12
   7
  16
   9
Name: ID, dtype: int64

apply와 lambda함수를 이용하면 더 간단하게 할 수 있습니다.

df = pd.read_csv('./datas/test.csv', nrows=10)

df['ID'].apply(lambda x: x*2 if x%2==0 else x)

   0
   1
   4
   3
   8
   5
  12
   7
  16
   9
Name: ID, dtype: int64