최대 1 분 소요

Reference Pandas In Action

1. 유니크값

import pandas as pd

calories_info = {
    'Protein Bar' : 125,
    'Salade' : 215,
    'Chocolate Bar' : 406,
    'Chicken Breast' : 125
}

diet = pd.Series(calories_info)
diet
Protein Bar       125
Salade            215
Chocolate Bar     406
Chicken Breast    125
dtype: int64

1-1. 유니크 값의 개수를 포함하는 Series 반환 :: Series.value_counts( )

Series.value_counts(
    sort = True,          # True : 정렬 O | False : 정렬 X
    ascending = False,    # True : 내림차순 | False : 오름차순
    dropna = True         # True : NaN 포함 X | False : NaN 
)
  • 유니크 값의 개수를 포함하는 Series를 반환
  • Option
    • sort : 정렬 여부
    • ascending : 정렬 오름차순 or 내림차순 여부
    • dropna : NaN의 수를 포함 여부
diet.value_counts()  # diet의 각 유니크 값의 개수를 반환
125    2
215    1
406    1
dtype: int64

1-2. 고유값(유니크) 값 반환 :: Series.unique( )

Series.unique()
  • Series의 유니크 값을 반환
  • 고윳값이 등잔한 순으로 출력
diet.unique()   # dite의 유니크 값
array([125, 215, 406])

1-3. 유니크 값 갯수 반환 :: Series.nunique( )

Series.nunique()
  • Series의 유니크 값 개수를 반환
diet.nunique()  # diet의 유니크 값의 개수
3

1-4. 고유값 여부(T/F) 확인 :: Series.is_unique

Series.is_unique
  • Series중 중복된 값 존재 여부
diet.is_unique
False
pd.Series(data = [1,2,3,4,5]).is_unique
True

카테고리:

업데이트: