[Python] Series 유니크 값
Reference
Pandas In Action1. 유니크값
import pandas as pd
calories_info = {
'Protein Bar' : 125,
'Salade' : 215,
'Chocolate Bar' : 406,
'Chicken Breast' : 125
}
diet = pd.Series(calories_info)
diet
Protein Bar 125
Salade 215
Chocolate Bar 406
Chicken Breast 125
dtype: int64
1-1. 유니크 값의 개수를 포함하는 Series 반환 :: Series.value_counts( )
Series.value_counts(
sort = True, # True : 정렬 O | False : 정렬 X
ascending = False, # True : 내림차순 | False : 오름차순
dropna = True # True : NaN 포함 X | False : NaN
)
- 유니크 값의 개수를 포함하는 Series를 반환
- Option
- sort : 정렬 여부
- ascending : 정렬 오름차순 or 내림차순 여부
- dropna : NaN의 수를 포함 여부
diet.value_counts() # diet의 각 유니크 값의 개수를 반환
125 2
215 1
406 1
dtype: int64
1-2. 고유값(유니크) 값 반환 :: Series.unique( )
Series.unique()
- Series의 유니크 값을 반환
- 고윳값이 등잔한 순으로 출력
diet.unique() # dite의 유니크 값
array([125, 215, 406])
1-3. 유니크 값 갯수 반환 :: Series.nunique( )
Series.nunique()
- Series의 유니크 값 개수를 반환
diet.nunique() # diet의 유니크 값의 개수
3
1-4. 고유값 여부(T/F) 확인 :: Series.is_unique
Series.is_unique
- Series중 중복된 값 존재 여부
diet.is_unique
False
pd.Series(data = [1,2,3,4,5]).is_unique
True