Post

df 유니크 값 확인 :: df.nunique( )

Reference Pandas In Action
1
2
3
4
5
6
7
import pandas as pd

nba = pd.read_csv(
    './Data/nba.csv',
    parse_dates = ['Birthday']  # 'Birthday'의 데이터 유형을 날짜/시간(datetime)으로 강제 변환
)
nba
 NameTeamPositionBirthdaySalary
0Shake MiltonPhiladelphia 76ersSG1996-09-261445697
1Christian WoodDetroit PistonsPF1995-09-271645357
2PJ WashingtonCharlotte HornetsPF1998-08-233831840
3Derrick RoseDetroit PistonsPG1988-10-047317074
4Marial ShayokPhiladelphia 76ersG1995-07-2679568
445Austin RiversHouston RocketsPG1992-08-012174310
446Harry GilesSacramento KingsPF1998-04-222578800
447Robin LopezMilwaukee BucksC1988-04-014767000
448Collin SextonCleveland CavaliersPG1999-01-044764960
449Ricky RubioPhoenix SunsPG1990-10-2116200000

450 rows × 5 columns

df 유니크 값 확인 :: df.nunique( )

1
2
3
4
df.nunique(
    axis = 0,        # 0 : 행 | 1 : 열
    dropna = True    # True : NaN 포함하지 않음 | False : NaN 포함
)
  • 지정된 축의 개별 요소 수를 반환
  • DataFrame은 Series와 달리 unique( )를 사용할 수 없음
  • Option
    • axis : 사용할 축
    • dropna : 개수에 NaN 포함 여부
1
nba.nunique() # nba 각 열의 유니크 값
1
2
3
4
5
6
Name        450
Team         30
Position      9
Birthday    430
Salary      269
dtype: int64
This post is licensed under CC BY 4.0 by the author.