df 유니크 값 확인 :: df.nunique( )
Reference
Pandas In Actionimport pandas as pd
nba = pd.read_csv(
'./Data/nba.csv',
parse_dates = ['Birthday'] # 'Birthday'의 데이터 유형을 날짜/시간(datetime)으로 강제 변환
)
nba
Name | Team | Position | Birthday | Salary | |
---|---|---|---|---|---|
0 | Shake Milton | Philadelphia 76ers | SG | 1996-09-26 | 1445697 |
1 | Christian Wood | Detroit Pistons | PF | 1995-09-27 | 1645357 |
2 | PJ Washington | Charlotte Hornets | PF | 1998-08-23 | 3831840 |
3 | Derrick Rose | Detroit Pistons | PG | 1988-10-04 | 7317074 |
4 | Marial Shayok | Philadelphia 76ers | G | 1995-07-26 | 79568 |
… | … | … | … | … | … |
445 | Austin Rivers | Houston Rockets | PG | 1992-08-01 | 2174310 |
446 | Harry Giles | Sacramento Kings | PF | 1998-04-22 | 2578800 |
447 | Robin Lopez | Milwaukee Bucks | C | 1988-04-01 | 4767000 |
448 | Collin Sexton | Cleveland Cavaliers | PG | 1999-01-04 | 4764960 |
449 | Ricky Rubio | Phoenix Suns | PG | 1990-10-21 | 16200000 |
450 rows × 5 columns
df 유니크 값 확인 :: df.nunique( )
df.nunique(
axis = 0, # 0 : 행 | 1 : 열
dropna = True # True : NaN 포함하지 않음 | False : NaN 포함
)
- 지정된 축의 개별 요소 수를 반환
- DataFrame은 Series와 달리 unique( )를 사용할 수 없음
- Option
- axis : 사용할 축
- dropna : 개수에 NaN 포함 여부
nba.nunique() # nba 각 열의 유니크 값
Name 450
Team 30
Position 9
Birthday 430
Salary 269
dtype: int64