최대 1 분 소요

Reference Pandas In Action
import pandas as pd

nba = pd.read_csv(
    './Data/nba.csv',
    parse_dates = ['Birthday']  # 'Birthday'의 데이터 유형을 날짜/시간(datetime)으로 강제 변환
)
nba
  Name Team Position Birthday Salary
0 Shake Milton Philadelphia 76ers SG 1996-09-26 1445697
1 Christian Wood Detroit Pistons PF 1995-09-27 1645357
2 PJ Washington Charlotte Hornets PF 1998-08-23 3831840
3 Derrick Rose Detroit Pistons PG 1988-10-04 7317074
4 Marial Shayok Philadelphia 76ers G 1995-07-26 79568
445 Austin Rivers Houston Rockets PG 1992-08-01 2174310
446 Harry Giles Sacramento Kings PF 1998-04-22 2578800
447 Robin Lopez Milwaukee Bucks C 1988-04-01 4767000
448 Collin Sexton Cleveland Cavaliers PG 1999-01-04 4764960
449 Ricky Rubio Phoenix Suns PG 1990-10-21 16200000

450 rows × 5 columns

df 유니크 값 확인 :: df.nunique( )

df.nunique(
    axis = 0,        # 0 : 행 | 1 : 열
    dropna = True    # True : NaN 포함하지 않음 | False : NaN 포함
)
  • 지정된 축의 개별 요소 수를 반환
  • DataFrame은 Series와 달리 unique( )를 사용할 수 없음
  • Option
    • axis : 사용할 축
    • dropna : 개수에 NaN 포함 여부
nba.nunique() # nba 각 열의 유니크 값
Name        450
Team         30
Position      9
Birthday    430
Salary      269
dtype: int64

카테고리:

업데이트: