일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- Eclipse
- conda
- sqlite
- null
- List
- SVN
- SSH
- C++
- python
- Shader
- 배열
- if
- mysql
- expect
- awk
- DROP
- sql
- pi
- ngui
- boost
- c++11
- 쉘
- ubuntu
- with
- postgresql
- pandas
- dataframe
- FIND
- autovacuum
- Unity
Archives
- Today
- Total
その先にあるもの…
[PYTHON] 데이터프레임 중복 확인 본문
df = [[1 ,2, 3, 4, 5],
[1, 2, 3, 4, 5],
[1, 2, 4, 5, 6],
[7, 8, 9, 10, 11],
[12, 13, 14, 15, 16]]
#중복된 행 확인 ( 동일한 데이터 체크 )
data.duplicated()
0 False
1 True
2 False
3 False
4 False
dtype: bool
#특정 열을 선택하여 중복된 행 확인
data.duplicated( ['col1', 'col2'] )
0 False
1 True
2 True
3 False
4 False
dtype: bool
#중복된 행만 출력
data[data.duplicated()]
col1 col2 col3 col4 col5
1 1 2 3 4 5
#중복된 행은 하나만 남기고 제거하기
data.drop_duplicates(inplace = True)
col1 col2 col3 col4 col5
0 1 2 3 4 5
2 1 2 4 5 6
3 7 8 9 10 11
4 12 13 14 15 16
'프로그래밍 > Python' 카테고리의 다른 글
[PYTHON] dataframe 출력 제한 (0) | 2020.09.02 |
---|---|
[PYTHON] 데이터프레임 열 삭제 (0) | 2020.06.26 |
[PYTHON] 리스트 합집합, 교집합, 차집합, 대칭차 (0) | 2020.06.26 |
[PYTHON] 데이터프레임 특정값 확인 isin() (0) | 2020.06.09 |
[PYTHON] DataFrame 인덱스 설정( set_index, reset_index ) (0) | 2020.06.04 |
Comments