달력

2

« 2020/2 »

  •  
  •  
  •  
  •  
  •  
  •  
  • 1


 

 

집합(set) 자료형의 특징

·       리스트나 튜플은 순서가 있기(ordered) 때문에 인덱싱(indexing)을 통해 자료형의 값을 얻을 수 있지만 set 자료형은 순서가 없기(unordered) 때문에 인덱싱으로 값을 얻을 수 없습니다. 이는 마치 딕셔너리와 비슷합니다.

·       중복을 허용하지 않습니다.

 

 

 

 

 

 

집합을 인덱스로 접근하기

·       딕셔너리도 set 마찬가지로 순서가 없는 자료형이여서 인덱싱을 지원하지 않는다.

·       set 자료형에 저장된 값을 인덱싱으로 접근하려면 리스트나 튜플로 변환한 후 사용 해야 합니다.

·       중복을 허용하지 않는 set의 특징은 자료형의 중복을 제거하기 위한 필터 역할로 종종 사용되기도 합니다.

 


'Development > Python' 카테고리의 다른 글

데이터의 코드  (0) 2020.02.05
pandas 패키지  (0) 2020.02.05
집합(set) 자료형의 특징  (0) 2020.02.04
집합의 크기(cardinality; 카디널리티)  (0) 2020.02.04
set 자료형  (0) 2020.02.04
집합 연산  (0) 2020.02.04
Posted by codedragon codedragon

댓글을 달아 주세요


 

 

집합의 크기(cardinality; 카디널리티)

·       집합이 가지는 원소의 갯수를 의미합니다.

·       len()함수를 사용하여 집합의 원소 갯수를 구할 있습니다.

 


'Development > Python' 카테고리의 다른 글

pandas 패키지  (0) 2020.02.05
집합(set) 자료형의 특징  (0) 2020.02.04
집합의 크기(cardinality; 카디널리티)  (0) 2020.02.04
set 자료형  (0) 2020.02.04
집합 연산  (0) 2020.02.04
frozenset 자료형  (0) 2020.02.04
Posted by codedragon codedragon

댓글을 달아 주세요

2020. 2. 4. 16:46

set 자료형 Development/Python


 

 

set 자료형

·       리스트나 튜플 등을 set으로 변경하기 위해서는 set() 생성자를 사용합니다.

·       리스트에 중복된 값들이 있을 때, 중복 없이 Unique한 값만을 얻고자 할 때 유용하게 사용할 있습니다.

 

set( []|{} )

 

 

 

 

set 자료형은 { } 기호를 사용하여 만들 수 있습니다.

{value, value, ...}

 

 



'Development > Python' 카테고리의 다른 글

집합(set) 자료형의 특징  (0) 2020.02.04
집합의 크기(cardinality; 카디널리티)  (0) 2020.02.04
set 자료형  (0) 2020.02.04
집합 연산  (0) 2020.02.04
frozenset 자료형  (0) 2020.02.04
Series객체의 속성  (0) 2020.02.04
Posted by codedragon codedragon

댓글을 달아 주세요

2020. 2. 4. 15:55

집합 연산 Development/Python


 

 

집합 연산

·       set 집합 자료을 활용하기위한 방법을 제공하고 있습니다.

·       수학에서 두개의 집합 간의 연산으로 교집합, 합집합, 차집합이 있는데, set 클래스는 이러한 집합 연산 기능을 제공합니다.

 

 

 

 

집합 연산 기호

·       set 자료형이 정말 유용하게 사용되는 경우는 교집합, 합집합, 차집합을 구할 때입니다.

·       , a b set 일 때, 교집합은 a & b (혹은 a.intersection(b)), 합집합은 a | b (혹은 a.union(b)), 차집합은 a - b (혹은 a.differene) 와 같이 구할 수 있습니다.

 

기호

메소드

구분

a & b

 

a.intersection(b)

·       교집합(intersection)

·       사건 모두에 속하는 원소로만 이루어진 집합

·        a b

 

a | b

a.union(b)

·       합집합(union)

·       집합의 원소를 모두 포함하는 집합

·       a b

a - b

a.difference()

·       차집합(difference)

 

 


'Development > Python' 카테고리의 다른 글

집합의 크기(cardinality; 카디널리티)  (0) 2020.02.04
set 자료형  (0) 2020.02.04
집합 연산  (0) 2020.02.04
frozenset 자료형  (0) 2020.02.04
Series객체의 속성  (0) 2020.02.04
데이터프레임 병합  (0) 2020.02.04
Posted by codedragon codedragon

댓글을 달아 주세요


 

 

frozenset 자료형

·       frozenset () 생성자를 사용합니다.

·       frozenset은 내용을 변경할 수 없는 임뮤터블(immutable)자료형입니다.

·       임뮤터블 자료형만 딕셔너리 자료형의 (key)set 자료형의 원소(element)가 될 수 있습니다.

 

frozenset( []|{} )

 

 

 


'Development > Python' 카테고리의 다른 글

set 자료형  (0) 2020.02.04
집합 연산  (0) 2020.02.04
frozenset 자료형  (0) 2020.02.04
Series객체의 속성  (0) 2020.02.04
데이터프레임 병합  (0) 2020.02.04
set vs dictionary vs list vs tuple  (0) 2020.02.04
Posted by codedragon codedragon

댓글을 달아 주세요



 

 

 

집합(set)

순서가 중요하지 않은 숫자들 집합으로 나타냅니다.

 


Posted by codedragon codedragon

댓글을 달아 주세요


 

 

Series객체의 속성

속성

설명

Series객체.index

·       시리즈의 인덱스(index) index 속성으로 접근할 있습니다.

Series객체.values

·       시리즈의 (value) 1차원 배열이며 values 속성으로 접근할 수 있습니다.

Series객체.name

·       name 속성을 이용하여 시리즈 데이터에 이름을 지정할 있습니다.

Series객체.index.name

·       index.name 속성으로 시리지의 인덱스에도 이름을 지정할 수 있습니다.

 

 


'Development > Python' 카테고리의 다른 글

집합 연산  (0) 2020.02.04
frozenset 자료형  (0) 2020.02.04
Series객체의 속성  (0) 2020.02.04
데이터프레임 병합  (0) 2020.02.04
set vs dictionary vs list vs tuple  (0) 2020.02.04
numpy.argsort()  (0) 2020.02.03
Posted by codedragon codedragon

댓글을 달아 주세요


 

 

탐색적 데이터 분석(Exploratory data analysis)

·       데이터 집합이 실제로 어떤 정보를 포함하고 있는지를 파악하는 것에 중점을 두고 통계기법등을 통해 데이터 집합의 주요 특징을 얻어내는 방식을 말합니다.

·       탐색적 데이터 분석은 통계와 머신러닝을 포함합니다.

·       통계와 머신 러닝의 경계가 모호하지만 분명한 교집합이 있기때문에, 데이터분석은 통계분석과 기계학습으로 분류해 있습니다.

 


 

 

 

Posted by codedragon codedragon

댓글을 달아 주세요


 

 

데이터프레임 병합

Pandas 두 개 이상의 데이터프레임을 하나로 합치는 데이터 병합(merge)이나 데이터 연결(concatenate) 할  있습니다.


 

·       merge()

·       join()

·       concat()

 

 

 

 

 

merge()

·       데이터 프레임의 공통 열 혹은 인덱스를 기준으로 두 개의 테이블을 합칩니다. 이 때 기준이 되는 열의 데이터를 키(key)라고 합니다.

·       테이블에 키 값이 같은 데이터가 여러개 있는 경우에는 있을 수 있는 모든 경우의 수를 따져서 조합을 만들어 냅니다.

·       두 데이터프레임에서 이름이 같은 열은 모두 키가 됩니다. 만약 이름이 같아도 키가 되면 안되는 열이 있다면 on 매개변수로 기준열을 명시해야 합니다.

·       키가 되는 기준열의 이름이 두 데이터프레임에서 다르면 left_on, right_on 매개변수를 사용하여 기준열을 명시해야 합니다.

·       일반 데이터 열이 아닌 인덱스를 기준열로 사용하려면 left_index 또는 right_index 인수를 True 로 설정합니다.

 

merge(dataframe1, dataframe2, how, on, left_on, right_on, left_index, right_index)

 

 

parameter

description

dataframe1, dataframe2

·       병합할 데이터프레임

how

·       join 방식 지정

 

how parameter

설명

how='inner'

inner join

양쪽 데이터프레임에 모두 키가 존재하는 데이터만 보여줍니다.

how='outer'

outer join

값이 한쪽에만 있어도 데이터를 보여줍니다.

how='left'

첫번째 데이터프레임의 키 값을 모두 보여줍니다.

how='right'

두번째 데이터프레임의 키 값을 모두 보여줍니다.

 

on

·       두 데이터프레임에서 이름이 같은 열은 모두 키가 됩니다. 만약 이름이 같아도 키가 되면 안되는 열이 있다면 on 인수로 기준열을 명시합니다.

·       출력시 기준 열이 아니면서 이름이 같은 열에는 _x 또는 _y 와 같은 접미사가 붙습니다.

left_on='이름1', right_on="이름2"

·       키가 되는 기준열의 이름이 두 데이터프레임에서 다르면 left_on, right_on 인수를 사용하여 기준열을 명시합니다.

left_index, right_index

·       일반 데이터 열이 아닌 인덱스를 기준열로 사용하려면 left_index 또는 right_index 인수를 True 로 설정합니다.

 

 

 

 

 

 

 

join()

merge()함수 대신 join()함수를 사용하여 병합할 할 수 있습니다.

 

df1.join(df2, how='outer')

 

 

 

 

 

 

 

concat()

·       기준 (key column)을 사용하지 않고 단순히 데이터를 연결(concatenate)합니다.

·       기본적으로는 /아래로 데이터 행을 연결합니다.

·       단순히 두 시리즈(Series)나 데이터프레임(DataFrame)을 연결하기 때문에 인덱스 값이 중복될 수 있습니다.

 

pd.concat([s1, s2])

pd.concat([df1, df2], axis=1)

 

 


'Development > Python' 카테고리의 다른 글

frozenset 자료형  (0) 2020.02.04
Series객체의 속성  (0) 2020.02.04
데이터프레임 병합  (0) 2020.02.04
set vs dictionary vs list vs tuple  (0) 2020.02.04
numpy.argsort()  (0) 2020.02.03
리터럴을 통한 dict 생성, dict() 생성자를 통한 dict생성  (0) 2020.02.03
Posted by codedragon codedragon

댓글을 달아 주세요

 

set vs dictionary vs list vs tuple

 

구분

set

dictionary

list

tuple

표현식

{ }

{ }

[ ]

( )

공통점

값들의 모임

값들의 모임

값들의 모임

List 유사

 

 

 

 

 

차이점

순서없는

Unordered

순서있는

Ordered

중복여부

불가

Value 중복가능

가능

 

Mutable

변경 가능(Mutable)

 

변경 가능(Mutable)

읽기 전용

Unmutable

특징

-

Key:value

(Key) 이용하여 (Value) 접근

값의 생성, 삭제, 수정 가능

 

-

 

 

'Development > Python' 카테고리의 다른 글

Series객체의 속성  (0) 2020.02.04
데이터프레임 병합  (0) 2020.02.04
set vs dictionary vs list vs tuple  (0) 2020.02.04
numpy.argsort()  (0) 2020.02.03
리터럴을 통한 dict 생성, dict() 생성자를 통한 dict생성  (0) 2020.02.03
bincount()  (0) 2020.02.03
Posted by codedragon codedragon

댓글을 달아 주세요