ML(102)
-
CharlesBookClub.csv
CharlesBookClub.csv · 찰스 북클럽 회원 개인의 과거 실제 데이터셋입니다. · This data set represents information associated with individuals who are members of a book club. · 한 사람이 책 구매시 함께 구매한 책 정보가 포함되어 있습니다. · 4,000 거래 Description of Variables attribute description Seq# Sequence number in the partition ID# Identification number in the full (unpartitioned) market test data set Gender O=Male 1=Female M Monetary- Tota..
-
향상도(lift), 향상도 값에 따른 관계와 의미
향상도(lift) · 품목 B를 구매한 고객 대비 품목 A를 구매한 후 품목 B를 구매하는 고객에 대한 확률을 의미합니다. · 연관규칙 A→B는 품목 A와 품목B의 구매가 서로 관련이 없는 경우( 독립적인 경우)에 P(B|A)=P(B)이므로 향상도는 1이 됩니다. 만일 향상도가 1보다 크면 이 규칙은 결과를 예측하는 데 있어서 우수하다는 것을 의미합니다. 1보다 작으면 우연적 기회보다 도움이 되지 않음을 의미합니다. 향상도 값에 따른 관계와 의미 향상도 의미 1 이다 두 품목간에 연관성이 없는 서로 독립적인 관계입니다. 1보다 작다 두 품목이 서로 음의 상관관계입니다. 품목 A와 품목 B는 연관성이 없음을 의미합니다. 1보다 크다 두 품목이 서로 양의 상관관계입니다. 품목 B를 구매할 확률보다 품목 A를..
-
그래프 이론 - 노드(node), 에지(edge), 아크(arc)
그래프 이론 · 노드(node) · 에지(edge) · 아크(arc) 노드(node) 수학자들은 정점(vertex)이라고 부릅니다. 노드는 무엇이든 표시할 수 있습니다. 그래서 노드는 날씨, 배우, 영화, 단백질이 될 수도 있습니다 에지(edge) 원하는 만큼 노드를 가질 수 있지만, 노드를 연결할 수 있습니다. 에지(노드 간 연결선)를 통해 두 노드를 연결하고 두 노드간에는 관계가 있음을 알수 있습니다. 구분 설명 그래프에서 많은 에지를 조작하거나 이동할 경우 Neo4j, 아파치 지래프, 스파크 같은 대규모 그래프 데이터베이스를 사용합니다. 노드를 조회하는 데 사용하는 언어 사이퍼(Cypher) 언어 MATCH (actress)-[:acted_in]->(film) 아크(arc) ≒ 방향성 에지(dire..
-
지니 불순도 곡선
지니 불순도 곡선 · 지니 불순도는 p=0 또는 p=1일 때 0이며 p=1/2일 때 가장 큰 값을 가지는 포물선입니다. · 불순도 함수식과 연관해서 생각해보면 노드에 특정 분류 i만 있거나 특정 분류 i가 전혀 없을 때 I(A)가 작은 값을 가지며, 여러 분류가 섞여 있을 때 큰 값을 갖게 됩니다.
-
하둡 에코시스템(Ecosystem), 도식도, 구성요소
하둡 에코시스템(Ecosystem) 하둡은 특정 모듈 보다는 데이터처리 플랫폼 전체를 뜻합니다. 에코 시스템은 하둡 핵심 기능을 보완하는 서브 오픈 소스 소프트웨어들이다. 하둡이란 플랫폼상에 다양한 에코시스템(Eco-system)인 피그(Pig), 주키퍼(Zookeeper), 하이브(Hive), 플럼(Flume), 스쿱(Sqoop), 스파크(Spark) 등 수 많은 오픈소스 기술이 하둡 플랫폼과 함께 사용되며 주로 동물들의 이름을 딴 경우가 많습니다. Hadoop 에코 시스템 도식도 · 주키퍼(ZooKeeper) · 피그(Pig) · 에이치베이스(Hbase) · 하이브(Hive) · 스파크(Spark) · 플럼(Flume)과 스쿱(Sqoop) · 우지(Oozie) · 에이브로(Avro) 주키퍼(ZooKe..
-
AttributeError: module 'cv2.cv2' has no attribute 'xfeatures2d' 해결방법
에러메시지 AttributeError: module 'cv2.cv2' has no attribute 'xfeatures2d' sift = cv2.xfeatures2d.SIFT_create() AttributeError: module 'cv2.cv2' has no attribute 'xfeatures2d' 해결방법 1 패키지를 설치합니다. pip install opencv-contrib-python C:\CodeLab>pip install opencv-contrib-python Collecting opencv-contrib-python Downloading https://files.pythonhosted.org/packages/ba/0d/40121ed697f6105b9ffafc0e455e955ba8cbff..