본문 바로가기
[Pandas] Basic Series ? Series는 numpy의 1차원 배열과 구조가 동일하다. 인덱스와 칼럼명을 가지고 있어서 numpy보다 사용이 편리 index를 지정해서 key값으로 사용할 수 있음 Series를 여러 개 붙이면 Dataframe이 됨 import pandas as pd data = pd.Series(['one','two','three']) data.values >>> array(['one','two','three']) data.index >>> RangeIndex(start=0, stop=3, step=1) data = pd.Series(data.values, index=[2,3,4]) >>> 2 one 3 two 4 three data[2] # list와 같이 순서대로 >>> 'three' data.. 2020. 7. 12.
[Numpy] ndarray의 인덱싱과 정렬 Numpy 1. Numpy 특징 수치해석용 파이썬 패키지 다차원 배열 자료구조 클래스 ndarray(N-dimensional array)클래스를 지원 : 배열(array)을 사용하면 적은 메모리로 데이터를 빠르게 처리, 단 모든 원소가 같은 자료형이어야 하며 원소의 갯수를 바꿀 수 없음. 벡터와 행렬 사용하는 선형대수 계산에 주로 사용 C로 구현된 내부 반복문을 사용하여 파이썬 반복문에 비해 속도가 빠름 : 배열 객체는 C와 같이 연속적인 메모리 배치를 가지기에 모든 원소가 같은 자료형이어야 함. 이 덕에 원소에 대한 접근과 반복문 실행이 빨라짐 벡터화 연산(vectorized operation)을 이용해 복잡한 선형대수 연산 수행 : 백터화 연산? 배열의 각 원소에 대한 반복 연산을 하나의 명령어로 처.. 2020. 7. 12.
[Pandas] 데이터 프레임의 이해와 생성 Series? Series는 numpy의 1차원 배열과 구조가 동일 인덱스와 칼럼명을 가지고 있어서 numpy보다 사용이 편리 index를 지정해서 key값으로 사용할 수 있음 Series를 여러 개 붙이면 Dataframe이 됨 import pandas as pd data = pd.Series(['one','two','three']) data.values >>> array(['one','two','three']) data.index >>> RangeIndex(start=0, stop=3, step=1) data = pd.Series(data.values, index=[2,3,4]) >>> 2 one 3 two 4 three data[2] # list와 같이 순서대로 >>> 'three' data['2'.. 2020. 3. 23.
ADsP 대비 Part3.정형 데이터마이닝 ​ 데이터 분석 준전문가 ADsP 한 권으로 끝내기 자율학습으로 한 달 완성 가능한 체계적인 구성과 내용기출문제에 예상문제 300개 수록비전공자들 위한 이론 ‘배경지식’ 박스 + 별도의 문제와 해설한국데이터베이스진흥원에서 실시하고 있는『데이터 분석 준전문가(ADSP)』자격증을 준비하는 수험생들을 위한 책이다. 기존 도서들이 너무나 많고 어려운 내용을 담아 지레 포기하게 만들었다면 이 책은 비전공자들도 이해할 수 있도록 간결하고 쉬운 해설은 물론 이론부문에 ‘배경지식’ 박스와 별도의 문제 및 해설을 추가 수록했다. 개인이 자율학습을 할 경우 1개월 내에 데이터분석에 관한 전반적인 내용... book.naver.com * 위 참고도서를 직접 구입해 개인적으로 공부한 내용을 공유합니다. ADsP를 준비하시는 .. 2019. 5. 16.
ADsP 대비 Part3.통계분석 데이터 분석 준전문가 ADsP 한 권으로 끝내기자율학습으로 한 달 완성 가능한 체계적인 구성과 내용기출문제에 예상문제 300개 수록비전공자들 위한 이론 ‘배경지식’ 박스 + 별도의 문제와 해설한국데이터베이스진흥원에서 실시하고 있는『데이터 분석 준전문가(ADSP)』자격증을 준비하는 수험생들을 위한 책이다. 기존 도서들이 너무나 많고 어려운 내용을 담아 지레 포기하게 만들었다면 이 책은 비전공자들도 이해할 수 있도록 간결하고 쉬운 해설은 물론 이론부문에 ‘배경지식’ 박스와 별도의 문제 및 해설을 추가 수록했다. 개인이 자율학습을 할 경우 1개월 내에 데이터분석에 관한 전반적인 내용...book.naver.com* 위 참고도서를 직접 구입해 개인적으로 공부한 내용을 공유합니다. ADsP를 준비하시는 많은 비전.. 2019. 5. 16.
ADsP 대비 Part3.R기초와 데이터 마트 데이터 분석 준전문가 ADsP 한 권으로 끝내기 http://book.naver.com/bookdb/book_detail.nhn?bid=13773681 * 위 참고도서를 직접 구입해 개인적으로 공부한 내용을 공유합니다. ADsP를 준비하시는 많은 비전공자 분들에게 도움이 되었으면 합니다 :) ​ * 이 포스팅은 PC 버전에 최적화되어 있습니다 ​ ​ 기출 빈도 상 중 하 1. R기초 1) 분석 환경의 의해 (생략) ​ 2) R 언어와 문법 [출처] Ceballos, Maite and Nicolás Cardiel. 2013. "Data structure." First Steps in R. Accessed 2018-05-11. (1) 벡터 : 데이터 내에 들어갈 수 있는 원소는 숫자, 문자, 논리연산자이며 .. 2019. 5. 13.
ADsP 대비 Part2.분석 마스터플랜 데이터 분석 준전문가 ADsP 한 권으로 끝내기 http://book.naver.com/bookdb/book_detail.nhn?bid=13773681 * 위 참고도서를 직접 구입해 개인적으로 공부한 내용을 공유합니다. ADsP를 준비하시는 많은 비전공자 분들에게 도움이 되었으면 합니다 :) ​ * 이 포스팅은 PC 버전에 최적화되어 있습니다 ​ ​ 기출 빈도 상 중 하 1. 분석 마스터플랜 수립 1) 분석 마스터플랜 수립 프레임워크 - 마스터플랜 수립 개요 1. 우선순위 고려요소 2. 적용 우선순위 결정 3. 적용 범위/방식 고려 요소 4. 분석 구현 로드맵 수립 - 전략적 중요도 - 비즈니스 성과/ROI - 실행 용이성 - 업무 내재화 적용 수준 - 분석 데이터 적용 수준 - 기술 적용 수준 * RO.. 2019. 5. 13.
ADsP 대비 Part2.데이터 분석 기획의 이해 데이터 분석 준전문가 ADsP 한 권으로 끝내기 http://book.naver.com/bookdb/book_detail.nhn?bid=13773681 * 위 참고도서를 직접 구입해 개인적으로 공부한 내용을 공유합니다. ADsP를 준비하시는 많은 비전공자 분들에게 도움이 되었으면 합니다 :) ​ * 이 포스팅은 PC 버전에 최적화되어 있습니다 ​ ​ 기출 빈도 상 중 하 1. 분석 기획 방향성 도출 1) 분석 기획의 특징 - 분석 기획 : 어떤 목표(What)을 달성하기 위하여 어떤 데이터를 가지고 어떤 방식(How)를 수행할지에 대한 일련의 계획을 수립하는 작업 - 비즈니스 분석능력과 통계학적 지식을 활용한 분석 역량 및 분석의 도구인 프로그래밍 기술 역량 또한 균형 있게 갖추고 있어야 함 ​ (1) .. 2019. 5. 12.
ADsP 대비 Part1.가치창조를 위한 데이터 사이언스와 전략 인사이트 데이터 분석 준전문가 ADsP 한 권으로 끝내기 http://book.naver.com/bookdb/book_detail.nhn?bid=13773681 * 위 참고도서를 직접 구입해 개인적으로 공부한 내용을 공유합니다. ADsP를 준비하시는 많은 비전공자 분들에게 도움이 되었으면 합니다 :) ​ * 이 포스팅은 PC 버전에 최적화되어 있습니다 ​ ​ 기출 빈도 상 중 하 1. 빅데이터 분석과 전략 인사이트 1) 빅데이터 분석, 'Big'이 핵심이 아님 - 데이터의 양이 아니라 유형의 다양성이 중요. 음성, 텍스트, 이미지, 영상과 같은 다양한 정보 활용이 중요 2) 전략적 통찰이 없는 분석의 함정 - 경쟁의 본질을 제대로 바라보지 못한 채 분석할 경우, 쓸모 없는 결과들만 쏟아냄 - 인구통계학적 변화, .. 2019. 4. 4.