데이터 청년 캠퍼스(2022)/배운 내용 정리 18

7.1(금) 파이썬 - MatPolt, NumPy

MatPlot 이란? GNUplot처럼 그래프를 그리는 라이브러리이다. MATLAB을 대신할 수 있다. MATLAB이 비싸고 상업용 제품인 반면에 MatPlot은 무료이고 오픈 소스이다. 직선 그래프 그리기 plt,plot(): 그래프 생성 plt.show(): 그래프를 볼 수 있도록 함 plt.xlabel("이름"): x행에 대한 주제명 추가 plt.ylabel("이름"): y행에 대한 주제명 추가 plt.plot(x,y label = "이름"): 해당되는 그래프명 설정 plt.legend(loc="위치"): 해당되는 위치에 그래프 탭 생성 plt.title("이름"): 전체적인 그래프명 생성 점선 그래프, 막대 그래프 생성 NumPy란? 행렬 계산을 위한 파이썬 라이브러리 모듈 처리 속도가 중요한 인..

6.30(목) CSS 3 (2)

조합 선택자 기존의 여러 선택자를 복합적으로 조합하는 방법을 제공 후손 선택자: 선택자A 선택자B - 선택자B가 선택자A에 반드시 포합되어 있을 경우에 선택 자손 선택자: 선택자A> 선택자B - 부모 선택자 A의 직계 자손인 선택자 B를 선택 인접 형제 선택자: 선택자A+선택자B - 선택자 A 바로 다음에 위치한 선택자 B를 선택 일반 형제 선택자: 선택자A~선택자B - 선택자 A 뒤에 인접하여 나타나는 모든 선택자 B를 선택 그룹 선택자: 선택자A, 선택자B - 선택자 A와 선택자 B를 모두 선택 박스 모델의 개념 박스모델이란? 웹 문서에 텍스트, 이미지, 테이블 요소를 배치하기 위해 사용 웹 문서의 전체 레이아웃을 정의 각종 요소들을 원하는 위치에 배치 박스의 속성 content: 실제 내용이 표현되..

6.29(수) CSS 3

CSS3란? 스타일 시트 표준안 웹 문서에 글꼴, 색상, 정렬과 각 요소의 배치 방법 등과 같은 디자인 요소를 적용하는 데 사용 CSS3의 구성 선택자(Selector): 스타일 시트를 적용할 대상을 지정 예: h1 {color: blue; font-size: 12px;} CSS3가 필요한 이유? 문서 작성과 디자인을 분리 - 하나의 웹 문서에서 문서 작성은 HTML이, 디자인은 CSS가 담당 디자인을 분리했을 때 장점 1. 내용과 디자인 수정이 용이 2. 다양한 기능으로 확장 가능 3. 통일된 문서 양식 제공 4. 전송 및 로딩 시간 단축 CSS의 사용 위치 인라인 스타일 시트 내부 스타일 시트 외부 스타일 시트 CSS 적용 우선 순위 !important 사용 인라인 스타일 내부 스타일 외부 스타일(외..

6.28(화) HTML(2)

HTML(2) 텍스트 관련 태그 구분선을 그을 때 사용하는 의 요소 하이퍼링크 태그 다른 사이트 혹은 같은 문서 내 다른 위치로 이동할 때 사용 href 속성값에 URL을 입력해 원하는 곳으로 이동 웹사이트 간 이동 href 속성: 연결하고자 하는 웹사이트의 URL 지정 target 속성: 링크를 클릭했을 때 웹 사이트가 열릴 곳 지정 목록 무순서 목록 - 태그 사용, 각 항목은 태그로 입력 순서 목록 - 태그 사용, 각 항목은 태그로 입력 정의형 목록 - 태그 사용, 정의한 각 항목은 태그를 사용/ 각 항목에 대한 설명은 태그를 사용 표 태그 태그: 행 생성, 태그: 열 생성 태그: 표의 머리를 정의, 셀 제목 글자를 강조하는 역할 태그 표 제목 삽입 셀 병합 rowspan: 셀을 세로로 병합, 속성값..

6.28(화) 데이터 플랫폼 이론(3)

데이터 전처리 수집한 데이터를 바로 분석할 수 없기 때문에 데이터를 정제해야함 > 가장 오래걸리는 과정 데이터 분석을 시작하기 전, 분석 과정에서 오류를 일으킬 수 있는 요인을 미리 찾아야 함 - 결측값 - 잡음/ 이상값 결측값 - 데이터 값이 존재하지 않는 것을 의미한다. > 실수로 누락하거나 필요하지 않아서 없을 수 있음 완전 무작위 결측(MCAR) - 다른 변수와 무관하게 무작위로 발생 무작위 결측(MAR) - 결과 분포 자체에 영향을 미치지 않음 비무작위 결측(NMAR) - 결측값이 결과에 영향을 미치는 경우 결측값의 처리 삭제 - 특정 단일값 - 목록 대체 - 특정값 대체 (특정 대푯값으로 대체) - 다중 대치법 (통계 및 추정을 통해 새로운 데이터 셋을 대체) 잡음/ 이상값 둘 다 동일한 데이..

6.28(화) 데이터 플랫폼 이론(2)

데이터 플랫폼 이론(2) 2) 빅데이터 관리 플랫폼 빅데이터를 이용하기 전, 기획을 잘해야한다. 해결하고자 하는 문제 분석 방법 문제 파악과 해결방법 분석 대상을 알고 있음 분석 방법을 알고 있음 최적화 Optimization 솔루션 solution 분석 방법을 모르고 있음 통찰 Insight 발견 Discovery 분석 대상을 모르고 있음 무엇을 알고 무엇을 모르는가 가용 데이터 - 가용 데이터에 대한 유형 파악 적절한 활용 방안과 유즈 케이스 - 기존에 만들어진 사례 및 솔루션을 최대한 활용 사전 계획 수립 - 장애 요소에 대한 사전 계획 수립 하향식 접근 - 분석 대상을 알 때 문제 탐색 단계 문제 정의 단계 해결방안 탐색 단계 타당성 검토 단계 상향식 접근 - 분석 대상을 모를 때 지도/비지도 학..

6.27(월) HTML

HTML5 문서를 선언하는 구문 생략가능, 하위 호환성을 위해 작성 권장 ~ HTML5 문서의 시작과 종료 언어 속성을 사용하여 주된 언어 값 설정 가능 웹 페이지의 정보를 정의 태그와 javascript, 스타일시트 등을 정의 ~ HTML5 문서의 본문을 작성 HTML5 문서의 작성 규칙 태그 이름은 대소문자를 구분하지 않음 > 따라서 소문자로 작성할 것을 권장 본문 내 연속된 공백이나 줄 바꿈은 하나의 공백으로 처리 > 엔터, 탭, 스페이스바 대신 특수 문자를 사용 권장 태그의 포함 관계를 표현하기 위해 들여쓰기 적용 > 문서의 구조를 명확하게 작성(들여쓰기 및 줄 바꿈) 주석은

6.27(월) 데이터 플랫폼 이론

데이터 플랫폼 이론 1) 데이터 플랫폼의 이해 Plat = form = Plaform 승장장을 예로 듦: 효율적으로 타고 내릴 수 있는 것 즉, 데이터의 수집/저장/처리/관리 및 분석 등의 역할 수행을 지원 빅데이터 관리 플랫폼 데이터 수집/저장/처리/관리 빅데이터 분석 플랫폼 데이터 분석 컴퓨터에서 플랫폼의 종류 하드웨어 플랫폼 (IBM / ARM) - 핵심 동작 부분들이 똑같이 동작하도록 함 운영체제 플랫폼 (iOS / Android) - 같은 운영체제 내에서는 쉽게 정보를 옮길 수 있음 - 단, 운영체제가 다르면 하드웨어도 다르기 때문에 설치는 가능하나 가용성이 낮아짐 소프트웨어 플랫폼 (MS Office / 한컴) 크로스 플랫폼 빅데이터와 데이터의 차이점 Volume(크기) Variety(다양성)..