💻프로그래밍/🕵️‍♀️모두의데이터분석 8

[파이썬] 09. ValueError/break/원그래프

📅 스터디 날짜 | 2021.01.25 📖 모두의 데이터 분석 | Unit 09 p124-139 #1 barh의 두 매개변수 데이터 개수가 일치하지 않아, ValueError 발생 (1) 오류 분석 ValueError (값에 오류가 있음) : x축의 데이터 개수와 찾은 데이터 개수가 일치하지 않아 발생한 에러 '제주'를 입력할 경우, 제주가 들어간 열이 많아서 데이터의 개수가 맞지 않기 때문에 오류가 발생한다. plt.barh(range(101),m) : x축데이터 101개이지만, m에 저장된 데이터는 101개를 훨씬 넘는다. len(m) = 4646, len(f) = 4646 import csv f = open ('gender.csv') data = csv.reader(f) m=[] f=[] name ..

[파이썬] 08. 막대그래프/수평막대그래프/항아리모양그래프

📅 스터디 날짜 | 2021.01.22 📖 모두의 데이터 분석 | Unit 08 p109-123 #1 막대그래프 막대그래프에서 막대의 길이는 각 데이터의 크기를 의미한다. bar() : 막대그래프를 표현하는 명령어, 두 가지 매개변수가 필요하다. bar(막대를 표시할 위치, 막대의 높이) 두 종류의 값들은 개수가 일치해야 함. range() 함수를 사용해서 막대 그래프 위치 표현할 수 있다. plt.bar(range(6), [1,2,3,4,6,7]) barh() : 수평막대그래프로 표현하는 명령어 import matplotlib.pyplot as plt plt.bar([0,1,2,4,6,10], [1,2,3,5,6,7]) plt.show() #range 함수를 활용해 막대그래프 표현 plt.bar(ran..

[파이썬] 07. 행안부데이터다운/ggplot스타일/인구구조시각화

📅 스터디 날짜 | 2021.01.22 📖 모두의 데이터 분석 | Unit 07 p96-108 #1 행안부 데이터 내려받기 #2 입력받은 지역의 인구 데이터 시각화 A in B : A가 B안에 존재하면 참, 그렇지 않으면 거짓을 반환한다. row[3:] : row 리스트의 3번 인덱스부터 끝까지를 의미 print(len(row[3:]))를 통해 모든 구간이 잘 포함되었는지 확인 가능 plt.stype.use('ggplot') : 격자무늬 스타일 지정 ggplot스타일 외에도 다양한 스타일 적용 가능 print(plt.style.available) 을 통해 적용할 수 있는 스타일 이름 확인 가능 import csv f = open('age.csv') data = csv.reader(f) result = [..

[파이썬] 06. 히스토그램/상자그림/랜덤값

📅 스터디 날짜 | 2021.01.21 📖 모두의 데이터 분석 | Unit 06 p77-94 #1 히스토그램 hist() : 데이터를 히스토그램으로 그릴 수 있는 함수 plt.hist([1,1,3,5]) bins : 가로축의 구간 개수를 설정하는 속성 옵션 plt.hist(dice, bins=6) import matplotlib.pyplot as plt plt.hist([1,2,3,4,5,6,6,7,8,10]) #hist()함수를 통해 히스토그램 생성 plt.show() import matplotlib.pyplot as plt import random dice = [] for i in range(100) : dice.append(random.randint(1,6)) plt.hist(dice, bins=6..

[파이썬] 05. len()/split()/꺾은선그래프/조건 데이터 출력

📅 스터디 날짜 | 2021.01.20 📖 모두의 데이터 분석 | Unit 05 p64-76 #1 데이터 리스트에 저장 .append() : result라는 리스트에 값을 추가한다. len() : 리스트의 데이터 개수를 반환한다. 데이터가 모두 잘 저장되었는지 한 눈에 확인하기 좋다. import csv f=open('seoul.csv') data=csv.reader(f) next(data) result=[] #최고 기온 데이터를 저장할 리스트 생성 for row in data : if row[-1] != '' : # 빈 데이터가 아니라면 result.append(float(row[-1])) # result 리스트에 최고 기온 값 추가 print(result) import csv f=open('seoul..

[파이썬] 04. matplotlib라이브러리/선그래프/그래프옵션(제목,범례,색상,선모양,마커모양)

📅 스터디 날짜 | 2021.01.20 📖 모두의 데이터 분석 | Unit 04 p54-63 #1 matplotlib 라이브러리 파이썬에서 2D 형태의 그래프, 이미지 등을 그릴 때 사용하는 라이브러리 실제 과학 컴퓨팅 연구 분야나 인공지능 연구 분야에서도 많이 활용 imoport matplotlib.pyplot : matplotlib 라이브러리의 pyplot 모듈 불러옴 import matplotlib.pyplot as plt : plt라는 별명을 통해 라이브러리 임포트 즉, plt.plot() = matplotlib.pyplot.plot() 참고 자료 : matplotlib 홈페이지 matplotlib.org/ #2 기본그래프(선그래프) 그리기 plot() : 직선 또는 꺾은선 형태의 기본 그래프를 ..

[파이썬] 03. 데이터 최고값 출력

📅 스터디 날짜 | 2021.01.19 📖 모두의 데이터 분석 | Unit 03 p43-52 #1 리스트의 맨 뒤 접근방법 리스트의 맨 뒤의 index는 -1이다. (첫 번째 값 바로 앞이 곧 맨 뒤의 값이라는 원리로 이해) 예를 들어, list라는 이름의 배열인 경우 list[-1]으로 리스트의 마지막 값에 접근할 수 있다. 즉, 크기가 4인 list의 경우 list[3] = list[-1] #2 CSV 값을 실수형으로 변환 csv파일의 데이터는 숫자 값이 아닌 문자열이기 때문에, 값을 더하거나 크기 비교를 할 수 없다. float() : 실수(float) 데이터로 변환하는 함수 import csv f = open('seoul.csv') data = csv.reader(f) header = next(d..

[파이썬] 02. CVS파일 읽어오기/출력/헤더저장

📅 스터디 날짜 | 2021.01.18 📖 모두의 데이터 분석 | Unit 02 p28-42 #1 CSV 파일 데이터 관련 함수 csv.reader() : CSV파일에서 데이터를 읽어오는 함수 csv.writer() : CSV 파일에 데이터를 저장하는 함수 csv파일은 데이터가 쉼표(,)로 구분되어 있다. #2 주피터 노트북 오픈 소스 기반의 웹 애플리케이션으로, 파이썬을 비롯한 40여 개의 프로그래밍 언어로 코드를 작성하고 실행하는 개발 환경을 제공한다. 아나콘다를 설치하면 주피터 노트북을 바로 사용할 수 있다. 아나콘다를 이용하면 파이썬은 물론 유용한 여러가지 라이브러리를 간편하게 불러올 수 있다. #3 CSV파일에서 파일 읽어오기 import csv #csv모듈을 불러온다 f = open('seou..