데이터 분석 (29) 썸네일형 리스트형 13. 떡볶이집의 입점전략 떡볶이집의 입점전략 pandas import import pandas as pd 사용할 데이터 셋(소상공인시장진흥공단_상가(상권)정보_서울_202303) 데이터프레임으로 저장 df = pd.read_csv('/content/drive/MyDrive/데이터분석/소상공인시장진흥공단_상가(상권)정보_서울_202303.csv') 데이터프레임 출력 df 파리바게트 데이터 필터링하기 contains() 특정 문자열 포함여부를 True, False로 반환 # '상호명'이 '파리바게트'이거나 '파리바게뜨'인 데이터 추출 cont1 = df["상호명"].str.contains(r'파리바게트|파리바게.. 12.스타벅스 API를 이용한 프로젝트 스타벅스 API를 이용한 프로젝트 라이브러리 import import requests import folium import json from pandas.io.json import json_normalize import warnings warnings.filterwarnings("ignore") 스타벅스 api 데이터 가져오기 targetSite = 'https://www.starbucks.co.kr/store/getSidoList.do' request = requests.post(targetSite) print(request) print(request.text) 스타벅스 데이터를 딕셔너리 타입으로 변환하기 star_json = json.loads(request.text) print(star_json) .. 11. 따릉이 API를 이용한 프로젝트 API(Application Programming Interface) 여러 프로그램들과 데이터베이스, 여러 기능들의 상호 통신 방법을 정하고 도와주는 매개체 따릉이 API 접속하기 라이브러리 import import requests # 요청과 응답을 받아오는 라이브러리 import folium import json # json을 다루는 라이브러리 from pandas.io.json import json_normalize # json을 데이터프레임을 바꿔줌 import warnings # warning 제거시켜주는 라이브러리 # warnings.filterwarnings("ignore")를 작성해야 warning이 뜨지않음 warnings.filterwarnings("ignore") 따릉이 api 데이터 .. 10. 전국 도시공원 데이터 프로젝트 전국 도시공원 데이터 프로젝트 사용할 라이브러리 import import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns 한글폰트 설치 및 등록 !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf plt.rc("font", family="NanumBarunGothic") 사용할 전국 도시공원 데이터셋 park = pd.read_csv("/content/drive/MyDrive/데이터분석/전국도시공원표준데이터 (2).csv", encoding="ms949") par.. 9. 상권별 업종 밀집 통계 프로젝트 상권별 업종 밀집 통계 프로젝트 사용할 라이브러리 import import pandas as pd import numpy as np import matplotlib.pyplot as plt # seaborn: matplotlib 기반으로 만들어진 시각화 라이브러리 import seaborn as sns 한글폰트 설치 및 등록 !sudo apt-get install -y fonts-nanum !sudo fc-cache -fv !rm ~/.cache/matplotlib -rf plt.rc("font", family="NanumBarunGothic") 사용할 데이터셋 shop = pd.read_csv("/content/drive/MyDrive/데이터분석/shop_201806_01 (1).csv").. 8. folium folium leaflet.js 기반으로 만들어진 라이브러리 지도위에 데이터를 표현해주는 대표적인 파이썬 지도 시각화 라이브러리 folium document Folium — Folium 0.14.0 documentation folium builds on the data wrangling strengths of the Python ecosystem and the mapping strengths of the leaflet.js library. Manipulate your data in Python, then visualize it in on a Leaflet map via folium. Concepts folium makes it easy to visualize data tha python-visualiza.. 7. 워드 클라우드(Word Cloud) 워드 클라우드(Word Cloud) 핵심 단어를 시각화 하는 기법 문서의 키워드, 개념등을 직관적으로 파악할 수 있게 핵심 단어를 시각적으로 돋보이게 하는 기법 Word Cloud 설치 !pip install wordcloud alice.txt 읽어오기 text = open("/content/drive/MyDrive/데이터분석/alice.txt").read() text Word Cloud import from wordcloud import WordCloud generate() 단어별 출현 빈도수를 비율로 반환하는 객체를 생성 wordcloud = WordCloud().generate(text) wordcloud # words_ 생성된 워드 클라우드에서 단어와 그 빈도수를 확인하는 속성 wor.. 6. 형태소 분석 자연어 일상에서 사용하는 언어 컴퓨터는 자연어를 직접적으로 이해할 수 없음 -> 컴퓨터가 자연어 의미를 분석해 처리할 수 있도록 하는 일을 "자연어 처리(Natural Language Processing)"라고 부름 토크나이징 문장을 의미가 있는 가장 작은 단어들로 나눔 나눠진 단어들을 이용해 의미를 분석 가장 기본이 되는 단어들을 "토큰"이라고 부름 문장 형태의 데이터를 처리하기 위해 제일 처음 수행해야 하는 기본적인 작업 토크나이징을 어떻게 하느냐에 따라 성능의 차이가 날 수 있음 형태소 분석 자연어의 문장을 형태소라는 최소 단위로 분할하고 품사를 판별하는 작업 영어의 형태소 분석은 형태소마다 띄어쓰기를 해서 문장을 구성하는 것이 기본(분석이 쉬운편) 아시아 계열의 언어분석은 복잡하고 많은 노력이 필.. 이전 1 2 3 4 다음