일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- lda
- ai역검 합격
- 역검 전략게임
- SQL
- 파이썬
- 역검 결과표
- 역검 전략게임 꿀팁
- 토픽모델링
- pyLDAvis
- 후기
- 삼정kpmg mc4
- 삼정kpmg pt면접
- 잡다 ai역량검사
- kpmg 인성검사
- mecab
- MYSQL
- 서비스
- join
- 코딩테스트
- 형태소분석
- python
- 삼정kpmg 서류
- gensim
- 프로그래머스
- 오류
- 역검 합격 꿀팁
- nlp
- 컨설팅 면접
- 잡다 ai역검
- 삼정kpmg 취업
- Today
- Total
목록파이썬 (6)
쥬니어 분석가

지난 게시물에서는 LDA 시각화를 구현해보았습니다. 🔽 LDA 시각화 방법 참고 [NLP/토픽모델링] 리뷰 분석 - LDA 모델링, 하이퍼파라미터 튜닝지난 게시글에서 집닥 인테리어 고객 후기 데이터를 크롤링하여 데이터프레임으로 추출하였습니다. 이번 게시글에서는 LDA 토픽 모델링을 토대로 집닥 인테리어 후기를 분석해보겠습니다. 1. 텍jiyoon1ing.tistory.com 이번 게시물에서는 LDA 토픽모델링 시각화를 통해 얻은 각 토픽 별 단어들을 보고 공통점을 찾아 라벨링을 해주고, 유사한 토픽끼리는 그룹을 묶어서 확인해보려고 합니다. ▶ Group 1. 만족도 관련 - Topic 1,2,4 Topic 1 - 시공 전반적 만족도키워드 : 인테리어, 공사, 진행, ..

지난 게시글에서 집닥 인테리어 고객 후기 데이터를 크롤링하여 데이터프레임으로 추출하였습니다. 이번 게시글에서는 LDA 토픽 모델링을 토대로 집닥 인테리어 후기를 분석해보겠습니다. 1. 텍스트 전처리 import numpy as np import pandas as pd from eunjeon import Mecab mecab = Mecab(dicpath='C:/mecab/mecab-ko-dic') import re from collections import Counter 이전 게시물에서 크롤링을 통해 얻은 집닥 인테리어 후기 데이터를 가지고 옵니다. data = pd.read_csv("집닥 리뷰.csv") 총 510개의 리뷰 데이터에서 한국어 텍스트만 보기 위해 텍스트 정규화를 진행하였습니다. data['..

텍스트 정제 - replace( ) 함수 파이썬을 사용하다 보면 문장의 오탈자 수정 및 특정 단어를 다른 단어로 변환하고 싶을 때가 있습니다. 그럴 때 파이썬의 relace() 함수를 사용하면 빠르게 원하는대로 문장을 수정할 수 있습니다. 함수 사용 방법 str.replace(old, new, count) str: 문자열 old: 바꾸고 싶은 문자열 new: 바꿀 문자열 count (선택 사항): old 문자열을 몇 번 바꿀 것인지 선택/ 기본값은 -1이며, 모든 old 문자열을 new 문자열로 변경 함수 사용 예시 import pandas as pd text = "데이터분석은 어렵지만 유용해😊 데이터분석 공부를 으쌰으쌰 열심히해서 멋진 분석가가 될거야~^_^!" # "데이터분석"을 "마케팅"으로 바꾸기..

먼저 크롤링을 하기 위한 환경 구성을 위해 webdrvier-manager를 설치해준다. pip install webdriver-manager 그 후 크롤링을 위해 필요한 라이브러리와 그 외 필요한 time, pandas 라이브러리를 import 해준다. 동적 크롤링을 위한 selenium과 정적 크롤링을 위한 Beautifulsoup 두 개를 사용하였고, webdriver로는 크롬드라이버를 사용해서 진행하였다. from bs4 import BeautifulSoup from selenium import webdriver from selenium.webdriver.common.by import By from selenium.webdriver.support.ui import WebDriverWait from..

요즘 버전을 다운 받으면 아래와 같은 오류가 안뜨겠지만 나는 파이썬 버전 문제인지 gensim 버전 문제인지 import pyLDAvis.gensim_models 자체가 되지 않았다. gensim_models은 최신 업데이트 버전이고, 나는 최신 버전이 실행이 안되서 import pyLDAvis.gensim 로 불러오니 1차적으로 import는 되었지만 아래와 같은 오류가 발생했다. UnicodeEncodeError: 'ascii' codec can't encode characters in position 18-23: ordinal not in range(128) C:\Anaconda3\lib\site-packages\joblib\externals\loky\backend\resource_tracker.p..

'ImageDraw' object has no attribute 'textbbox' > cmd에서 작성 pip uninstall pillow pip install pillow 로 해결 그러고나서 나온 다른 오류들 1. cannot open resource 2. Only supported for TrueType fonts 두 오류 모두 한글 폰트 경로를 변경해주면 된다고 했지만 나는 경로를 바꿔도 해결이 안됐다. 수많은 구글링을 한 결과 내 파이썬 버전이 3.6인 경우는 아래 코드 하나로 오류가 바로 해결이 될 수 있었다. > 파이썬 3.6 버전인 경우 pip install wordcloud==1.8.0 야호 성공!