일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 잡다 ai역량검사
- MYSQL
- 형태소분석
- kpmg 인성검사
- 프로그래머스
- pyLDAvis
- 삼정kpmg mc4
- 잡다 ai역검
- 후기
- nlp
- 역검 결과표
- gensim
- 삼정kpmg pt면접
- 오류
- 컨설팅 면접
- ai역검 합격
- lda
- 코딩테스트
- SQL
- 역검 전략게임
- 토픽모델링
- 서비스
- 삼정kpmg 취업
- 파이썬
- 역검 전략게임 꿀팁
- 역검 합격 꿀팁
- python
- join
- 삼정kpmg 서류
- mecab
- Today
- Total
목록pyLDAvis (3)
쥬니어 분석가

지난 게시물에서는 LDA 시각화를 구현해보았습니다. 🔽 LDA 시각화 방법 참고 [NLP/토픽모델링] 리뷰 분석 - LDA 모델링, 하이퍼파라미터 튜닝지난 게시글에서 집닥 인테리어 고객 후기 데이터를 크롤링하여 데이터프레임으로 추출하였습니다. 이번 게시글에서는 LDA 토픽 모델링을 토대로 집닥 인테리어 후기를 분석해보겠습니다. 1. 텍jiyoon1ing.tistory.com 이번 게시물에서는 LDA 토픽모델링 시각화를 통해 얻은 각 토픽 별 단어들을 보고 공통점을 찾아 라벨링을 해주고, 유사한 토픽끼리는 그룹을 묶어서 확인해보려고 합니다. ▶ Group 1. 만족도 관련 - Topic 1,2,4 Topic 1 - 시공 전반적 만족도키워드 : 인테리어, 공사, 진행, ..

지난 게시글에서 집닥 인테리어 고객 후기 데이터를 크롤링하여 데이터프레임으로 추출하였습니다. 이번 게시글에서는 LDA 토픽 모델링을 토대로 집닥 인테리어 후기를 분석해보겠습니다. 1. 텍스트 전처리 import numpy as np import pandas as pd from eunjeon import Mecab mecab = Mecab(dicpath='C:/mecab/mecab-ko-dic') import re from collections import Counter 이전 게시물에서 크롤링을 통해 얻은 집닥 인테리어 후기 데이터를 가지고 옵니다. data = pd.read_csv("집닥 리뷰.csv") 총 510개의 리뷰 데이터에서 한국어 텍스트만 보기 위해 텍스트 정규화를 진행하였습니다. data['..

요즘 버전을 다운 받으면 아래와 같은 오류가 안뜨겠지만 나는 파이썬 버전 문제인지 gensim 버전 문제인지 import pyLDAvis.gensim_models 자체가 되지 않았다. gensim_models은 최신 업데이트 버전이고, 나는 최신 버전이 실행이 안되서 import pyLDAvis.gensim 로 불러오니 1차적으로 import는 되었지만 아래와 같은 오류가 발생했다. UnicodeEncodeError: 'ascii' codec can't encode characters in position 18-23: ordinal not in range(128) C:\Anaconda3\lib\site-packages\joblib\externals\loky\backend\resource_tracker.p..