일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 역검 전략게임 꿀팁
- 토픽모델링
- python
- 코딩테스트
- pyLDAvis
- nlp
- 형태소분석
- 파이썬
- ai역검 합격
- 역검 전략게임
- kpmg 인성검사
- MYSQL
- mecab
- 역검 합격 꿀팁
- 잡다 ai역검
- 역검 결과표
- gensim
- join
- lda
- 삼정kpmg mc4
- 삼정kpmg 서류
- 잡다 ai역량검사
- 삼정kpmg pt면접
- 서비스
- 컨설팅 면접
- 오류
- 후기
- 프로그래머스
- 삼정kpmg 취업
- SQL
- Today
- Total
목록nlp (4)
쥬니어 분석가

지난 게시물에서는 LDA 시각화를 구현해보았습니다. 🔽 LDA 시각화 방법 참고 [NLP/토픽모델링] 리뷰 분석 - LDA 모델링, 하이퍼파라미터 튜닝지난 게시글에서 집닥 인테리어 고객 후기 데이터를 크롤링하여 데이터프레임으로 추출하였습니다. 이번 게시글에서는 LDA 토픽 모델링을 토대로 집닥 인테리어 후기를 분석해보겠습니다. 1. 텍jiyoon1ing.tistory.com 이번 게시물에서는 LDA 토픽모델링 시각화를 통해 얻은 각 토픽 별 단어들을 보고 공통점을 찾아 라벨링을 해주고, 유사한 토픽끼리는 그룹을 묶어서 확인해보려고 합니다. ▶ Group 1. 만족도 관련 - Topic 1,2,4 Topic 1 - 시공 전반적 만족도키워드 : 인테리어, 공사, 진행, ..

지난 게시글에서 집닥 인테리어 고객 후기 데이터를 크롤링하여 데이터프레임으로 추출하였습니다. 이번 게시글에서는 LDA 토픽 모델링을 토대로 집닥 인테리어 후기를 분석해보겠습니다. 1. 텍스트 전처리 import numpy as np import pandas as pd from eunjeon import Mecab mecab = Mecab(dicpath='C:/mecab/mecab-ko-dic') import re from collections import Counter 이전 게시물에서 크롤링을 통해 얻은 집닥 인테리어 후기 데이터를 가지고 옵니다. data = pd.read_csv("집닥 리뷰.csv") 총 510개의 리뷰 데이터에서 한국어 텍스트만 보기 위해 텍스트 정규화를 진행하였습니다. data['..

1. 형태소 분석기 비교 한국어 자연어 처리를 위해서는 KoNLPy라는 파이썬 패키지를 사용할 수 있습니다. 형태소 분석기로는 Okt(Open Korea Text), 메캅(Mecab), 코모란(Komoran), 한나눔(Hannanum), 꼬꼬마(Kkma)가 있습니다.저는 이 중 Okt, Kkma, Mecab 형태소 분석기를 사용하려고 합니다. 각각의 메소드는 아래와 같은 기능을 갖고 있습니다.1) morphs : 형태소 추출 2) pos : 품사 태깅(Part-of-speech tagging) 3) nouns : 명사 추출 이제 파이썬에서 형태소 분석기를 사용하여 토큰화를 해보도록 합시다.아이고 하기싫어from konlpy.tag import Oktfrom konlpy.tag im..

C:\mecab의 폴더는 아래와 같은 3개의 폴더로 이뤄져 있습니다. 물론 사람마다 폴더의 경로는 다르니 자신의 mecab 폴더 경로를 확인해 주시면 됩니다. mecab-ko-dic : mecab의 단어 사전 tools : 단어 사전에 단어를 추가시킨 후 컴파일 및 적용을 시켜주는 프로그램들 존재 user-dic : 사용자가 추가적으로 추가한 단어에 대한 단어 사전 필자의 경우 "고대숲"을 하나의 명사로 인식하고 싶었는데 mecab에서 고대/숲 따로 인식해서 이걸 사용자 정의 사전에 추가하려고 합니다. from eunjeon import Mecab m=Mecab() sentence = "오랜만에 페이스북 들어가서 고대숲을 읽었는데 너무 슬프네요" m.pos(sentence) 단어 사전에 단어를 추가하는 ..