빅데이터/Python

    [파이썬] 카카오톡 대화 내용 분석 2: 대화방에서 가장 많이 사용되는 단어

    카카오톡 PC에서 대화 내용을 내보내기하여 받은 .txt 파일을 분석한다. 추출한 챗 로그 텍스트 파일은 2019년 11월 기준으로 아래처럼 생겼다. 몇 년 전과 달라졌다. 대화방에서 많이 사용되는 단어를 띄어쓰기를 기준으로 split하여 추출하기 때문에, 단어 뒤에 조사가 주로 붙는 한국어에 아주 적합한 코딩은 아니다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 # Most Frequently Used Words import re from collections import Counter words = [] with open(r'C:\Users\카카오톡 대화 내용 텍스트 파일.txt', 'r', encoding='utf-8') as f: for line in f: m = re...

    [파이썬] 카카오톡 대화 내용 분석 1: 대화방에서 가장 많이 뜨는 유저

    카카오톡 PC에서 대화 내용을 내보내기하여 받은 .txt 파일을 분석한다. 추출한 챗 로그 텍스트 파일은 2019년 11월 기준으로 아래처럼 생겼다. 몇 년 전과 달라졌다. 대화방에서 사용자가 출현한 횟수를 기준으로 하기 때문에 글자 수와는 상관이 없다. 아무 글자나 치고 엔터만 눌러대면 1등이다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 # Most Frequent Username import re from collections import Counter words = [] with open(r'./KakaoTalk_카카오톡 챗 파일.txt', 'r', encoding='utf-8') as f: for line in f: m = re.search(r"^\[(.+\]?)..