빅데이터

    컴퓨터 구조와 원리

    Computer System 1. Hardware: 모든 컴퓨터는 CPU-Memory-I/O Device 순으로 직렬 연결됨(입력 - 메모리 - CPU연산 - 메모리 - 출력) - Hardware를 제어하는 운영체제(OS)가 필수. 1.1 CPU: ALU(Arithmetic logic unit, 연산) + CU(Control Unit, 제어) + Register 명령 Decode ↑명령 Fetch | ↕data 읽기, 쓰기 1.2 Memory: 명령 = data + 명령어(연산자) - 1 bit(0/1)는 최소 표현 단위. 8 bit = 1 byte = 256(2**8)가지의 표현 종류[ASCII 코드*] - 메모리 접근 절차: 1) 메모리 주소 지정(Address Bus) 2) 동작 결정(읽기/쓰기, ..

    [파이썬] 카카오톡 대화 내용 분석 2: 대화방에서 가장 많이 사용되는 단어

    카카오톡 PC에서 대화 내용을 내보내기하여 받은 .txt 파일을 분석한다. 추출한 챗 로그 텍스트 파일은 2019년 11월 기준으로 아래처럼 생겼다. 몇 년 전과 달라졌다. 대화방에서 많이 사용되는 단어를 띄어쓰기를 기준으로 split하여 추출하기 때문에, 단어 뒤에 조사가 주로 붙는 한국어에 아주 적합한 코딩은 아니다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 # Most Frequently Used Words import re from collections import Counter words = [] with open(r'C:\Users\카카오톡 대화 내용 텍스트 파일.txt', 'r', encoding='utf-8') as f: for line in f: m = re...

    [파이썬] 카카오톡 대화 내용 분석 1: 대화방에서 가장 많이 뜨는 유저

    카카오톡 PC에서 대화 내용을 내보내기하여 받은 .txt 파일을 분석한다. 추출한 챗 로그 텍스트 파일은 2019년 11월 기준으로 아래처럼 생겼다. 몇 년 전과 달라졌다. 대화방에서 사용자가 출현한 횟수를 기준으로 하기 때문에 글자 수와는 상관이 없다. 아무 글자나 치고 엔터만 눌러대면 1등이다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 # Most Frequent Username import re from collections import Counter words = [] with open(r'./KakaoTalk_카카오톡 챗 파일.txt', 'r', encoding='utf-8') as f: for line in f: m = re.search(r"^\[(.+\]?)..