전체 글

전체 글

    [R] 변수란?

    R 프로그래밍에서 사용되는 대부분 자료는 변수와 자료형이라는 용어와 관련이 있다. 변수는 자료를 일시적으로 보관하는 역할을 하며, 자료형은 숫자, 또는 문자와 같은 자료의 유형을 의미. 변수: 분석에 필요한 자료를 일시적으로 저장하거나 처리결과를 담을 수 있는 기억장소를 지정해주는 역할 1. 속성(Attribute) – 기억 장소 모양 1.1 자료형(Data Type) 1.2 기억장소 크기 1.3 값 저장 방식 1.4 값의 범위: Overflow / Underflow Error 2. 연산(기능, 동작) 연산은 기억 장소를 이용하여 변경하고 동작 2.1 읽기 기능(R value) 2.2 쓰기 기능(L value) 2.3 산술/관계/논리연산 - 산술(사칙연산): 결과는 숫자형 - 관계(대소비교): 결과는 논..

    Algorithm 알고리즘의 원칙

    유한성: 프로그램이 끝나야 한다. 0개 이상의 입력: 메모리에 기록 1개 이상의 출력: 메모리 내용 출력 유효성 효과성

    Program Language 유형

    Program의 기능 1. 기억 장소 확보 2. 기억 장소 내용을 알고리즘에 따라 읽고 쓰기 하여 결과 도출 *Overflow Error, Underflow Error Compile 방식 - 실행 속도 빠름 - 변경 후 재 컴파일 필요 Interpreter 방식 (ex. Web, R) - 실행 속도 느림(실행 시마다 번역) - 간편(변경 적용이 용이) - Script 형태로 주로 사용 Source Code* → (Compile/Syntax Error) → Object Code** → (Link/Link Error) → Execute Code*** → 실행 (Load/Run-time Error****) → 결과 * Source File: 텍스트 파일 (ASCII) ** Object File: 실행 불가능한..

    4차 산업혁명의 빅데이터와 데이터 과학

    1차 산업혁명: 증기 이용 2차 산업혁명: 전기 이용 3차 산업혁명: 인터넷(World Wide Web) 이용 - 인터넷 1.0 시대: 단순 검색 수준 - 인터넷 2.0 시대: 참여가 가능(쌍방향) - 인터넷 3.0시대: 사용자에 의한 contents 생성 미래 4차 산업혁명: - IoT (사물 인터넷) - Big Data: 사물 인터넷으로부터 무수히 더 많은 데이터가 발생 – 숨겨진 이면을 분석 - AI (Artificial Intelligence) & Machine Learning - Blockchain 빅데이터 Big Data: - 정의: 통상적으로 사용되는 데이터 수집, 관리 및 처리 소프트웨어의 수용 한계를 넘어서는 크기의 데이터. 빅데이터의 크기는 단일 데이터 집합의 크기가 수십 테라 바이트에..

    버전 관리 시스템 Version Control System [Git]

    Version Control System Server (Service Provider) Client 중앙집중식 각 클라이언트가 작업한 것을 중앙 서버로 보내는 형식이며, SVN와 CVS 등이 있다. 최근에는 잘 사용되지 않는 방식. 분산식 각 클라이언트가 각 VCS를 운영하며 필요할 때 클라이언트끼리 연결됨(각각의 버전 유지가 됨). Git (각 로컬) – GitHub (협업할 때 서버 역할). Git: 버전 관리 tool - Local 영역 버전 관리: git tool - Global 영역 버전 관리: git tool, GitHub Git 유틸리티 다운 받고 설치: https://git-scm.com/ 명령 프롬프트에서 git --version 입력하여 잘 설치되었는지 확인. 초보자는 Visual St..

    개발자용 에디터 글꼴 폰트 추천

    네이버에서 제공. 한글이 자연스럽게 나오는 게 장점. https://github.com/naver/d2codingfont naver/d2codingfont D2 Coding 글꼴. Contribute to naver/d2codingfont development by creating an account on GitHub. github.com 한글 사용에 최적은 아님. https://sourcefoundry.org/hack/ Hack | A typeface designed for source code A Family of Four Faces Hack includes monospaced regular, bold, italic, and bold italic sets to cover all of your synt..

    컴퓨터 구조와 원리

    Computer System 1. Hardware: 모든 컴퓨터는 CPU-Memory-I/O Device 순으로 직렬 연결됨(입력 - 메모리 - CPU연산 - 메모리 - 출력) - Hardware를 제어하는 운영체제(OS)가 필수. 1.1 CPU: ALU(Arithmetic logic unit, 연산) + CU(Control Unit, 제어) + Register 명령 Decode ↑명령 Fetch | ↕data 읽기, 쓰기 1.2 Memory: 명령 = data + 명령어(연산자) - 1 bit(0/1)는 최소 표현 단위. 8 bit = 1 byte = 256(2**8)가지의 표현 종류[ASCII 코드*] - 메모리 접근 절차: 1) 메모리 주소 지정(Address Bus) 2) 동작 결정(읽기/쓰기, ..

    [파이썬] 카카오톡 대화 내용 분석 2: 대화방에서 가장 많이 사용되는 단어

    카카오톡 PC에서 대화 내용을 내보내기하여 받은 .txt 파일을 분석한다. 추출한 챗 로그 텍스트 파일은 2019년 11월 기준으로 아래처럼 생겼다. 몇 년 전과 달라졌다. 대화방에서 많이 사용되는 단어를 띄어쓰기를 기준으로 split하여 추출하기 때문에, 단어 뒤에 조사가 주로 붙는 한국어에 아주 적합한 코딩은 아니다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 # Most Frequently Used Words import re from collections import Counter words = [] with open(r'C:\Users\카카오톡 대화 내용 텍스트 파일.txt', 'r', encoding='utf-8') as f: for line in f: m = re...

    [파이썬] 카카오톡 대화 내용 분석 1: 대화방에서 가장 많이 뜨는 유저

    카카오톡 PC에서 대화 내용을 내보내기하여 받은 .txt 파일을 분석한다. 추출한 챗 로그 텍스트 파일은 2019년 11월 기준으로 아래처럼 생겼다. 몇 년 전과 달라졌다. 대화방에서 사용자가 출현한 횟수를 기준으로 하기 때문에 글자 수와는 상관이 없다. 아무 글자나 치고 엔터만 눌러대면 1등이다. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 # Most Frequent Username import re from collections import Counter words = [] with open(r'./KakaoTalk_카카오톡 챗 파일.txt', 'r', encoding='utf-8') as f: for line in f: m = re.search(r"^\[(.+\]?)..