본문 바로가기

분류 전체보기

(29)
LZW 알고리즘과 허프만 부호화 방법을 서로 비교하여 분석해보자. LZW알고리즘과 허프만 부호화 방법을 비교하기에 앞서, 먼저 각각의 방법을 소개하겠습니다. □LZW 알고리즘 먼저 LZW 알고리즘은 무손실 압축 알고리즘입니다. LZW 알고리즘은 크게 5가지 단계로 나뉩니다. (1) input을 연다. (2) 버퍼에 저장되어 있는 것과 합친다. (3) 사전에 있는지 확인한다. (4) 사전에 있으면 버퍼에 저장하고, 없으면 사전에 등록한다. (5) 사전에 등록할 때 맨 뒷글자를 빼고 압축파일로 보낸다. 인터넷의 예제 중 하나를 가지고 설명해보겠습니다. input 사전 존재 유무 사전 등록 output a b a b c d a b c a d a c a b c d a b c Y N N Y N N N Y Y N N Y N N Y Y N Y N N 257 a b 258 b a 2..
기사를 크롤링하여 워드클라우드를 만들어보자. 기사를 크롤링하여 WORDCLOUD를 만들어보자.¶ 기사를 크롤링하여 Wordcloud를 만들어 보겠습니다. 먼저 저는 조선일보의 기사를 이용하였습니다. 전체적인 구조는 크롤링을 하고 의미없는 값들을 정리한 후 기사들을 모두 단어로 쪼개서 wordcloud를 만들어 보았습니다. In [1]: from urllib.request import urlopen from bs4 import BeautifulSoup from wordcloud import WordCloud, STOPWORDS import numpy as np from PIL import Image import nltk from konlpy.tag import Kkma from konlpy.corpus import kobill In [3]: url_..
확장명 ipynb를 py로 바꿔보자. 주피터 노트북을 사용하다 보면 파이썬 파일이 ipynb 확장자로 저장이 되는데요, 가끔 주피터 노트북 상에서 오류가 나서 열리지 않을 경우가 있습니다. 그럴때는 py로 바꿔서 다른 파이썬 프로그램으로 열어주면 됩니다! 먼저 명령 프롬프트 창을 켜고 jupyter nbconvert --to script 파일명.ipynb 명령어를 입력해주면 됩니다.
9. [Oracle] 데이터를 조작해보자. -DML(데이터 조작어) • DML 문은 다음과 같은 경우에 실행합니다. – 테이블에 새 행 추가 – 테이블의 기존 행 수정 – 테이블에서 기존 행 제거 • 트랜잭션 은 논리적 작업 단위를 형성하는 DML 문의 모음으로 구성됩니다. DML(데이터 조작어)은 SQL의 핵심 부분입니다. 데이터베이스에서 데이터를 추가, 갱신 또는 삭제하려는 경우 DML 문을 실행하십시오. 논리적 작업 단위를 형성하는 DML 문의 모음을 트랜잭션 이라고 합니다. -INSERT 문 구문 • INSERT 문을 사용하여 테이블에 새 행을 추가합니다. -새 행 삽입 • 각 열에 대한 값을 포함하는 새 행을 삽입합니다 . • 테이블에 있는 열의 기본 순서로 값을 나열합니다. • 선택적으로 INSERT 절에 열을 나열합니다. • 문자와 ..
크롤링과 코사인 유사도를 이용하여 영화추천 서비스를 만들어보자 :) 코사인 유사도 이용 영화 추천 프로그램¶ In [1]: from bs4 import BeautifulSoup import pandas as pd from tqdm import tqdm_notebook import nltk import re from urllib.request import urlopen 영화 추천 프로그램을 만들기 위해 먼저, 네이버영화를 통해 영화정보를 크롤링 합니다. 그러기위해 필요한 도구들을 불러오고 크롤링를 진행합니다. import해오는 도구들은 크롤링을 익히신 분들이라면 익히 아실거라 생각하고 진행하겠습니다. :) In [2]: domain='https://movie.naver.com' story=[] title=[] genre=[] for i in tqdm_note..
8.[Oracle] 집합연산자를 사용해보자. -집합연산자 집합 연산자는 둘 이상의 구성 요소 query 결과를 하나의 결과로 조합합니다. 집합 연산자가 포함된 query를 복합 query라고 합니다. 연산자 반환 UNION 중복 행이 제거된 두 query의 행 UNION ALL 중복 행이 포함된 두 query의 행 INTERSECT query에 공통적인 행 MINUS 첫번째 query에 있는 행 중 두번째 query에 없는 행 집합 연산자는 모두 우선 순위가 같습니다. SQL 문에 여러 개의 집합 연산자가 포함되어 있으면 Oracle 서버는 괄호가 명시적으로 다른 순서를 지정하지 않는 한 왼쪽(위)에서 오른쪽(아래)으로 연산자를 평가합니다. 다른 집합 연산자와 함께 INTERSECT 연산자가 사용된 query에서는 괄호를 사용하여 평가 순서를 명시..
7. [Oracle] Subquery를 사용하여 Query 해결해보자. -Subquery를 사용하여 문제 해결 Abel보다 급여가 많은 사람을 찾는 query를 작성한다고 가정해 보겠습니다. 이 문제를 해결하려면 두 개 의 query가 필요합니다. 하나는 Abel이 받는 급여액을 찾는 query이고 또 하나는 이 액수보다 많은 급여를 받는 사람을 찾는 query입니다. 한 query를 다른query 내부에 배치하는 방식으로 두 query를 결합하여 이 문제를 해결할 수 있습니다. inner query(또는 subquery)는 outer query(또는 main query)에서 사용되는 값을 반환합니다. subquery를 사용하는 것은 두 query를 순차적으로 수행하여 첫번째 query 결과를 두번째 query의 검색 값으로 사용하는 것과 동일한 기능입니다. -Subquer..
6. [Oracle] 조인을 사용하여 여러 테이블의 데이터 표시해보자. -여러 테이블에서 데이터 가져오기 때때로 두 개 이상의 테이블에서 데이터를 사용해야 할 경우가 있습니다. 슬라이드 예제에서는 별도의 두 테이블에서 가져온 데이터가 보고서에 표시됩니다. • 사원 ID는 EMPLOYEES 테이블에 있습니다. • 부서 ID는 EMPLOYEES 테이블과 DEPARTMENTS 테이블에 모두 있습니다. • 부서 이름은 DEPARTMENTS 테이블에 있습니다. 이 보고서를 작성하려면 EMPLOYEES 및 DEPARTMENTS 테이블을 연결하고 두 테이블에서 데이터에 액세스해야 합니다. -natural join 생성 • NATURAL JOIN 절은 이름이 같은 두 테이블의 모든 행을 기반으로 합니다. • 이 절은 두 테이블에서 대응되는 모든 열의 값이 동일한 행을 선택합니다. • 동일..