본문 바로가기
자료구조

프로젝트) 간단한 검색 엔진 구현

by LaTale 2016. 8. 12.

 주어진 영문 문서에서 검색하고자 하는 문서의 단어들이 어느 문서에 몇 번이나 나타나는지에 대한 정보를 자료구조를 이용하여 저장하는 색인과정을 거치고 각 문서에 대해 사용자가 입력한 단어에 대해서 문서 각각에서 검색된 횟수와 함께 그 단어가 들어간 전후 3단어를 출력하는 검색과정을 하는 검색엔진을 구현한다.

 검색 대상이 될 문서 파일의 내용은 ASCII코드의 영문자, 개행문자 및 문장부호들로 이루어져 있고, 단어와 단어 사이는 ' '(공백)으로 구분된다.

 검색 단어가 포함된 파일에서 가장 많이 포함된 파일의 이름이 먼저 나오도록 정렬한다.



체이닝 해시를 이용해 구현





완성도면에서 많이 떨어짐.. 효율성도 별로고.. 

'자료구조' 카테고리의 다른 글

(9) Sort  (0) 2016.08.12
(8) Hash  (0) 2016.08.12
(7) DFS, BFS  (0) 2016.08.09
(6.1) priority queue simulation  (0) 2016.08.09
(6) Heap  (0) 2016.08.09