본문 바로가기
책벌레와 벌레 그 사이 어딘가/개념쌓기

[개념쌓기]ElasticSearch ,검색 엔진 ? 검색시스템?

by veganwithbacon 2022. 9. 13.
반응형

 검색 시스템이란 무엇일까?

  • 사용자가 원하는 검색어에 대한 결과를 제공하는 시스템
  • 네이버/다음/네이트/구글

 

검색에 관련해서 주로 쓰는 용어를 정리해보면

- 검색 서비스

- 검색 시스템

- 검색 엔진

 

 검색 서비스

           : 검색 엔진을 기반으로 구축한 검색 시스템을 활용해 검색결과를 서비스로 제공하는 것

 

 검색 시스템

           : 대용량 데이터를 기반으로 신뢰성 있는 검색 결과를 제공하기 위해 검색 엔진을 기반으로 구축된 시스템

 

 검색 엔진

           : 정보를 수집해 검색 결과를 제공하는 프로그램을 말함

           : 개발자는 검색엔진에 대해 반드시 필수 과목처럼 알아볼 필요가 있음

           : 엘라스틱 서치는 검색 엔진의 한종류로 아파치 솔라와 양대산맥이라고 할 수 있다

   

 그렇다면 아파치솔라(Apache Solr)는 무엇일까?

        - 루씬(Lucene)을 기반으로 분산처리가 가능하도록 고안된 것

        - Apache LuceneTM프로젝트는 오픈 소스 검색 소프트웨어

             - SoleneTM 검색 서버뿐만 아니라 LuceneTM코어라는 핵심 검색 라이브러리도 출시

 

 

 검색 시스템의 구성요소

  • 수집기
    •  웹사이트,블로그 등등 웹에서 필요한 정보를 수집하는 프로그램
      • 크롤러/스파이더/웜/웹 로봇 등으로 불림
    • 수집 대상
      • 파일 /데이터베이스 /웹페이지 등등 을 보통 수집함
  • 색인기
    • 검색엔진이 수집한 정보에서 사용자 질의와 일치하는 정보를 찾기 위해서는 수집된 데이터를 검색가능한 구조로 가공/저장해야하는데 이를 수행하는 것이 색인기이다
    • 색인기의 역할
      • 다양한 형태소 분석기를 조합해 정보에서 의미있는 용어를 추출하고 검색에 유리한 구조로 데이터를 저장
  • 스토리지
    • 데이터베이스에서 데이터를 저장하는 물리적인 저장소
      • 검색엔진은 색인한 데이터를 해당 스토리지에 저장
  • 검색기
    • 사용자의 질의내용을 입력받아 색인기에 저장한 역색 구조에서 일치하는 문자를 찾아 결과로 반환하는 것
    • 색인기처럼 형태소 분석기를 통해 사용자 질의에서 유의미한 용어를 추출해 검색
      • 사용하는 형태소 분석기에 따라 검색 품질이 차이가 난다

 

요약

검색 시스템

 => 사용자가 원하는 검색어에 대한 결과를 제공하는 시스템

 => 수집기/스토리지/색인기/검색기로 구성됨

 

검색 엔진

 => 엘라스틱서치(ElasticSearch)와 아파치솔라(Apache Solr)가 양대산맥 경쟁 

 

 

출처 :

https://djlee118.tistory.com/45?category=905475

반응형

댓글