반응형
검색 시스템이란 무엇일까?
- 사용자가 원하는 검색어에 대한 결과를 제공하는 시스템
- 네이버/다음/네이트/구글
검색에 관련해서 주로 쓰는 용어를 정리해보면
- 검색 서비스
- 검색 시스템
- 검색 엔진
검색 서비스
: 검색 엔진을 기반으로 구축한 검색 시스템을 활용해 검색결과를 서비스로 제공하는 것
검색 시스템
: 대용량 데이터를 기반으로 신뢰성 있는 검색 결과를 제공하기 위해 검색 엔진을 기반으로 구축된 시스템
검색 엔진
: 정보를 수집해 검색 결과를 제공하는 프로그램을 말함
: 개발자는 검색엔진에 대해 반드시 필수 과목처럼 알아볼 필요가 있음
: 엘라스틱 서치는 검색 엔진의 한종류로 아파치 솔라와 양대산맥이라고 할 수 있다
그렇다면 아파치솔라(Apache Solr)는 무엇일까?
- 루씬(Lucene)을 기반으로 분산처리가 가능하도록 고안된 것
- Apache LuceneTM프로젝트는 오픈 소스 검색 소프트웨어
- SoleneTM 검색 서버뿐만 아니라 LuceneTM코어라는 핵심 검색 라이브러리도 출시
검색 시스템의 구성요소
- 수집기
- 웹사이트,블로그 등등 웹에서 필요한 정보를 수집하는 프로그램
- 크롤러/스파이더/웜/웹 로봇 등으로 불림
- 수집 대상
- 파일 /데이터베이스 /웹페이지 등등 을 보통 수집함
- 웹사이트,블로그 등등 웹에서 필요한 정보를 수집하는 프로그램
- 색인기
- 검색엔진이 수집한 정보에서 사용자 질의와 일치하는 정보를 찾기 위해서는 수집된 데이터를 검색가능한 구조로 가공/저장해야하는데 이를 수행하는 것이 색인기이다
- 색인기의 역할
- 다양한 형태소 분석기를 조합해 정보에서 의미있는 용어를 추출하고 검색에 유리한 구조로 데이터를 저장
- 스토리지
- 데이터베이스에서 데이터를 저장하는 물리적인 저장소
- 검색엔진은 색인한 데이터를 해당 스토리지에 저장
- 데이터베이스에서 데이터를 저장하는 물리적인 저장소
- 검색기
- 사용자의 질의내용을 입력받아 색인기에 저장한 역색 구조에서 일치하는 문자를 찾아 결과로 반환하는 것
- 색인기처럼 형태소 분석기를 통해 사용자 질의에서 유의미한 용어를 추출해 검색
- 사용하는 형태소 분석기에 따라 검색 품질이 차이가 난다
요약
검색 시스템
=> 사용자가 원하는 검색어에 대한 결과를 제공하는 시스템
=> 수집기/스토리지/색인기/검색기로 구성됨
검색 엔진
=> 엘라스틱서치(ElasticSearch)와 아파치솔라(Apache Solr)가 양대산맥 경쟁
출처 :
https://djlee118.tistory.com/45?category=905475
반응형
'책벌레와 벌레 그 사이 어딘가 > 개념쌓기' 카테고리의 다른 글
[개념쌓기] ElasticSearch VS Solr /검색엔진 (0) | 2022.09.22 |
---|---|
[개념쌓기]ElasticSearch ,데이터 사이언스 (0) | 2022.09.21 |
[개념쌓기]왜 S3를 쓰는걸까? (0) | 2022.09.02 |
[개념쌓기]타임리프/API/SDK/JDK (0) | 2022.08.30 |
[개념쌓기] Docker (0) | 2022.08.26 |
댓글