본문 바로가기

spring boot2

Elasticsearch를 이용한 문서 유사도 검색과 Springboot를 통한 구현 (1) 문서 유사도? 기본적으로 문서가 얼마나 유사하는가에 대한 계산은 Cosine 유사도로 판단하게 된다. 그 이전에 사용하는 개념이 tf-idf인데 그 설명은 위키피디아에 다음과 같이 설명되어 있다. TF-IDF(Term Frequency - Inverse Document Frequency)는 정보 검색과 텍스트 마이닝에서 이용하는 가중치로, 여러 문서로 이루어진 문서군이 있을 때 어떤 단어가 특정 문서 내에서 얼마나 중요한 것인지를 나타내는 통계적 수치이다. 문서의 핵심어를 추출하거나, 검색 엔진에서 검색 결과의 순위를 결정하거나, 문서들 사이의 비슷한 정도를 구하는 등의 용도로 사용할 수 있다. TF(단어 빈도, term frequency)는 특정한 단어가 문서 내에 얼마나 자주 등장하는지를 나타내는 값.. 2020. 9. 5.
Spring boot DB설정 timezone 오류 Spring boot 초기 설정중 발생한 에러 스프링부트를 공부하고 초기 설정을 하던 와중에 아래와 같은 에러가 발생하였다. com.mysql.cj.exceptions.InvalidConnectionAttributeException 구글링을 하던 와중에 timezone에 의해서 발생하는 오류인것을 발견하였다. 해결방법은 두가지가 있었는데 그중에 application.properties에서 DB를 설정해줄때 spring.datasource.hikari.jdbc-url=jdbc:mysql://localhost:3306/insight?useUnicode=true&characterEncoding=utf-8 이부분에 serverTimezone=UTC 을 추가하면 해결하는 것을 발견하였다. 2020. 7. 14.