+ Store 04

블로그 추천 키워드 v0.2 개발 이야기

그룬 2019. 10. 11. 15:27

최근 추천 키워드를 올리고 있지 않습니다. 그 이유로는 나름 여러가지가 있지만 최근 진행하고 있는 실험적인 시도가 여러 영향을 줌에 따라 프로그램이 정상적인 기능을 하지 못했기 때문이 좀 큰 것 같네요. 제 PC에서는 정상 동작하지만 NAS에 올리니 여러가지 문제가 발생하여 일시적으로 중단하였습니다.

 

현재 테스트해보고 있는 부분은 총 3가지입니다.

 

1. 데이터 양이 많아짐에 따른 수집 속도 저하

2. 블로그 표시 위치 순서

3. 해당 검색어의 종류

 

위 세가지 중 1번의 경우 병렬처리와 관련 된 부분인데 API를 사용함에 따른 후처리가 좀 문제가 많습니다. 이론적으로는 이렇다 생각해서 해보면 처음에는 잘 돌아가다가 어느순간부터 꼬이기 시작하는데 이 부분을 잡는게 꽤나 어렵더군요.

 

2번은 차후 검색어의 가치에 대한 수치를 반영하기 위해 사용할 항목입니다. 현재는 블로그 문서 수, 검색량에 따른 두가지 값 기준으로만 수치를 산정합니다. 그래서 어떤 키워드는 검색했을 때 블로그 카테고리가 표시도 안되는데 점수가 높았던 것들도 꽤 있습니다. 앞으로의 버전에서는 이 부분을 반영하여 조금 더 명확한 키워드를 제시할 예정입니다.

 

3번의 경우 예전 글에서 언급했던 쇼핑몰 등의 사이트는 제거해야한다라고 했던 적이 있는데 이와 관련되어 있습니다. 하다보니 2번의 블로그 표시 순서가 최상단에 나오면 굳이 여기까지는 필요없지 않을까 싶은데 겸사겸사 진행해보고 있습니다. 사람일은 모르니까요...

 

3번의 검색어 종류는 하다보니 정말 많더군요. 네이버 기반 시스템이다보니 네이버의 모든 검색 카테고리를 수집해보고 있는데 (이건 수작업입니다. 쓰다보니 이것도 자동으로 수집을 할 수 있겠다는 생각이 드는군요?) 장소나 실시간 검색어, 인물 정보 등은 보통 흔히들 아는 것이고 사이트 최신정보, 단위변환, 모터쇼 등등 꽤나 세분화가 많이 이루어져 있습니다. 

 

큰 그림으로는 예를 들어 쇼핑몰들의 월 방문자 검색 수를 제공한다거나 해볼 생각이긴한데 다소 무리가 있지 않을까 싶습니다. 가장 큰 이유로는 불특정 검색을 통한 키워드 수집이다보니 말이죠...

 

금주정도까지 테스트를 진행해보고 차주에 약간의 버전업된 추천 키워드 목록을 제공해보도록 하겠습니다.

반응형