루씬 인 액션

오픈소스 자바 검색엔진으로 루씬이라는 물건이 있어서 <루씬 인 액션>이라는 책을 구입했는데 한글 형태소 분석에 문제점이 있다니, 이 문제를 처리하려면 골치 좀 아플 것 같다. 하지만 그로 인해 몇 년 동안 관심 밖에 있던 자바를 다시 공부해 보고 싶게 만들었으니 그걸로 충분하지 않을까? 루씬을 좀 자세히 들여다 본 뒤에 아마존 API 를 이용하는 대신, 아마존 프랑스를 인덱스해서 프랑스 음악 사이트를 만드는 건 시간이 많이 걸릴 수도 있겠다는 생각이 든다.

Amazon API

관리하기 편한 프랑스 음악 사이트를 만들어볼 요량으로 Amazon API 를 이용해 봤는데 몇 가지 문제점이 있어서 어떻게 처리해야 할 지 고심 중이다. 아마존 프랑스를 이용할 경우 우선 가장 큰 문제점은 앨범 정보 중 앨범 수록곡에 악센트가 모두 사라져 표시되지 않는다는 점이다. 그렇다고 앨범 수록곡을 제외할 수도 없고 좀 난감하다. 물론 악센트가 모두 표시되는 아마존 일본이나 미국을 이용할 수 있긴 하지만 검색 결과에 차이가 많아 프랑스 음악과 관련된 검색이 주를 이루는 사이트에서 사용하기에는 문제점이 있다. 또한 아마존 프랑스는 네트워크 영향으로 검색 속도가 느려서 이 또한 문제가 있다. 예전처럼 일일이 가수와 앨범을 입력하는 방식은 방대한 앨범을 처리하는데 시간도 많이 들 뿐더러 모든 앨범을 다 입력하기도 쉽지 않은데 어떻게 할 지 생각을 좀 해봐야겠다.