[다음] 6월중 UCC 검색 오픈.

Posted on korspot Wired 20061196402679

다음(www.daum.net)이 기존 검색로봇을 뛰어넘어 카페, 블로그, 동영상 등 대용량 UCC콘텐츠에 대한 효율적인 검색이 가능한 기술을 개발하고 있다.

다음은 이를위한 정지작업으로 웹문서 검색 베타사이트((http://ws.daum.net)를 오픈, 시범운영해 본 뒤 이르면 6월중 ‘UCC검색’서비스를 오픈한다.

UCC검색은 온네트도 ‘나루닷컴'(naaroo.com)을 통해 베타서비스하고 있다.

이를위해 다음은 지난 해 부터 자체적으로 검색엔진과 검색 로봇을 개발해왔으며, 올 한해 내부 UCC를 중심으로 검색 서비스의 전환점을 이룬다는 계획이다.

이번 베타테스트에서 첫 선을 보이는 기술은 웹검색로봇(웹크롤러) ‘Daum operating agent/다음오에이)’.
문서간 연결 관계에 기반해 우선순위를 정하고 정보량이 많은 문서별로 차등적인 가중치를 준다.

또한, 실시간으로 문서 중요도에 대해 순위를 계산해 양질의 문서를 선별한다. 이 때 중요도의 기준은 해당 문서와 타 문서들간 연계성외에도 사용자들의 웹문서 사용 패턴을 분석해 적용한다.
검색결과를 보는 속도도 빨라진다.

예전 검색로봇은 웹문서 수집후 스팸필터링, 데이터가공(검색엔진으로 로딩하기 좋은 포맷), 검색엔진 로딩의 단계를 거쳐 최신 정보 업데이트됐다.

그러나 이번 기술은 수집과정에서 검색엔진으로 바로 로딩할 수 있도록 스팸 필터링과 순위 계산 등이 동시에 이뤄진다.

이밖에 각기 다른 브라우저나 언어 환경에서도 사용자가 원하는 정보를 제공할 수 있도록 유니코드 인코딩을 지원하고, 외국어 및 사전서비스 등에 확장돼 적용할 수 있도록 했다.

다음 손경완 검색본부장은 “독자적인 기술력을 보유함으로써 차세대 검색시장을 주도할 수 있는 성장 기반을 다지게 됐다. 다음이 가진 30억건에 달하는 방대한 데이터를 중심으로 사용자 니즈에 가장 최적화된 검색 결과를 구현하겠다”고 설명했다.

Link HERE

Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s