Lucene en .NET


El motor de búsqueda de Lucene para .NET. Tuvimos que buscar entre 300.000 o algunos objetos y pareció ser bastante rápido. Lo estábamos haciendo en respuesta a que un usuario escribía un carácter, y no se notó ningún retraso, a pesar de que estaba pasando por un montón de Rx y un montón de capas de aplicaciones diferentes, y finalmente presionando Lucene para buscar resultados.

Apache Lucene es una API de código abierto para recuperación de información, originalmente implementada en Java por Doug Cutting. Está apoyado por el Apache Software Foundation y se distribuye bajo la Apache Software License. Lucene tiene versiones para otros lenguajes incluyendo Delphi, Perl, C#, C++, Python, Ruby y PHP.

Es útil para cualquier aplicación que requiera indexado y búsqueda a texto completo. Lucene ha sido ampliamente usado por su utilidad en la implementación de motores de búsquedas. Por ello, a veces se confunde Lucene con un motor de búsquedas con funciones de "crawling" y análisis de documentos en HTML incorporadas.

El centro de la arquitectura lógica de Lucene se encuentra el concepto de Documento (Document) que contiene Campos (Fields) de texto. Esta flexibilidad permite a Lucene ser independiente del formato del fichero. Textos que se encuentran en PDF, páginas HTML, documentos de Microsoft Word, así como muchos otros pueden ser indexados mientras que se pueda extraer información de ellos.

Nutch es un software que, sobre la base aportada por Lucene, integra todo lo que hace falta para completar un motor de búsqueda de páginas web.


Referencias

https://lucenenet.apache.org/

https://hownot2code.com/2016/07/22/an-unusual-bug-in-lucene-net/

https://www.codeproject.com/Articles/609980/Small-Lucene-NET-Demo-App

Comentarios

Entradas populares de este blog

¿Qué es la JCAHO Joint Commission on Accreditation of Healthcare Organizations?

PARSEO DEL CODIGO PDF417 DEL DNI ARGENTINO

¿Como instalar El Cliente de SOPHOS VPN ?