Download List

Descripción del Proyecto

Yioop! is a PHP search engine. Yioop! can be configured as either a general purpose search engine for the whole Web or it can be configured to provide search results for a set of URLs or domains. Yioop can crawl pages or can directly index archives such as ARC and WARC. It supports indexing several file formats such as HTML, Atom, PDF, DOC, PPT, RTF, RSS, XML, SVG, PNG, JPG, BMP, GIF, and sitemaps. The Yioop! crawler can be deployed on one or many machines. It supports having one or more to crawl scheduler processes, as well as multiple fetchers and mirrors. Crawling respects robots.txt including Crawl-delay. Yioop! crawls are stored in a Web archive format that is easy to move around. Crawling can be done on one machine and the results deployed elsewhere. Yioop! supports mixing of crawls. Yioop! comes with a search front end that can be localized as desired using a GUI. This GUI supports RTL languages. Management of crawls can also be done using this GUI. Yioop! can be configured in a straightforward manner to make use of file caching or memcache if available.

System Requirements

System requirement is not defined
Information regarding Project Releases and Project Resources. Note that the information here is a quote from Freecode.com page, and the downloads themselves may not be hosted on OSDN.

2013-01-05 11:37
0.92

Esta versión soporta materializando como nuevos índices basados en consultas combinaciones (mezclas de rastreo) de índices de búsqueda antiguos.

Esto debe hacer mucho mejor rendimiento de las consultas de las mezclas de rastreo.

Páginas de la caché de resultados de la búsqueda ahora tienen una historia nueva interfaz de usuario que permite buscar páginas de caché en todos los índices que tiene, tanto como la forma de archivo de Internet.

Yioop ahora soporta hechizo correcciones en las búsquedas después de que se han realizado, y tiene una API para la transliteración entre romanos y otras secuencias de comandos.

Ha mejorado el rendimiento de la consulta respecto a versiones anteriores, y muchos pequeños errores corregidos.
Tags: Minor
This release supports materializing as new indexes query-based combinations (crawl mixes) of
old search indexes.

This should make query performance of crawl mixes much better.

Cache pages of search results now have a new history UI which allows you to search cache pages
in all indexes you have,
much like the way Internet Archive does.

Yioop now supports spell corrections on searches after they have been performed,
and it has an
API for transliterating between roman and other scripts.

Query performance has been improved over previous versions, and lots of minor bugs have been
fixed.

2012-02-04 11:54
0.82

Esta versión escalabilidad mejorada al permitir que múltiples máquinas mantener partes de la cola "para rastrear a continuación". Procesamiento de la consulta también puede dividirse entre máquinas, con diferentes máquinas, siendo responsable de documentos de un determinado valor de hash. Yioop! ahora soporta espejado de máquinas. Dos frases de palabra según lo determinado por un archivo XML como volcado de URL de Wikipedia ahora pueden tratarse como una unidad lógica. El Yioop! marco modelo vista controlador ha hecho más fácil de ampliar y documentación que se ha agregado al sitio Web.
Tags: Minor
This release improved scalability by allowing multiple machines to maintain portions of the "to crawl next" queue. Query processing can also be split amongst machines, with different machines being responsible for documents of a given hash. Yioop! now supports mirroring of machines. Two word phrases as determined by an XML file such as Wikipedia URL dump can now be treated as a logical unit. The Yioop! model-view-controller framework has been made easier to extend and documentation for it has been added to the website.

2011-12-08 08:57
0.80

Esta versión soporta iniciar, detener y ver archivos de registro del servidor de cola y fetchers desde una interfaz Web. Ahora uno puede inyectar nuevas URLs en un rastreo activo a través de una interfaz Web. Esta versión de Yioop! soporta re-crawling de páginas después de un número determinado de días. También, las extensiones de archivos que son rastreadas, el número de bytes descargados por página y cómo Yioop! pesa página diferente componentes pueden ahora ser controlados a través de una interfaz Web en lugar de sólo el archivo config.php. También se han realizado mejoras cómo procesador HTML extrae texto de índice.
Tags: Minor
This version supports starting, stopping, and viewing log files of the queue server and fetchers from a Web interface. One can now inject new URLs into an active crawl via a Web interface. This version of Yioop! supports re-crawling of pages after a fixed number of days. Also, the file extensions that are crawled, the number of bytes downloaded per page, and how Yioop! weighs different page components can now all be controlled through a Web interface rather than just the config.php file. Improvements have also been made to how HTML Processor extracts text to index.

2011-10-29 11:40
0.78

Carácter n-gramos ahora son compatibles con muchas lenguas que no tienen un stemmer. Se mejoró la detección de idioma y mejor preparación de UTF-8 se prestó para las descargas. Yioop!'se mejoró la capacidad s siguientes redirecciones, incluyendo redirecciones de bit.ly. Proximidad de puntuación del texto en los documentos también se ha mejorado.
Tags: Minor
Character n-grams are now supported for many languages that did not have a stemmer. Language detection was improved and better UTF-8 preparation was provided for downloads. Yioop!'s ability to following redirects, including bit.ly redirects, was improved. Proximity scoring of text in documents has also been enhanced.

2011-10-03 00:53
Version 0.76

Esta versión agrega una función API para obtener resultados de búsqueda de Yioop! También mejora las respuestas abiertas de RSS Yioop! genera y permite que contienen imágenes. La documentación en línea se ha mejorado para describir con más detalle cómo incorporar Yioop! en un sitio. Esta versión también simplifica la sintaxis de arc_tool y agrega la capacidad dentro de herramienta arco para indizar un diccionario IndexArchiveBundle corrupto. Esta versión corrige un error en el búfer de salida del diccionario que podría causar el diccionario resultar dañados en los grandes índices.
Tags: Minor
This version adds a function API to get search results out of Yioop! It also improves the Open RSS Responses that Yioop! generates and allows them to contain images. The online documentation has been enhanced to describe in more detail how to incorporate Yioop! into a site. This release also simplifies the arc_tool syntax and adds the ability within arc tool to reindex a corrupt IndexArchiveBundle dictionary. This version fixes a bug in output buffering of the dictionary that could cause the dictionary to become corrupted on large indexes.

Project Resources