Buscadores

Identificar contenido sujeto a derecho de autor Escrito por Jorge el 25.09.06

Con el objetivo de evitar futuros conflictos entre motores de búsqueda online y editores, la Asociación Mundial de Periódicos (AMP), el Consejo Europeo de Editores (EPC), la Asociación Internacional de Editores (IPA) y la Asociación Europea de Periódicos (ENPA), anunciaron el lanzamiento de un sistema para que los buscadores detecten las condiciones de uso de los contenidos.La iniciativa aparece luego de que Google sea condenado por la justicia belga tras una denuncia efectuada por dos de los principales periódicos del país: Le Soir y Libre Belgique, que acusan al megabuscador por reproducir contenidos sin permiso explícito de las compañías editoras.

Es un proyecto piloto por el cual se lanzará un protocolo que permitirá que los buscadores identifiquen las condiciones de uso de contenidos sujetos a derecho de autor. El dispositivo se llama Protocolo Automatizado de Acceso a Contenidos (ACAP) y permitirá que los editores expresen sus políticas de derechos de autor en un lenguaje que luego pueda ser interpretado por los motores de búsqueda.

El lanzamiento oficial será a fin de año, con un período de prueba previsto de hasta 12 meses, y se presentará el próximo 6 de octubre en la Feria del Libro de Fráncfort. Según el diario El Mundo, Gavin O’Reilly, presidente de la AMP, señaló: “Este sistema pretende evitar completamente cualquier conflicto por derechos entre los editores y los motores de búsqueda”, y aseguró que lo que se quiere es mejorar las relaciones entre unos y otros en forma equilibrada.

canal-ar.com.ar/

El nacimiento de Google Escrito por Jorge el 09.09.06

“Larry pensaba que Sergey era un arrogante. Sergey pensaba que Larry era odioso”. Estas son las impresiones que los fundadores de Google tuvieron uno del otro allá en verano de 1995, cuando coincidieron por primera vez durante un acto que la Universidad de Stanford organizaba para aquellos estudiantes que tenían pensado matricularse en ella.Sergey Brin ya estudiaba en Stanford, y se había ofrecido como voluntario para mostrar las instalaciones a los candidatos, entre los que se encontraba Larry Page. Cuando éste finalmente decidió comenzar a asistir en septiembre, rápidamente se aficionó a estudiar la estructura de la WWW, formada por nodos (servidores y páginas web) y enlaces entre ellos.

A Page le obsesionaba la idea de que, en aquellos momentos, fuera imposible saber qué páginas web enlazaban a otras, ya que eso impedía el análisis de la WWW y poder determinar cuál era la importancia un documento web. Page reconoce que asoció “importancia” con “número de veces que citan/enlazan” un documento debido a que en el entorno universitario de los ‘papers’ y documentos de investigación nada hay tan importante como que citen tus trabajos.

Con esta idea en mente, Page decidió comenzar un proyecto denominado ‘BackRub’ que intentaría determinar el número de enlaces hacia las páginas web (backlinks). Esta herramienta estuvo incluso online, y aún se guarda una copia en ‘archive.org’.

Para determinar los enlaces entre páginas, Page construyó un robot que rastreaba los diferentes sitios web, y almacenaba los links en una Base de Datos. Para ello, utilizaba Java y Python, e incluso posteaba en los ‘newsgroups’ para intentar solucionar dudas sobre su diseño.

En marzo de 1996, Page decidió poner en marcha el rastreo de la WWW a través de BackRub. Para ello, tomó como punto de partida la página web principal de la Universidad de Stanford, y a partir de ella se saltaría de página en página a través de los enlaces a lo largo y ancho de la World Wide Web.

Sin embargo, el proyecto comenzaba a ser cada vez más complejo y esto fue lo que atrajo la atención de Sergey Brin, el cual no se había decantado por ningún proyecto para su tesis doctoral. BackRub había conseguido determinar cuántos enlaces había entre las páginas, pero el reto estaba en conseguir crear un método para clasificar la importancia de cada una de esas páginas, siguiendo con la obsesión de Page de establecerlo en función del número de citas/enlaces. Pero cada uno de estos links también tenía su propia importancia, determinada a partir del número de enlaces hacia la página que enlazaba, lo que significaba un elevado número de cálculos recursivos.

Era en este ámbito, el de las abstracciones y operaciones matemáticas, en el que Sergey Brin se desenvolvía con más soltura. Nacido en Rusia e hijo de un profesor universitario de Matemáticas, Brin era considerado en su etapa escolar como un prodigio en esta materia. Así pues, juntos trabajan para desarrollar el algoritmo de PageRank (meses más tarde se publicaría el documento ‘PageRank: Bringing Order to the Web’). El nombre de ‘PageRank’ se puso en honor a Larry Page.

Pronto Page y Brin se dieron cuenta que, además de determinar la importancia de una página web, BackRub servía también para realizar búsquedas en la WWW, y con unos resultados además mucho mejores que los que ofrecían los en aquellos momentos populares Altavista o Excite. Las primeras pruebas consistieron en buscar palabras solamente dentro de los títulos de las páginas web. PageRank ofrecía unos resultados sorprendentes, y fue entonces cuando se empezaron a creer que se encontraban ante algo grande.

Además, también descubrieron que su herramienta era totalmente escalable. Puesto que PageRank analizaba los links entre páginas web, cuanto mayor fuera la WWW, mejores serían los resultados. Este hecho inspiró a que Page y Brin bautizasen definitivamente su buscador con el nombre de Google, en alusión a la palabra ‘googol’ (el número representado por un ‘1′ seguido de 100 ceros). Además, en agosto de 1996 lanzaron públicamente la primera versión de Google bajo el dominio ‘google.stanford.edu’. Ahora se encuentra inaccesible (fue sustuido por ‘google.com’), pero se pueden ver varias versiones almacenadas en ‘archive.org’, como la de mayo de 1998 o noviembre de 1998.

Entre algunos los alumnos de la Universidad de Stanford, Google se convirtió en todo un éxito en aquel verano de 1996, lo que animó a Page y a Brin a seguir dedicando esfuerzos al proyecto. Así, poco a poco consiguieron que el buscador indexase mayor número de páginas, y que además buscase información dentro del texto de éstas (no solo en el título). También comenzaron a descubrir que un buscador consume un montón de recursos, lo que les obligó a ir cogiendo prestados numerosos dispositivos de los laboratorios de la Universidad de Stanford (discos duros, CPUs, …), y a unirlos con técnicas tan poco convencionales como con piezas de Lego.

El cuarto de Larry Page era utilizado como la sala de los servidores, y cuando ésta estuvo completamente llena de cacharros, tuvieron que utilizar la de Sergey Brin como oficina y centro de programación. Google crecia rápidamente, consumía casi la mitad del ancho de banda de la Universidad (una de las mejor conectadas del planeta), y a finales de 1996 consiguió echar abajo la conexión a Internet del campus.

Estos recuerdos y muchos más están recogidos en el libro ‘The Search’ que saldrá a la luz el día 8 de septiembre. Ha sido escrito por John Battelle, fundador de Wired y uno de los mayores expertos en buscadores. La propia revista Wired publica en su número de agosto un extracto del libro.

google.dirson.com/

Google cumplió 8 años Escrito por Jorge el 09.09.06

Sería casi imposible reseñar todo lo que cambió en Internet desde el nacimiento de Google como un proyecto en Stanford. Hoy Dirson recuerda el momento en que se creo la empresa: El 7 de septiembre de 1998 se constituyó la compañía ‘Google Inc.’, en la que sus fundadores eran el Director General (Larry Page) y el Presidente (Sergey Brin). Su nacimiento fue posible gracias a los 100.000 dólares que semanas antes habían conseguido de manos de Andy Bechtolsheim (fundador de Sun Microsystems).Desde el año 1996, existía el proyecto BackRub que se convirtería más tarde en Google.

Google lanza Active Search, el archivo de noticias de Google News Escrito por Jorge el 08.09.06

A partir de ahora, Google News no sólo será una referencia para buscar información reciente, sino también histórica. La compañía estadounidense ha agregado a su buscador de noticias un archivo periodístico de más de 200 años con diversas fuentes.“El objetivo es permitir a los usuarios explorar la historia como ocurrió”, ha comentado Anurag Acharya, ingeniero de la compañía que ha trabajado en el desarrollo del producto.

Archive Search genera de forma instantánea un archivo dividido en años con los textos periodísticos del tema buscado.

Por ejemplo, es posible buscar la evolución informativa de sucesos como la llegada a la luna del Apollo 11 o de la situación en Oriente Medio. Por el momento, este servicio sólo está disponible en inglés.

Google News tiene noticias de 200 años atrás Escrito por Jorge el 08.09.06

El buscador más famoso de Internet lanzó un nuevo servicio para acceder a las noticias de los últimos 200 años con diversas fuentes, con lo que desde ahora no sólo será una referencia para buscar información reciente, sino también históricaEl nuevo producto se llama Google News Archive y permite hacer seguimientos cronológicos y temáticos en algunos diarios y revistas de Estados Unidos, informó la compañía líder en el mercado, que organiza los resultados en función de su relevancia.

“El objetivo del servicio es permitirle a los usuarios explorar la historia como se fue dando”, dijo Anurag Acharya, un ingeniero de Google que ayudó a desarrollar el buscador del archivo de noticias, informó la agencia DPA.

Acharya señaló que “los usuarios pueden ver cómo fueron cambiando a lo largo del tiempo los puntos de vista sobre los acontecimientos, las ideas y las personas”.

Desde su lanzamiento en 2002, Google News permite a los usuarios buscar noticias de las últimas semanas relacionadas a una palabra clave en miles de publicaciones.

El nuevo servicio de Google genera instantáneamente una línea del tiempo de muchos años sobre los textos periodísticos acerca de un mismo tema, lo que permite a los internautas buscar fechas específicas u observar cómo evolucionó la cobertura de un evento a medida que pasó el tiempo.

Como ejemplos, el funcionario mencionó la llegada a la Luna del Apollo 11, en 1969, y hechos más extendidos, como el conflicto Palestino-Israelí.

Ahora, los usuarios de Google News encontrarán un vínculo a News Archive Search como una alternativa a la búsqueda más amplia y a la búsqueda de noticias de último momento.

El servicio se ofrece sólo en inglés estadounidense, aunque próximamente podrán encontrarse noticias en otros idiomas, incluido el español.

Google trabaja con proveedores de información como “Time.com” y “The Guardian”, que ofrecen sus informaciones gratis, y medios de comunicación, como “The New York Times”, “The Wall Street Journal”, “Washington Post” o “Newsweek Interactive”, que permiten visualizar extractos de sus noticias mediante pago o suscripción.