Buscador

De Wikipedia, la enciclopedia libre
Saltar a navegación Saltar a buscar
Los resultados de una búsqueda del término "eclipse lunar" en un motor de búsqueda de imágenes basado en la web

Un motor de búsqueda es un sistema de software que está diseñado para realizar búsquedas en la web . Buscan en la World Wide Web de forma sistemática información específica especificada en una consulta de búsqueda web textual . Los resultados de la búsqueda generalmente se presentan en una línea de resultados, a menudo denominadas páginas de resultados del motor de búsqueda (SERP). La información puede ser una combinación de enlaces a páginas web , imágenes, videos, infografías , artículos, trabajos de investigación y otros tipos de archivos. Algunos motores de búsqueda también extraen datos disponibles en bases de datos o directorios abiertos. A diferencia dedirectorios web , que son mantenidos solo por editores humanos, los motores de búsqueda también mantienen información en tiempo real mediante la ejecución de un algoritmo en un rastreador web . El contenido de Internet que no puede ser buscado por un motor de búsqueda web generalmente se describe como la web profunda .

Historia

Cronología ( lista completa )
Año Motor Estado actual
1993 Catálogo W3 Activo
Aliweb Activo
estación de salto Inactivo
Gusano WWW Inactivo
1994 WebCrawler Activo
ir.com Inactivo, redirige a Disney
Lycos Activo
búsqueda de información Inactivo, redirige a Disney
1995 yahoo! Búsqueda Activo, inicialmente una función de búsqueda de Yahoo! Directorio
Daum Activo
Magallanes Inactivo
Excitar Activo
SAPO Activo
MetaCrawler Activo
AltaVista Inactivo, adquirido por Yahoo! en 2003, desde 2013 redirecciona a Yahoo!
1996 RankDex Inactivo, incorporado a Baidu en 2000
pila de perros Activo, Agregador
HotBot Inactivo ( tecnología de búsqueda Inktomi usada)
Pregúntale a Jeeves Activo (rebautizado como ask.com)
1997 AOL NetFind Activo (rebautizado como AOL Search desde 1999)
Luz del norte Inactivo
Yandex Activo
1998 Google Activo
Ixquick Activo como Startpage.com
Búsqueda de MSN Activo como Bing
empas Inactivo (fusionado con NATE)
1999 todalaweb Inactivo (URL redirigido a Yahoo!)
genio sabe Inactivo, renombrado como Yellowee (estaba redirigiendo a justlocalbusiness.com)
Naver Activo
Teoma Inactivo (redireccionar a Ask.com)
2000 Baidu Activo
Exalead Inactivo
Gigablasto Activo
2001 Kartoo Inactivo
2003 info.com Activo
2004 A9.com Inactivo
grumoso Inactivo (redireccionar a DuckDuckGo)
Mojeek Activo
Sogú Activo
2005 Búscame Inactivo
KidzBuscar Activo, Búsqueda de Google
2006 Regular Inactivo, fusionado con Sogou
quaero Inactivo
Buscar.com Activo
chacha Inactivo
Ask.com Activo
Búsqueda en vivo Activo como Bing, renombrado MSN Search
2007 búsqueda de wiki Inactivo
brotar Inactivo
Búsqueda Wikia Inactivo
Blackle.com Activo, Búsqueda de Google
2008 Set de poder Inactivo (redirige a Bing)
picolador Inactivo
verzi Inactivo
Boogami Inactivo
pez salto Inactivo
bosque Inactivo (redirecciona a Ecosia)
Pato Pato a ganar Activo
2009 Bing Live Search activo y renombrado
Yebol Inactivo
Mugurdy Inactiva por falta de financiación
Explorador (gobio) Activo
NATE Activo
Ecosia Activo
Página de inicio.com Activo, motor hermano de Ixquick
2010 blekko Inactivo, vendido a IBM
cuil Inactivo
Yandex (inglés) Activo
Parsijoo Activo
2011 YaCy Activo, P2P
2012 Volunia Inactivo
2013 Qquiero Activo
2014 Egerín Activo, Kurdo / Sorani
vacas suizas Activo
Searx Activo
2015 Yooz Inactivo
Cliqz Inactivo
2016 Red Activo, Búsqueda de Google
2020 Pétalo Activo

Antes de la década de 1990

En 1945, Vannevar Bush , quien escribió un artículo en The Atlantic Monthly titulado " As We May Think " [1 ] en el que imaginó bibliotecas de investigación con anotaciones conectadas no muy diferentes a los hipervínculos modernos . [2] El análisis de enlaces eventualmente se convertiría en un componente crucial de los motores de búsqueda a través de algoritmos como Hyper Search y PageRank . [3] [4]

Década de 1990: nacimiento de los motores de búsqueda

Los primeros motores de búsqueda de Internet son anteriores al debut de la Web en diciembre de 1990: la búsqueda de usuarios de WHOIS se remonta a 1982, [5] y la búsqueda de usuarios de redes múltiples del Knowbot Information Service se implementó por primera vez en 1989. [6] La primera búsqueda bien documentada El motor que buscaba archivos de contenido, a saber, archivos FTP , era Archie , que debutó el 10 de septiembre de 1990. [7]

Antes de septiembre de 1993, la World Wide Web se indexaba completamente a mano. Había una lista de servidores web editada por Tim Berners-Lee y alojada en el servidor web del CERN . Queda una instantánea de la lista en 1992, [8] pero a medida que más y más servidores web se pusieron en línea, la lista central ya no pudo mantenerse al día. En el sitio de la NCSA , se anunciaron nuevos servidores bajo el título "¡Novedades!" [9]

La primera herramienta utilizada para buscar contenido (a diferencia de usuarios) en Internet fue Archie . [10] El nombre significa "archivo" sin la "v". [11] Fue creado por Alan Emtage [11] [12] [13] [14] estudiante de informática en la Universidad McGill en Montreal, Quebec , Canadá . El programa descargó las listas de directorios de todos los archivos ubicados en sitios públicos anónimos de FTP ( Protocolo de transferencia de archivos ), creando una base de datos de búsqueda de nombres de archivos; sin embargo, Archie Search Engineno indexó el contenido de estos sitios ya que la cantidad de datos era tan limitada que se podía buscar fácilmente de forma manual.

El auge de Gopher (creado en 1991 por Mark McCahill en la Universidad de Minnesota ) dio lugar a dos nuevos programas de búsqueda, Veronica y Jughead . Al igual que Archie, buscaron los nombres y títulos de los archivos almacenados en los sistemas de índice Gopher. Veronica ( V ery Easy R odent - O riented N et-wide Index to C omputerized A rchives ) proporcionó una búsqueda de palabras clave de la mayoría de los títulos de menú de Gopher en todas las listas de Gopher. Jughead ( J onzy 's U niversal GopherJ erarchy E xcavation And D isplay ) era una herramienta para obtener información de menú de servidores Gopher específicos. Si bien el nombre del motor de búsqueda " Archie Search Engine " no era una referencia a la serie de cómics de Archie , " Veronica " y " Jughead " son personajes de la serie, lo que hace referencia a su predecesor.

En el verano de 1993 no existía ningún motor de búsqueda para la web, aunque se mantenían a mano numerosos catálogos especializados. Oscar Nierstrasz de la Universidad de Ginebra escribió una serie de secuencias de comandos de Perl que reflejaban periódicamente estas páginas y las reescribían en un formato estándar. Esto formó la base de W3Catalog , el primer motor de búsqueda primitivo de la web, lanzado el 2 de septiembre de 1993. [15]

En junio de 1993, Matthew Gray, entonces en el MIT , produjo lo que probablemente fue el primer robot web , el World Wide Web Wanderer basado en Perl , y lo usó para generar un índice llamado "Wandex". El propósito de Wanderer era medir el tamaño de la World Wide Web, lo que hizo hasta fines de 1995. El segundo motor de búsqueda de la web, Aliweb , apareció en noviembre de 1993. Aliweb no usaba un robot web , sino que dependía de ser notificado por el sitio web . administradores de la existencia en cada sitio de un archivo índice en un formato particular.

JumpStation (creada en diciembre de 1993 [16] por Jonathon Fletcher ) usó un robot web para encontrar páginas web y construir su índice, y usó un formulario web como interfaz para su programa de consulta. Por lo tanto, fue la primera herramienta de descubrimiento de recursos WWW que combinó las tres características esenciales de un motor de búsqueda web (rastreo, indexación y búsqueda) como se describe a continuación. Debido a los recursos limitados disponibles en la plataforma en la que se ejecutaba, su indexación y, por lo tanto, la búsqueda se limitaban a los títulos y encabezados que se encontraban en las páginas web que encontraba el rastreador.

Uno de los primeros motores de búsqueda basados ​​en rastreadores "todo texto" fue WebCrawler , que apareció en 1994. A diferencia de sus predecesores, permitía a los usuarios buscar cualquier palabra en cualquier página web, lo que se ha convertido en el estándar para todos los principales motores de búsqueda desde entonces. También fue el motor de búsqueda que fue ampliamente conocido por el público. También en 1994, se lanzó Lycos (que comenzó en la Universidad Carnegie Mellon ) y se convirtió en un importante esfuerzo comercial.

El primer motor de búsqueda popular en la Web fue Yahoo! Buscar _ [17] El primer producto de Yahoo! , fundado por Jerry Yang y David Filo en enero de 1994, era un directorio web llamado Yahoo! directorio _ En 1995, se añadió una función de búsqueda que permitía a los usuarios buscar en Yahoo! ¡Directorio! [18] [19] Se convirtió en una de las formas más populares para que las personas encontraran páginas web de interés, pero su función de búsqueda operaba en su directorio web, en lugar de en las copias de texto completo de las páginas web.

Poco después, aparecieron varios motores de búsqueda que competían por la popularidad. Estos incluyen Magellan , Excite , Infoseek , Inktomi , Northern Light y AltaVista . Los buscadores de información también pueden navegar por el directorio en lugar de realizar una búsqueda basada en palabras clave.

En 1996, Robin Li desarrolló el algoritmo de puntuación de sitios RankDex para la clasificación de páginas de resultados de motores de búsqueda [20] [21] [22] y recibió una patente estadounidense para la tecnología. [23] Fue el primer motor de búsqueda que usó hipervínculos para medir la calidad de los sitios web que estaba indexando, [24] anterior a la patente de algoritmo muy similar presentada por Google dos años después, en 1998. [25] Larry Page hizo referencia al trabajo de Li en algunos de sus patentes estadounidenses para PageRank. [26] Más tarde, Li usó su tecnología Rankdex para Baidu motor de búsqueda, que fue fundado por Robin Li en China y lanzado en 2000.

En 1996, Netscape buscaba ofrecer a un único motor de búsqueda un trato exclusivo como motor de búsqueda destacado en el navegador web de Netscape. Hubo tanto interés que, en cambio, Netscape llegó a acuerdos con cinco de los principales motores de búsqueda: por 5 millones de dólares al año, cada motor de búsqueda estaría en rotación en la página del motor de búsqueda de Netscape. Los cinco motores fueron Yahoo!, Magellan, Lycos, Infoseek y Excite. [27] [28]

Google adoptó la idea de vender términos de búsqueda en 1998, de una pequeña empresa de motores de búsqueda llamada goto.com . Este movimiento tuvo un efecto significativo en el negocio de los motores de búsqueda, que pasó de tener problemas a ser uno de los negocios más rentables de Internet. [29]

Los motores de búsqueda también eran conocidos como algunas de las estrellas más brillantes en el frenesí inversor de Internet que se produjo a finales de la década de 1990. [30] Varias empresas ingresaron al mercado de manera espectacular, recibiendo ganancias récord durante sus ofertas públicas iniciales . Algunos han eliminado su motor de búsqueda público y están comercializando ediciones solo para empresas, como Northern Light. Muchas empresas de motores de búsqueda quedaron atrapadas en la burbuja de las puntocom , un auge del mercado impulsado por la especulación que alcanzó su punto máximo en marzo de 2000.

Década de 2000-presente: burbuja posterior a las puntocom

Alrededor de 2000, el motor de búsqueda de Google saltó a la fama. [31] La empresa logró mejores resultados para muchas búsquedas con un algoritmo llamado PageRank , como se explicó en el artículo Anatomía de un motor de búsqueda escrito por Sergey Brin y Larry Page , los fundadores posteriores de Google. [4] Este algoritmo iterativo clasifica las páginas web según el número y el PageRank de otros sitios web y páginas que enlazan allí, con la premisa de que las páginas buenas o deseables están enlazadas a más páginas que otras. La patente de Larry Page para PageRank cita la patente anterior de RankDex de Robin Li como una influencia. [26][22] Google también mantuvo una interfaz minimalista para su motor de búsqueda. En cambio, muchos de sus competidores incrustaron un motor de búsqueda en un portal web . De hecho, el motor de búsqueda de Google se hizo tan popular que surgieron motores falsos como Mystery Seeker .

Para el año 2000, Yahoo! proporcionaba servicios de búsqueda basados ​​en el motor de búsqueda de Inktomi. yahoo! adquirió Inktomi en 2002 y Overture (propietaria de AlltheWeb y AltaVista) en 2003. Yahoo! cambió al motor de búsqueda de Google hasta 2004, cuando lanzó su propio motor de búsqueda basado en las tecnologías combinadas de sus adquisiciones.

Microsoft lanzó por primera vez MSN Search en el otoño de 1998 utilizando los resultados de búsqueda de Inktomi. A principios de 1999, el sitio comenzó a mostrar listados de Looksmart , combinados con los resultados de Inktomi. Durante un breve período de tiempo en 1999, MSN Search utilizó en su lugar los resultados de AltaVista. En 2004, Microsoft inició una transición hacia su propia tecnología de búsqueda, impulsada por su propio rastreador web (llamado msnbot ).

El motor de búsqueda renombrado de Microsoft, Bing , se lanzó el 1 de junio de 2009. El 29 de julio de 2009, Yahoo! y Microsoft cerraron un trato en el que Yahoo! La búsqueda estaría impulsada por la tecnología Microsoft Bing.

A partir de 2019, los rastreadores de motores de búsqueda activos incluyen los de Google , Petal , Sogou , Baidu , Bing , Gigablast , Mojeek , DuckDuckGo y Yandex .

Acercamiento

Un motor de búsqueda mantiene los siguientes procesos casi en tiempo real:

  1. rastreo web
  2. Indexación
  3. Buscando [32]

Los motores de búsqueda web obtienen su información rastreando la web de un sitio a otro. La "araña" busca el nombre de archivo estándar robots.txt , dirigido a ella. El archivo robots.txt contiene directivas para las arañas de búsqueda, que le indican qué páginas rastrear y cuáles no. Después de buscar robots.txt y encontrarlo o no, la araña envía cierta información para que se indexe según muchos factores, como los títulos, el contenido de la página, JavaScript , las hojas de estilo en cascada (CSS), los encabezados o sus metadatos en metaetiquetas HTML. Después de un cierto número de páginas rastreadas, cantidad de datos indexados o tiempo dedicado al sitio web, la araña deja de rastrear y continúa. "[N]ingún rastreador web puede rastrear toda la web accesible. Debido a la infinidad de sitios web, las trampas de araña, el spam y otras exigencias de la web real, los rastreadores aplican una política de rastreo para determinar cuándo se debe considerar el rastreo de un sitio. suficiente. Algunos sitios web se rastrean exhaustivamente, mientras que otros se rastrean solo parcialmente". [33]

La indexación significa asociar palabras y otros tokens definibles que se encuentran en las páginas web a sus nombres de dominio y campos basados ​​en HTML . Las asociaciones se realizan en una base de datos pública, disponible para consultas de búsqueda web. Una consulta de un usuario puede ser una sola palabra, varias palabras o una oración. El índice ayuda a encontrar información relacionada con la consulta lo más rápido posible. [32] Algunas de las técnicas de indexación y almacenamiento en caché son secretos comerciales, mientras que el rastreo web es un proceso sencillo de visitar todos los sitios de forma sistemática.

Entre las visitas de la araña , la versión en caché de la página (algo o todo el contenido necesario para representarla) almacenada en la memoria de trabajo del motor de búsqueda se envía rápidamente a un investigador. Si una visita está atrasada, el motor de búsqueda puede actuar como un proxy web . En este caso, la página puede diferir de los términos de búsqueda indexados. [32] La página almacenada en caché mantiene la apariencia de la versión cuyas palabras se indexaron previamente, por lo que una versión almacenada en caché de una página puede ser útil para el sitio web cuando la página real se ha perdido, pero este problema también se considera una forma leve de linkrot .

Arquitectura de alto nivel de un rastreador web estándar

Por lo general, cuando un usuario ingresa una consulta en un motor de búsqueda, son algunas palabras clave . [34] El índice ya tiene los nombres de los sitios que contienen las palabras clave, y estos se obtienen instantáneamente del índice. La carga de procesamiento real está en la generación de las páginas web que son la lista de resultados de búsqueda: cada página de la lista completa debe ponderarse de acuerdo con la información de los índices. [32] Luego, el elemento de resultado de búsqueda superior requiere la búsqueda, la reconstrucción y el marcado de los fragmentos .mostrando el contexto de las palabras clave coincidentes. Estos son solo una parte del procesamiento que requiere cada página web de resultados de búsqueda, y otras páginas (junto a la parte superior) requieren más de este procesamiento posterior.

Más allá de las simples búsquedas de palabras clave, los motores de búsqueda ofrecen sus propios operadores controlados por comandos o GUI y parámetros de búsqueda para refinar los resultados de la búsqueda. Estos proporcionan los controles necesarios para el usuario involucrado en el ciclo de retroalimentación que los usuarios crean al filtrar y ponderar mientras refinan los resultados de la búsqueda, dadas las páginas iniciales de los primeros resultados de la búsqueda. Por ejemplo, desde 2007, el motor de búsqueda Google.com ha permitido filtrar por fecha haciendo clic en "Mostrar herramientas de búsqueda" en la columna más a la izquierda de la página de resultados de búsqueda inicial y luego seleccionando el intervalo de fechas deseado. [35] También es posible ponderar por fecha porque cada página tiene una hora de modificación. La mayoría de los motores de búsqueda admiten el uso de laoperadores booleanos AND, OR y NOT para ayudar a los usuarios finales a refinar la consulta de búsqueda . Los operadores booleanos son para búsquedas literales que permiten al usuario refinar y ampliar los términos de la búsqueda. El motor busca las palabras o frases exactamente como se ingresaron. Algunos motores de búsqueda ofrecen una función avanzada llamada búsqueda de proximidad , que permite a los usuarios definir la distancia entre las palabras clave. [32] También existe la búsqueda basada en conceptos en la que la investigación implica el uso de análisis estadísticos en páginas que contienen las palabras o frases que busca.

La utilidad de un motor de búsqueda depende de la relevancia del conjunto de resultados que devuelve. Si bien puede haber millones de páginas web que incluyen una palabra o frase en particular, algunas páginas pueden ser más relevantes, populares o autorizadas que otras. La mayoría de los motores de búsqueda emplean métodos para clasificar los resultados y proporcionar primero los "mejores" resultados. La forma en que un motor de búsqueda decide qué páginas son las que mejor coinciden y en qué orden deben mostrarse los resultados varía mucho de un motor a otro. [32]Los métodos también cambian con el tiempo a medida que cambia el uso de Internet y evolucionan nuevas técnicas. Hay dos tipos principales de motores de búsqueda que han evolucionado: uno es un sistema de palabras clave predefinidas y ordenadas jerárquicamente que los humanos han programado extensamente. El otro es un sistema que genera un " índice invertido " analizando los textos que localiza. Esta primera forma depende mucho más de la computadora misma para hacer la mayor parte del trabajo.

La mayoría de los motores de búsqueda web son empresas comerciales respaldadas por ingresos publicitarios y, por lo tanto, algunos de ellos permiten a los anunciantes que sus listados se clasifiquen más alto en los resultados de búsqueda por una tarifa. Los motores de búsqueda que no aceptan dinero por sus resultados de búsqueda ganan dinero publicando anuncios relacionados con la búsqueda junto con los resultados normales del motor de búsqueda. Los motores de búsqueda ganan dinero cada vez que alguien hace clic en uno de estos anuncios. [36]

Búsqueda local

La búsqueda local es el proceso que optimiza los esfuerzos de las empresas locales. Se enfocan en el cambio para asegurarse de que todas las búsquedas sean consistentes. Es importante porque muchas personas determinan a dónde planean ir y qué comprar en función de sus búsquedas. [37]

Cuota de mercado

A partir de enero de 2022 , Google es, con mucho, el motor de búsqueda más utilizado del mundo, con una participación de mercado del 92,01 %, y los otros motores de búsqueda más utilizados del mundo fueron Bing , Yahoo! , Baidu , Yandex y DuckDuckGo . [38]

Rusia y Asia Oriental

En Rusia, Yandex tiene una cuota de mercado del 61,9%, frente al 28,3% de Google. [39] En China, Baidu es el motor de búsqueda más popular. [40] El portal de búsqueda local de Corea del Sur, Naver , se utiliza para el 70% de las búsquedas en línea en el país. [41] Yahoo! Japón y Yahoo! Taiwán son las vías más populares para las búsquedas en Internet en Japón y Taiwán, respectivamente. [42] China es uno de los pocos países en los que Google no se encuentra entre los tres principales motores de búsqueda web por cuota de mercado. Google fue anteriormente uno de los principales motores de búsqueda en China, pero se retiró después de un desacuerdo con el gobierno sobre la censura y un ataque cibernético. [43]

Europa

Los mercados de la mayoría de los países de la Unión Europea están dominados por Google, a excepción de la República Checa , donde Seznam es un fuerte competidor. [44]

El motor de búsqueda Qwant tiene su sede en París , Francia , desde donde atrae a la mayoría de sus 50 millones de usuarios registrados mensuales.

Sesgo del motor de búsqueda

Aunque los motores de búsqueda están programados para clasificar sitios web en función de una combinación de su popularidad y relevancia, los estudios empíricos indican varios sesgos políticos, económicos y sociales en la información que proporcionan [45] [46] y las suposiciones subyacentes sobre la tecnología. [47] Estos sesgos pueden ser el resultado directo de procesos económicos y comerciales (p. ej., las empresas que anuncian con un motor de búsqueda también pueden volverse más populares en sus resultados de búsqueda orgánicos ) y procesos políticos (p. ej., la eliminación de resultados de búsqueda para cumplir con las leyes locales). [48] ​​Por ejemplo, Google no mostrará ciertos sitios web neonazis en Francia y Alemania, donde la negación del Holocaustoes ilegal.

Los sesgos también pueden ser el resultado de procesos sociales, ya que los algoritmos de los motores de búsqueda suelen estar diseñados para excluir puntos de vista no normativos en favor de resultados más "populares". [49] Los algoritmos de indexación de los principales motores de búsqueda se inclinan hacia la cobertura de sitios basados ​​en los EE. UU., en lugar de sitios web de países fuera de los EE. UU. [46]

Google Bombing es un ejemplo de un intento de manipular los resultados de búsqueda por motivos políticos, sociales o comerciales.

Varios académicos han estudiado los cambios culturales provocados por los motores de búsqueda, [50] y la representación de ciertos temas controvertidos en sus resultados, como el terrorismo en Irlanda , [51] la negación del cambio climático , [52] y las teorías de la conspiración . [53]

Resultados personalizados y burbujas de filtro

Muchos motores de búsqueda como Google y Bing brindan resultados personalizados basados ​​en el historial de actividad del usuario. Esto conduce a un efecto que se ha denominado burbuja de filtro . El término describe un fenómeno en el que los sitios web usan algoritmos para adivinar selectivamente qué información le gustaría ver a un usuario, en función de la información sobre el usuario (como la ubicación, el comportamiento de clics anterior y el historial de búsqueda). Como resultado, los sitios web tienden a mostrar solo información que concuerda con el punto de vista anterior del usuario. Esto pone al usuario en un estado de aislamiento intelectual sin información contraria. Los principales ejemplos son los resultados de búsqueda personalizados de Google y el flujo de noticias personalizado de Facebook . Según Eli Pariser, quien acuñó el término, los usuarios están menos expuestos a puntos de vista conflictivos y están aislados intelectualmente en su propia burbuja informativa. Pariser relató un ejemplo en el que un usuario buscó en Google "BP" y obtuvo noticias de inversión sobre British Petroleum , mientras que otro buscador obtuvo información sobre el derrame de petróleo de Deepwater Horizon y que las dos páginas de resultados de búsqueda eran "sorprendentemente diferentes". [54] [55] [56] El efecto burbuja puede tener implicaciones negativas para el discurso cívico, según Pariser. [57] Desde que se identificó este problema, han surgido motores de búsqueda de la competencia que buscan evitar este problema al no rastrear o "burbujear" a los usuarios, como DuckDuckGo .. Otros académicos no comparten el punto de vista de Pariser y consideran que la evidencia en apoyo de su tesis no es convincente. [58]

Buscadores religiosos

El crecimiento global de Internet y los medios electrónicos en el mundo árabe y musulmán durante la última década ha alentado a los adherentes islámicos en el Medio Oriente y el subcontinente asiático a probar sus propios motores de búsqueda, sus propios portales de búsqueda filtrados que permitirían a los usuarios realizar búsquedas seguras . Más que los filtros de búsqueda seguros habituales , estos portales web islámicos clasifican los sitios web en " halal " o " haram ", según la interpretación de la "Ley del Islam" . ImHalal entró en línea en septiembre de 2011. Halalgooglingentró en línea en julio de 2013. Estos usan filtros haram en las colecciones de Google y Bing (y otros). [59]

Si bien la falta de inversión y la lentitud de las tecnologías en el mundo musulmán han obstaculizado el progreso y frustrado el éxito de un motor de búsqueda islámico, apuntando como principales consumidores a los adherentes islámicos, proyectos como Muxlim , un sitio de estilo de vida musulmán, recibieron millones de dólares de inversionistas como Rite Internet Ventures, y también vaciló. Otros motores de búsqueda orientados a la religión son Jewogle, la versión judía de Google, [60] y SeekFind.org, que es cristiano. SeekFind filtra sitios que atacan o degradan su fe. [61]

Envío al motor de búsqueda

El envío de un motor de búsqueda web es un proceso en el que un webmaster envía un sitio web directamente a un motor de búsqueda. Si bien el envío a los motores de búsqueda a veces se presenta como una forma de promocionar un sitio web, generalmente no es necesario porque los principales motores de búsqueda utilizan rastreadores web que eventualmente encontrarán la mayoría de los sitios web en Internet sin ayuda. Pueden enviar una página web a la vez o pueden enviar todo el sitio usando un mapa del sitio , pero normalmente solo es necesario enviar la página de inicio.de un sitio web ya que los motores de búsqueda pueden rastrear un sitio web bien diseñado. Quedan dos razones para enviar un sitio web o una página web a un motor de búsqueda: agregar un sitio web completamente nuevo sin esperar a que un motor de búsqueda lo descubra y actualizar el registro de un sitio web después de un rediseño sustancial.

Algunos programas de envío de motores de búsqueda no solo envían sitios web a múltiples motores de búsqueda, sino que también agregan enlaces a sitios web desde sus propias páginas. Esto podría parecer útil para aumentar la clasificación de un sitio web , ya que los enlaces externos son uno de los factores más importantes que determinan la clasificación de un sitio web. Sin embargo, John Mueller de Google ha declarado que esto "puede dar lugar a una gran cantidad de enlaces no naturales para su sitio" con un impacto negativo en la clasificación del sitio. [62]

Véase también

Referencias

  1. ^ "Motor de búsqueda History.com" . www.searchenginehistory.com . Consultado el 02-07-2020 .
  2. ^ "Inicio de sesión seguro de Penn State WebAccess" . webaccess.psu.edu . Consultado el 02-07-2020 .
  3. ^ Marchiori, Massimo (1997). "La búsqueda de información correcta en la Web: motores de hiperbúsqueda" . Actas de la Sexta Conferencia Internacional de la World Wide Web (WWW6) . Consultado el 10-01-2021 .
  4. ^ a b Brin, Sergey; Página, Larry (1998). "La anatomía de un motor de búsqueda web hipertextual a gran escala" (PDF) . Actas de la Séptima Conferencia Internacional de la World Wide Web (WWW7) . Consultado el 10-01-2021 .
  5. ^ "RFC 812 - NIC NOMBRE/WHOIS" . ietf.org .
  6. ^ "Programación de Knowbot: soporte del sistema para agentes móviles" . cnri.reston.va.us .
  7. ^ Deutsch, Peter (11 de septiembre de 1990). "[siguiente] Un servidor de servidor de archivo de Internet (era sobre Lisp)" . grupos.google.com . Consultado el 29 de diciembre de 2017 .
  8. ^ "Servidores web mundiales" . W3.org . Consultado el 14 de mayo de 2012 .
  9. ^ "¡Novedades! Febrero de 1994" . Inicio.mcom.com . Consultado el 14 de mayo de 2012 .
  10. ^ "Historia de Internet - Motores de búsqueda" (de Search Engine Watch ), Universiteit Leiden, Países Bajos, septiembre de 2001, web: LeidenU-Archie .
  11. ^ a b pcmag. "Archie" . pcmag.com . Consultado el 20 de septiembre de 2020 .
  12. ^ Alejandra Samuel. "Conozca a Alan Emtage, el tecnólogo negro que inventó ARCHIE, el primer motor de búsqueda de Internet" . ÍTACA . Consultado el 20 de septiembre de 2020 .
  13. ^ bucle noticias barbados. "Alan Emtage, un barbadense que deberías conocer" . loopnewsbarbados.com . Consultado el 21 de septiembre de 2020 .
  14. ^ Dino Grandoni, Alan Emtage. "Alan Emtage: el hombre que inventó el primer motor de búsqueda del mundo (pero no lo patentó)" . huffingtonpost .co.uk . Consultado el 21 de septiembre de 2020 .
  15. ^ Oscar Nierstrasz (2 de septiembre de 1993). "Catálogo de búsqueda de recursos WWW (experimental)" .
  16. ^ "Archivo de NCSA novedades en la página de diciembre de 1993" . 2001-06-20. Archivado desde el original el 2001-06-20 . Consultado el 14 de mayo de 2012 .
  17. ^ "¿Qué es el primer motor?" . BuscarCIO . objetivo tecnológico . septiembre de 2005 . Consultado el 5 de septiembre de 2019 .
  18. ^ Oppitz, Marcus; Tomsu, Peter (2017). Inventando el siglo de la nube: cómo la nubosidad sigue cambiando nuestra vida, economía y tecnología . Saltador. pag. 238. ISBN 9783319611617.
  19. ^ "Yahoo! Buscar" . yahoo! . 28 de noviembre de 1996. Archivado desde el original el 28 de noviembre de 1996 . Consultado el 5 de septiembre de 2019 .
  20. ^ Greenberg, Andy, "El hombre que le gana a Google" , revista Forbes , 5 de octubre de 2009
  21. ^ Yanhong Li, "Hacia un motor de búsqueda cualitativo", IEEE Internet Computing , vol. 2, núm. 4, págs. 24–29, julio/agosto. 1998, doi : 10.1109/4236.707687
  22. ^ a b "Acerca de: RankDex" , rankdex.com
  23. ^ USPTO, "Sistema y método de recuperación de documentos de hipertexto" , Número de patente de EE. UU.: 5920859, Inventor: Yanhong Li, Fecha de presentación: 5 de febrero de 1997, Fecha de emisión: 6 de julio de 1999
  24. ^ "Baidu Vs Google: los gemelos de la búsqueda en comparación" . MBA de cuatro semanas . 18 de septiembre de 2018 . Consultado el 16 de junio de 2019 .
  25. ^ Altucher, James (18 de marzo de 2011). "10 cosas inusuales sobre Google" . Forbes . Consultado el 16 de junio de 2019 .
  26. ^ a b "Método para la clasificación de nodos en una base de datos vinculada" . Patentes de Google. Archivado desde el original el 15 de octubre de 2015 . Consultado el 19 de octubre de 2015 .
  27. ^ "¡Yahoo! Y Netscape Ink acuerdo de distribución internacional" (PDF) . Archivado desde el original (PDF) el 16 de noviembre de 2013 . Consultado el 12 de agosto de 2009 .
  28. ^ "Las ofertas de navegador empujan las acciones de Netscape hasta un 7,8%" . Los Ángeles Times . 1 de abril de 1996.
  29. ^ Monedero, Bart. Motores de búsqueda . Libros de prensa de Penn State . Consultado el 20 de febrero de 2018 .
  30. ^ Gandal, Neil (2001). "La dinámica de la competencia en el mercado de motores de búsqueda en Internet" . Revista Internacional de Organización Industrial . 19 (7): 1103–1117. doi : 10.1016/S0167-7187(01)00065-0 .
  31. ^ "Nuestra historia en profundidad" . W3.org . Consultado el 31 de octubre de 2012 .
  32. ^ a b c d e f Jawadekar, Waman S (2011), "8. Gestión del conocimiento: herramientas y tecnología" , Gestión del conocimiento: texto y casos , Nueva Delhi: Tata McGraw-Hill Education Private Ltd, p. 278, ISBN 978-0-07-07-0086-4, consultado el 23 de noviembre de 2012
  33. ^ Dasgupta, Anirban; Ghosh, Arpita; Kumar, Ravi; Olston, Christopher; Pandey, Sandeep; y Tomkins, Andrew. La Descubribilidad de la Web . http://www.arpitaghosh.com/papers/discoverability.pdf
  34. ^ Jansen, BJ, Spink, A. y Saracevic, T. 2000. Vida real, usuarios reales y necesidades reales: un estudio y análisis de las consultas de los usuarios en la web. Procesamiento y gestión de la información . 36(2), 207-227.
  35. ^ Chitu, Alex (30 de agosto de 2007). "Manera fácil de encontrar páginas web recientes" . Sistema Operativo de Google . Consultado el 22 de febrero de 2015 .
  36. ^ "¿cómo funciona el motor de búsqueda?" . GFO = 26 de junio de 2018.
  37. ^ "¿Qué es el SEO local y por qué es importante la búsqueda local" . Diario del motor de búsqueda . Consultado el 26 de abril de 2020 .
  38. ^ "Cuota de mercado de motores de búsqueda en todo el mundo" . Estadísticas globales del contador de estadísticas . Consultado el 1 de marzo de 2022 .
  39. ^ "Internet en vivo - Estadísticas del sitio" . Internet en vivo . Consultado el 4 de junio de 2014 .
  40. ^ Arturo, Carlos (2014-06-03). "Las empresas tecnológicas chinas a punto de dominar el mundo" . El Guardián . Consultado el 4 de junio de 2014 .
  41. ^ "Cómo Naver daña la productividad de las empresas" . El diario de Wall Street . 2014-05-21 . Consultado el 4 de junio de 2014 .
  42. ^ "Era de los imperios de Internet" . Instituto de Internet de Oxford . Consultado el 15 de agosto de 2019 .
  43. ^ Waddell, Kaveh (2016-01-19). "Por qué Google abandonó China y por qué está regresando" . El Atlántico . Consultado el 26 de abril de 2020 .
  44. ^ Seznam se enfrenta a Google en la República Checa . Doz.
  45. ^ Seguev, El (2010). Google y la brecha digital: los sesgos del conocimiento en línea , Oxford: Chandos Publishing.
  46. ^ a b Vaughan, Liwen; Mike Thelwall (2004). "Sesgo de cobertura del motor de búsqueda: evidencia y posibles causas". Procesamiento y gestión de la información . 40 (4): 693–707. CiteSeerX 10.1.1.65.5130 . doi : 10.1016/S0306-4573(03)00063-3 . 
  47. ^ Jansen, BJ y Rieh, S. (2010) Las diecisiete construcciones teóricas de búsqueda y recuperación de información . Revista de la Sociedad Estadounidense de Ciencias y Tecnología de la Información. 61(8), 1517-1534.
  48. ^ Centro Berkman para Internet y Sociedad (2002), "Reemplazo de Google con sistemas de búsqueda alternativos en China: documentación y capturas de pantalla" , Facultad de derecho de Harvard.
  49. ^ Introducción, Lucas; Hellen Nissenbaum (2000). "Dar forma a la web: por qué importa la política de los motores de búsqueda". La Sociedad de la Información . 16 (3): 169–185. CiteSeerX 10.1.1.24.8051 . doi : 10.1080/01972240050133634 . S2CID 2111039 .  
  50. ^ Hillis, Ken; Petit, Michael; Jarret, Kylie (2012-10-12). Google y la cultura de la búsqueda . Routledge. ISBN 9781136933066.
  51. ^ Reilly, P. (2008-01-01). Spink, Prof. Dra. Amanda; Zimmer, Michael (eds.).Terroristas 'buscando en Google': ¿Los terroristas norirlandeses son visibles en los motores de búsqueda de Internet? . Ciencias de la Información y Gestión del Conocimiento. vol. 14. Springer Berlín Heidelberg. págs. 151–175. Bibcode : 2008wsis.book..151R . doi : 10.1007/978-3-540-75829-7_10 . ISBN 978-3-540-75828-0. S2CID  84831583 .
  52. ^ Hiroko Tabuchi, " How Climate Change Deniers Rise to the Top in Google Searches ", The New York Times, 29 de diciembre de 2017. Consultado el 14 de noviembre de 2018.
  53. ^ Ballatore, A (2015). "Google chemtrails: una metodología para analizar la representación de temas en los motores de búsqueda" . Primer lunes . 20 (7). doi : 10.5210/fm.v20i7.5597 .
  54. ^ Parramore, Lynn (10 de octubre de 2010). "La burbuja del filtro" . El Atlántico . Consultado el 20 de abril de 2011 . Desde el 4 de diciembre de 2009, Google se ha personalizado para todos. Entonces, cuando tuve dos amigos esta primavera en Google "BP", uno de ellos obtuvo un conjunto de enlaces sobre oportunidades de inversión en BP. El otro obtuvo información sobre el derrame de petróleo....
  55. ^ Weisberg, Jacob (10 de junio de 2011). "Problema de la burbuja: ¿la personalización web nos está convirtiendo en tontos solipsistas?" . pizarra _ Consultado el 15 de agosto de 2011 .
  56. ^ Bruto, Doug (19 de mayo de 2011). "Lo que Internet te está ocultando" . CNN _ Consultado el 15 de agosto de 2011 . Tenía amigos en Google BP cuando estaba ocurriendo el derrame de petróleo. Estas son dos mujeres que eran bastante similares en muchos aspectos. Uno obtuvo muchos resultados sobre las consecuencias ambientales de lo que estaba sucediendo y el derrame. El otro acaba de obtener información sobre inversiones y nada sobre el derrame.
  57. ^ Zhang, Yuan Cao; Séaghdha, Diarmuid Ó; Quercia, Daniele; Jambor, Tamas (febrero de 2012). "Auralist: Introducción a la serendipia en la recomendación musical" (PDF) . ACM WSDM . doi : 10.1145/2124295.2124300 . S2CID 2956587 .  
  58. ^ O'Hara, K. (2014-07-01). "En adoración de un eco". Computación en Internet IEEE . 18 (4): 79–83. doi : 10.1109/MIC.2014.71 . ISSN 1089-7801 . S2CID 37860225 .  
  59. ^ "Nuevo motor de búsqueda aprobado por el Islam para musulmanes" . Noticias.msn.com. Archivado desde el original el 12 de julio de 2013 . Consultado el 11 de julio de 2013 .
  60. ^ "Jewogle - Preguntas frecuentes" .
  61. ^ "Halalgoogling: los musulmanes obtienen su propio Google "sin pecado"; ¿Deberían los cristianos tener Google cristiano? - Blog cristiano" . blog cristiano . 2013-07-25.
  62. ^ Schwartz, Barry (2012-10-29). "Google: los servicios de envío de motores de búsqueda pueden ser perjudiciales" . Mesa Redonda de Motores de Búsqueda . Consultado el 04-04-2016 .

Lectura adicional

Enlaces externos