Buscar más allá de los motores de búsqueda


Los motores de búsqueda de uso general permiten que miles de millones de personas tengan acceso instantáneo a grandes cantidades de información. Fueron reportados por 80,000 participantes en un estudio publicado este año por investigadores del Instituto de Tecnología de Massachusetts (MIT) y la Universidad de Groning …

con una mediana de $ 17,530 por año (aproximadamente 14,000 GBP).

Se preguntó a los encuestados cuánta compensación necesitarían para renunciar a varios servicios digitales. Los motores de búsqueda eran más del doble de importantes que los correos electrónicos, casi cinco veces el valor de las tarjetas en línea y más de 50 veces el valor de las redes sociales entre lo que la gente pagaría y lo que realmente haría, en la mayoría No pasa nada Los autores sostienen que estos servicios valiosos pero gratuitos socavan las medidas económicas, incluido el producto interno bruto.

Los motores de búsqueda, sin embargo, ofrecen beneficios aún mayores para aquellos que necesitan encontrar información profesionalmente. Hace unos años, un periodista que recuerda este estudio unos meses después de su publicación habría podido buscarla durante horas. Al ingresar a "Motores de búsqueda de consumo excedente" en DuckDuckGo.com ahora se producirá una lista de comunicados de prensa MIT MIT sobre el estudio.

Los motores de búsqueda de uso general, sin embargo, tienen sus desventajas. Esto puede incluir la pérdida de privacidad, especialmente con Google dominante, pero hay rivales centrados en la privacidad como DuckDuckGo. Para los usuarios profesionales, existen cuestiones más apremiantes, como la ubicación de ciertos tipos de material, el manejo impreciso de los términos de búsqueda, la incapacidad de establecer parámetros ocupacionalmente importantes y los métodos para tratar con material no verbal. Responder estas preguntas puede significar buscar servicios más específicos más allá del motor de búsqueda universal.

Jisc ofrece servicios tecnológicos a sus miembros, universidades del Reino Unido, colegios e instituciones de investigación, incluidas sus bibliotecas. En julio, se completó el desarrollo de la Base Nacional de Conocimientos Bibliográficos (NBK), una base de datos de 41 millones de registros de 133 catálogos de bibliotecas institucionales que incluyen universidades, bibliotecas nacionales, organizaciones benéficas como National Trust, museos como V&A e institutos de investigación. Wellcome. Se espera que cubra 200 organizaciones para el verano de 2020.

NBK ha reemplazado los catálogos "sindicales" anteriores Copac y Suncat, pero no solo incorpora más tipos de materiales y organizaciones, sino que también agrega servicios de motor de búsqueda. Library Hub Discover que todos pueden usar tiene un único cuadro de búsqueda como interfaz principal, aunque también es posible la búsqueda dirigida por autor, tema e institución. Los resultados pueden incluir enlaces a un número creciente de recursos en línea, como: Por ejemplo, versiones digitalizadas de libros administrados por bibliotecas o sitios web de editores.

"Google ha definido una búsqueda simple para todos", dice Neil Grindley, director de búsqueda de recursos para Jisc. usado con estudiantes para buscar campos individuales. En este caso, sin embargo, todos los resultados son objetos que residen en bibliotecas científicas y bibliotecas de investigación. "Buscan en un área muy grande pero confusa".

Esto es significativo porque los motores de búsqueda de uso general no integran adecuadamente dicho contenido, dice Grindley. "Las bibliotecas no podían sentirse en la web abierta", agrega. "Queremos hacer algo al respecto".

Jisc no solo proporciona sus propios servicios sobre la base de NBK, sino que también publica los datos subyacentes para que los motores de búsqueda puedan usarlos para acceder directamente a catálogos de bibliotecas institucionales.

Búsqueda con paredes de pago

Si bien Jisc busca mejorar la calidad de la información de código abierto, los vendedores comerciales generalmente están construyendo sistemas para encontrar y descubrir planes de participación en las ganancias diseñados para hacer que los profesionales basados ​​en el conocimiento sean más eficientes. Esto puede incluir acceso a información solo para suscriptores, como abogados y publicaciones contables, y puede incluir el uso de aprendizaje automático para mejorar la búsqueda basada en palabras clave.

Signal AI, con sede en Londres, utiliza decenas de miles de "clasificadores" para el material abierto y pagado que gestiona para los clientes. Estas son etiquetas utilizadas por publicaciones y blogs que cubren marcas, países, personas y temas. En lugar de ser elegidos por humanos, la compañía usó un sistema entrenado en máquinas que normalmente los usa en menos de un minuto. También se calculan otras medidas, incluido el salario.

A principios de este año Signal AI anunció un contrato con Deloitte que permite a la firma consultora ofrecer a los clientes un servicio que monitorea las fuentes reguladoras en más de 100 jurisdicciones. Utiliza clasificadores entrenados por Deloitte para agrupar material en tipos de impuestos específicos, incluso si diferentes países usan terminología diferente. Los resultados se pueden compartir en boletines de correo electrónico regulares.

Signal AI ha comenzado a monitorear los medios, pero también se ha expandido a ejecutivos de cumplimiento, riesgo y negocios. Amy Collins, vicepresidenta de la compañía de productos, ve un mayor potencial en ventas, gestión de productos e ingeniería. Aunque es posible crear consultas complejas en motores de búsqueda universales, puede ser complicado y poco confiable, dice ella.

"Resolvimos eso con el aprendizaje automático", dice Collins. "Hemos simplificado el problema de búsqueda".

La compañía también permite a los usuarios entrenar a sus propios clasificadores a través de un sistema oficial llamado Vulcan, que Collins llama "Tinder for AI", donde buscan por aceptar refinar o rechazar su producción.

Krzana, otra compañía con sede en Londres, presta servicios a sus clientes de medios de manera similar, incluido Reach, que mantiene salas de redacción locales, incluidas las de Manchester Evening News y . Birmingham Mail y un servicio nacional de radio e información.

Los periodistas deben centrarse en "cinco W" al escribir historias (quién, qué, cuándo, dónde y por qué) y la compañía lo ayuda a utilizar el aprendizaje automático para identificar a las personas y organizaciones mencionadas en el material.

Según Toby Abel, fundador y director de tecnología, Systems Architecture incluye un modelo de "registro de cambios" sobre lo que ha aparecido recientemente. "Ese es un enfoque que no se encuentra en la búsqueda promedio", dice. Para los periodistas que cubren áreas geográficamente definidas, "dónde" es importante para que Krzana localice el material geográficamente para que los periodistas en la ciudad más grande de West Midlands no se distraigan con historias sobre Birmingham en Alabama.

El sistema también puede ayudar a los periodistas a aplicar prácticas institucionales. Por ejemplo, lo que generalmente implica un tipo particular de historia. "Hay mucha creatividad en lo que hacen, pero también hay muchos patrones", dice Abel. "Un motor de búsqueda personalizado puede encriptar parte de él".

Por ejemplo, el sistema puede sugerir que una historia en un festival contiene comentarios de locales, empresas, participantes y personas negativas.

Inject Project Un servicio desarrollado para periodistas financiados por la UE tiene como objetivo aumentar la creatividad de los periodistas mediante el uso de inteligencia artificial para proporcionar material relacionado pero distinto. Se basa en 380 fuentes de noticias y más de 16 millones de artículos en seis idiomas, incluida la Agencia de Prensa Alemana.

"No haremos que los periodistas sean más creativos", dice Neil Maiden, profesor de creatividad digital en Cass Business School, City, University of London. "Creemos que podemos hacerlos creativos, pero más rápidos que en este momento".

Sugerencias e ideas

El sistema sugiere sugerencias e ideas, tales como: Por ejemplo, una búsqueda de renuncia en mayo del Ministro de Justicia chipriota Ionas Nicolaou sobre el asesinato de mujeres extranjeras crea vínculos con la desaparición de extranjeros en Grecia y otros países mediterráneos. Según Maiden, el sistema tiene como objetivo proponer en cuatro áreas: evidencia, interés humano, aspectos extraños o humorísticos y consecuencias futuras.

"Estos aspectos no son muy nuevos", dice. "Nuestro trabajo consistía en codificarlos manipulando los mensajes existentes para llevar a los periodistas a nuevas historias".

Todos estos servicios se centran en las palabras, pero algunos funcionan principalmente con imágenes o datos. La biblioteca de imágenes Shutterstock, con sede en Nueva York, afirma que más del 90% de los usuarios utilizan la búsqueda de palabras clave para encontrar imágenes, un proceso que se mejora al sugerir palabras clave populares para los fotógrafos contribuyentes y creadores de imágenes al escribir descripciones. La compañía planea extender el uso del procesamiento de lenguaje natural para que los contribuyentes puedan escribir en uno de los 21 idiomas que los usuarios ya pueden buscar.

Shutterstock también ha introducido métodos de búsqueda utilizando imágenes basadas en factores como los colores y los objetos mostrados, utilizando tecnología conocida como "visión por computadora". Reveal, una búsqueda de uno a muchos, tiene como objetivo devolver imágenes que son similares a las identificadas a través de una extensión del navegador Chrome, con una versión recién iniciada que también puede devolver videos. Según su propia información, los usuarios pueden entrenar la función de búsqueda con imágenes que les gusten.

Según la compañía, las páginas de búsqueda de Computer Vision están involucradas en el 12% de las vistas de páginas de búsqueda y el 26% de las descargas.

"Nos acercamos a 300 millones de imágenes", dice Peter Silvio, vicepresidente senior de ingeniería y arquitectura. "El desafío de poner la imagen correcta frente a la persona en el momento adecuado se convierte en un problema exponencialmente difícil de resolver. Al proporcionar estos canales reconocibles adicionales, los usuarios pueden sumergirse en lo que están buscando.

En términos de datos, Google y otras compañías ofrecen servicios de gráficos en línea gratuitos, conocidos como visualización de datos. Sin embargo, los servicios pagos pueden ofrecer muchos extras. Tableau, con sede en Seattle, agregó recientemente Ask Data que genera visualizaciones basadas en consultas ingresadas en lenguaje normal, y Explain Data que utiliza métodos estadísticos para identificar razones para para sugerir valores inesperados en muchos datos.

Facilidad de uso

Paul Heather, director del sector público en Tableau, dice que el objetivo general es la facilidad de uso que permite a los científicos de datos y a otros en servicios públicos como el cuidado de la salud visualizar datos más rápido. "Se trata de salvar vidas u obtener un tratamiento de mejor calidad", agrega.

Una serie de usuarios del NHS, incluida la Greater Manchester Health and Social Care Partnership utilizan Tableau para generar paneles útiles Decidir sobre el mejor hospital para pacientes en ambulancia.

La compañía con sede en Cambridge GeoSpock se enfoca en hacer que grandes cantidades de datos generados por máquina puedan buscarse espacial y temporalmente para tratar con datos de sensores del Internet de las cosas. En agosto, anunció una asociación con el especialista en información del mercado marítimo del Báltico para desarrollar una geodatabase global para la industria, centrándose en las nuevas emisiones al aire a la luz de las nuevas regulaciones en esta área.

Los datos marítimos geoespaciales están aumentando demasiado rápido debido a los pasos hacia envío autónomo y la creciente demanda de rastreo de carga. Según Richard Baker, CEO de GeoSpock, también hay potencial para otros tipos de logística: gobiernos locales que establecen sensores inteligentes en la infraestructura física, operadores móviles y anunciantes basados ​​en datos. "Lo que Google ha hecho por la Web, queremos hacer por la infraestructura física", dice.

La diferencia entre los motores de búsqueda de propósito general y muchas organizaciones que quieren ir más allá de ellos es que a estos últimos les gustaría cobrar por ellos. Pero si ayudan a los profesionales a descubrir y explotar materiales de manera más rápida y efectiva, puede valer la pena pagarlos, incluso si los excedentes de los consumidores son más bajos.



Control de obras 3000 de Cea Ordenadores