Evolución semántica de Google: de Metaweb a Knowledge Graph, más web semántica


La semana pasada Google lanzaba Knowledge Graph (16 de mayo) con el objetivo de facilitar la labor de entendimiento de una consulta y presentación de información ajustada a la intencionalidad con la que la realizaba el usuario,  es decir, que en el proceso de búsqueda de información por parte de un usuario si éste utiliza el lenguaje natural, que el buscador tenga capacidad de interpretar estos términos y presentar los resultados de información acorde con su motivación de búsqueda.

Hasta ahora el comportamiento de los buscadores era presentar documentos acorde con la concordancia del término de búsqueda, pero la evolución natural por el que quieren pasar todos los buscadores, y en el caso de Google está tomando la delantera (Wolfram Alpha sigue con “vida” si bien la proyección que se le esperaba, no ha despegado como alternativa clara a los grandes buscadores), es presentar resultados en función de la motivación real del usuario.

¿Qué nos aporta Knowledge Graph?

  • Con Knowledge Graph se pretende buscar cosas, personas o lugares sobre las que Google tiene conocimientos y presentar información relevante sobre éstas en el proceso de búsqueda, este actividad se nutre de la inteligencia colectiva de la web acercándose al “mundo de las personas”.
  • Para poder presentar esta información y responder a la intencionalidad de la búsqueda, Google está haciendo uso de Freebase, Wikipedia, CIA World Factbook, así como un análisis constante de lo que busca la gente y su propio proceso de rastreo e identificación de lo que hay en la web.
  • Debido a la ambigüedad del lenguaje y cómo esto puede impactar en un proceso de búsqueda, Knowledge Graph trabaja para entender el contexto/el matiz de la búsqueda cuando un usuario introduce los términos de búsqueda.
  • El ejemplo que se pone es cuando un usuario realiza una búsqueda por Taj Mahal ¿está buscado información sobre el monumento o sobre el músico?, con Knowledg Graph parece que ahora se va a tener capacidad para responder a la intencionalidad del usuario. Por el momento, la presentación de estos resultados, está siendo trabajada dentro de Google.com y hay que estar logado – ejemplo término de búsqueda: “diesel” ¿marca, el músico australiano o material energético? – para ver los resultados en el lateral derecho.
Interpretación semántica de Google para el término de búsqueda "diesel"

Interpretación semántica de Google para el término “diesel”, ver lateral derecho

  • Knowledge Graph va a tener capacidad para entender lo que se está buscado, y por tanto, hacer un resumen de contenidos relevantes sobre el término de búsqueda. La pregunta que se plantea Google (en este caso Amit Singhal) es cómo ellos mismos saben cuales son los aspectos más relevantes de cada elemento, aquí Google vuelve “a tirar” del análisis de consumo de información que realizan los usuarios cuando hacen una búsqueda, para saber qué es relevante y qué no. Un ejemplo de  información agregada de personas con “menor recorrido” histórico – ejemplo: Rick Astley, quién no se acuerda de Never Gonna Give You Up😉 – permite obtener un volumen relevante de información en tiempo real.
comportamiento semántico de Google

Resumen en el lateral derecho de aspectos relevantes de Rick Astley

  • Esta vinculación entre los diferentes elementos de una entidad pueden ser presentados de forma resumida porque están relacionados entre ellos en el Knowledge Graph.
  • La vinculación de los elementos de una entidad permitirán identificar/descubrir aspectos que hasta ahora podían ser desconocidos.
  • Esta funcionalidad (Knowledge Graph) del buscador de momento está siendo implementada en la versión inglesa norteamericana, en smartphones y tablets.

Tienes más información sobre el funcionamiento de Knowledge Graph en el Blog Oficial de Google y en su vídeo de presentación:

De la cadena de caracteres al lenguaje natural

Esta evolución de Google viene siendo trabajada desde antes de la compra de Metaweb (Freebase) -base de datos abierta sobre personas, lugares y cosas, relacionados entre si –  en julio de 2010, en el que ya se hacía mención del esfuerzo que estaba realizando el buscador para entender preguntas más complejas más allá de tener capacidad para responder búsquedas como “tiempo en Madrid” o “presidente de España”.

[Vídeo]: Explicación del funcionamiento de Metaweb

En la presentación que hizo Andrew Hogue en Google Tech Talk “The Structured Search Engine”  ya dejaba entrever la evolución que estaba teniendo en Buscador de Google y sus próximos lanzamientos.

[Vídeo]: Google Tech Talk “The Structured Search Engine, enero 2011″

Un análisis también bastante interesante es el que realiza Justin Briggs en Entity Search Results, a través del cual explica cómo los buscadores (y en concreto Google) están pasando de reconocer las cadenas de caracteres a las Entidades, y  la relación de éstas con sus atributos.

Evolución y actualización del algoritmo

A esto hay que sumarle, la constante evolución que está teniendo el buscador desde el año pasado, en el que las actualizaciones de algoritmo siempre incorporan elementos vinculados al reconocimiento de la autoría de los contenidos, a la sinonimia de los términos y a la frecuencia de actualización de los contenidos. Desde comienzo de año, es relevante destacar las actualizaciones de febrero, marzo y abril de 2012, donde ya hay indicios claros del trabajo que Google está haciendo para poder relacionar contenidos y su vinculación semántica:

  • Actualización de febrero de 2012 realizan actualizaciones sobre las búsquedas relacionadas e incremento de
    trabajo en el reconocimiento de las páginas oficiales.
  • En marzo de 2012 se actualizan aspectos relacionados con mejorar la indexación de las páginas de los perfiles públicos -sitios sociales- (codename “Prof-2” ), mejorar el reconocimiento de nombres (codename “NameDetector”), señales de personalización (codename “PSearch”), y uno de los más importante, la sinonimia entre los términos (codename “Synonyms” y codename “Gemini”).
  • En abril de 2012, centra su actualización en la mejora del reconocimiento de la autoría de las páginas y la predicciones de autocompletados (codename “Autocomplete”).

Otros elementos que han marcado esta evolución han sido: el apoyo al sistema de microdata Schema.org (agosto 2011), reconocimiento de la microdata dentro de los resultados naturales a través de los Rich Snippets  -actualmente Google reconoce los fragmentos enriquecidos de los contenidos de opiniones, contactos, productos, empresas y organizaciones, eventos, música y contenido de vídeo-, herramienta de verificación de microdata, el impacto del Social Graph -vinculación, relación y autoría de los perfiles sociales-, autoría de la información, reconocimiento del marcado Authorship o las  insignias de verificación de perfiles y páginas.

¿Cómo puede influir la evolución semántica de los Buscadores en la labor SEO?

Sin duda alguna, la evolución por la que pasará la aplicación de prácticas de optimización SEO estarán más orientadas como mínimo en cuatro aspectos principales:

  • Análisis e investigación de tendencias de consumo de información por parte de los usuarios
  • Comportamientos de búsqueda por parte de los usuarios
  • Trabajar el marcado semántico de los contenidos que se generen (Microdata)
  • Trabajara con un lenguaje de etiquetado reconocido por los principales buscadores: HTML5

Artículos relacionados:

Search Engines and Entities By Bill Slawski, 13 de junio de 2012

Un comentario en “Evolución semántica de Google: de Metaweb a Knowledge Graph, más web semántica

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s