Noticias relacionadas y noticias equivalentes

2014 diciembre 29
por classora

Las noticias relacionadas sobre un determinado tema constituyen uno de los recursos más utilizados por los periódicos digitales para mantener la atención del usuario. Este recurso surgió en el mismo momento en el que las noticias en papel se pudieron reproducir como contenidos de una web, con todas las implicaciones que ello tenía (enlaces en el texto… etc). Por tanto, entre otras consecuencias más profundas, Internet también abrió a los periódicos una pequeña puerta que les permitía dar vida a textos que habían publicado hace días, semanas o incluso años. Una puerta a la hemeroteca. Textos que antes se convertían simplemente en papel mojado. Y todo ello aportando valor al usuario.

Hoy en día la mayor parte de los diarios digitales incluyen noticias relacionadas para cada texto que publican. Existen estudios, basados en mapas de calor y otros hábitos de los usuarios, que indican cual es la posición ideal para maximizar el click-through en el bloque de noticias relacionadas, en función del layout que utiliza el periódico para presentar sus contenidos. En este sentido, casi todos coinciden en que el final de la noticia, justo antes de los comentarios, es una posición muy adecuada para incrustar las noticias relacionadas. En este supuesto, partimos de que el usuario ha leído el contenido, ha mantenido el interés haciendo scroll sobre la página y, por tanto, es un claro candidado a demandar más información sobre el tema. También existen medios que analizan en profundidad la presentación del bloque de noticias relacionadas, ya que, al igual que con la publicidad, no se obtiene el mismo resultado de clicks presentando un texto básico que una combinación de fotografía y texto.

Mapa de calor sobre una web

Las implicaciones que tiene para un periódico online conseguir mostrar buenas noticias relacionadas, colocando los enlaces en el sitio adecuado y en el formato más oportuno, son claras: se incrementan métricas web como el nº de páginas vistas por usuario, o el tiempo de permanencia. Y en consecuencia, se alcanza una mayor exposición a la publicidad, lo cual es siempre positivo teniendo en cuenta que ahí reside el negocio.

Classora Technologies dispone de una tecnología semántica que, para una determinada noticia, permite calcular automáticamente las mejores noticias relacionadas dentro de su mismo periódico. Desde un punto de vista técnico, esto requiere una comprensión avanzada del texto por parte del software. Y en esto precisamente es en lo que destaca nuestra compañía, permitiendo obtener los mejores resultados de etiquetado, clasificación temática y cálculo de noticias relacionadas en español. La posibilidad de automatizar esta tarea facilita mucho la labor de los periodistas, que no tienen que buscar manualmente entre el archivo de su diario.

Mapa de calor sobre una página de resultados de Google

Noticias equivalentes

Las noticias equivalentes a una noticia dada son aquellos contenidos informativos publicados en otros periódicos o medios de comunicación que dan cobertura exactamente al mismo evento o suceso. Es decir, son el contenido equivalente con el que otros periódicos compiten con nosotros.

Que un redactor conozca las noticias equivalentes que están publicando otros periódicos es una herramienta de trabajo muy útil: puede estar editando un texto, y gracias a un simple botón dentro de su CMS, comprobar qué otros medios están hablando de lo mismo y con que intensidad/profundidad están tratando el asunto. Esto le permite no solo contrastar opiniones y puntos de vista, sino que también le impide dejar en el olvido detalles de valor para la audiencia.

Precisamente la audiencia sería una de las grandes favorecidas si los medios se decidiesen a incrustar enlaces en sus webs para indicar las noticias equivalentes en otros periódicos. Con el permiso de la polémica tasa Google, y a pesar de que a simple vista parece contraproducente para el modelo de negocio del medio (desviar tráfico a la competencia), existen precedentes exitosos de periódicos líderes que lo han llevado a cabo. Algunos críticos han visto este planteamiento como una manera de demostrar madurez y reforzar el liderazgo: soy la referencia informativa y me permito anteponer el interés de mis usuarios al mío propio.

Al igual que las noticias relacionadas, en Classora Technologies disponemos de un servicio único que permite localizar automáticamente las noticias equivalentes. Para ello, un cliente nos puede especificar qué otros medios desea monitorizar y, gracias a nuestros bots de rastreo y nuestras tecnologías de análisis de textos, en su redacción tendrá información al minuto acerca de los contenidos semánticamente equivalentes o similares que están siendo volcados a la web por otros medios de comunicación.

Más información

Como en otras ocasiones, si te interesa conocer más información sobre este tema no dudes en contactar con nosotros para que te enviemos documentación adicional. Cuenta con Classora Technologies para estar informado sobre tendencias semánticas y para estudiar las alternativas de modernización de CMS y rentabilización de medios digitales.

Decálogo de sinergias entre Classora y un fabricante de CMS para medios digitales

2014 noviembre 8
por classora

¿Qué puede aportar Classora Technologies a un fabricante de CMS? Prácticamente todos los textos que hemos publicado en este blog hablan del valor que aportan nuestros productos a los medios digitales. Sin embargo, en esta ocasión vamos a repasar brevemente la potencia que puede obtener una empresa desarrolladora de un CMS a través de una alianza estratégica con Classora Technologies.

En resumen, Classora dispone de una suite de funcionalidades que pueden convertir un CMS tradicional en un CMS semántico: una herramienta de nueva generación. No se trata solo de que los usuarios del CMS escriban en un back-end y publiquen en uno o varios front-ends. Se trata de que el software entienda automáticamente de que se está hablando en un momento dado, y que actúe en consecuencia: sugiriendo contenidos relacionados, aportando información contextual, incrustando los metadatos oportunos, clasificando automáticamente el texto en las categorías adecuadas, informando sobre cómo la competencia está tratando el mismo tema, informando sobre como responde la audiencia…

De CMS tradicional a CMS semántico

A continuación el decálogo con las sinergias potenciales entre Classora y un CMS:

1º) Etiquetado automático de contenidos

Classora Technologies dispone de un poderoso conjunto de algoritmos que permiten etiquetar las noticias y los contenidos textuales de un medio digital. Además, el hecho de disponer en propiedad uno de los tesauros automatizados más completos en español, Classora Knowledge Base, permite generar ontologías a medida, diferenciando la naturaleza de cada entidad localizada.

2º) Clasificación automática de textos en categorías predefinidas

No es por márketing, es porque estamos convencidos de que es verdad: en Classora disponemos del mejor software para clasificar contenidos en español. Un cliente puede pasarnos un archivo gigantesto de contenidos desestructuradados (por ejemplo, toda la hemeroteca digital/digitalizada de un medio centenario) y un conjunto finito de categorías o «compartimentos» o en los que quiere organizar dichos contenidos. Nosotros lo podemos clasificar, en tiempo récord, con calidad impecable.

3º) Cálculo de noticias relacionadas y equivalentes

El entendimiento automático del contenido de cada noticia sirve para que seamos capaces de proporcionar las noticias relacionadas mejor que ningún otro motor de recomendaciones. Esto implica que todos los enlaces de «Quizá también te interese…» o «Para profundizar más…» que se le presentan a los usuarios pueden proceder automáticamente de nuestros servicios, sin necesidad de supervisión humana. Además, en Classora Technologies podemos facilitar noticias equivalentes, que son simplemente enlaces a otros medios de comunicación que tratan exactamente la misma noticia. Se trata de un servicio innovador que permite a periodistas y usuarios comparar textos equivalentes publicados en distintos periódicos para cubrir el mismo tema.

4º) Enriquecimiento del diario digital con fuentes Open Data

Gracias al rastreo y monitorización de un centenar de fuentes open-data, Classora permite complementar un texto de entrada con contenidos externos relevantes. Estos contenidos pueden ser de naturaleza muy variada, desde definiciones enciclopédicas a gráficas comparativas, mapas, rankings, imágenes, vídeos o componentes de redes sociales. Este tipo de herramientas están entre las últimas tendencias de Internet. No hay más que ver el fulminante éxito de Google Knowledge Graph, que enriquece semánticamente la búsquedas en Google.

5º) Multiplicación del contenido y del espacio publicitario

Una consecuencia directa del punto anterior es que los contenidos que puede publicar un medio no se limitan exclusivamente a lo que puede teclear su redacción día a día, o a lo que pueden comprar a las agencias de noticias. Gracias las tecnologías de la web semántica, a las políticas de transparencia y a filosofías como el Open Data (datos abiertos) o el Open Government (gobierno abierto) existen muchos contenidos que se pueden reproducir libremente dentro del diario, citando las fuentes adecuadas, mientras se aporta valor a los usuarios y se incrementa el espacio publicitario que se puede comercializar.

6º) Herramientas para Data Mining y Data-Driven Journalism

El periodismo de datos está cobrando cada vez más fuerza. Y sin embargo, existen pocas herramientas de software que realmente faciliten esta labor. Se trata de profundizar en la información, de encontrar correlaciones novedosas, de visualizar el conocimiento de maneras alternativas, de llegar a conclusiones inéditas. Aquí entra en escena una de las mayores ventajas que puede aportar Classora: gracias a indexar contenidos de fuentes externas, nuestra tecnología permite comparar una gran cantidad de indicadores heterogéneos, cruzar datos de todo tipo, y representarlos tabularmente, gráficamente o en mapas. En resumen, Classora aporta una solución innovadora y pionera para dar soporte al periodismo de datos.

7º) Mejoras en SEO y presencia en Redes Sociales

La multiplicación del contenido asociado a un determinado elemento, la estructuración del mismo con los metadatos semánticos adecuados, y la generación de informes en distintos formatos representan la piedra angular sobre la que incrementar el posicionamiento en buscadores y la presencia en redes sociales. Google encontrará más contenidos bajo nuestro dominio para un determinado texto de búsqueda, lo que nos permitirá ascender en el ranking para dicha búsqueda. Por su parte, los usuarios encontrarán gráficas e informes inéditos que podrán compartir en Facebook y en Twitter, favoreciendo la viralización. El SEO y el Social Media son la consecuencia natural de hacer bien ciertas cosas.

8º) Benchmarking, cálculo de trending topics y cobertura temática

La tecnología de Classora permite rastrear bajo demanda otros medios de la competencia para procesar semánticamente todo lo que publican. Esto tiene diferentes ventajas: 1º) permite a cada medio saber sobre qué temas se está hablando con más intensidad en otros periódicos, 2º) permite descubrir que temas está descuidando nuestra redacción en un momento dado, 3º) permite certificar el sentimiento (positivo, negativo, neutro) con el que se está tratando un tema. 4º) Permite realizar un estudio histórico para ver el sesgo introducido por cada periódico.

9º) Incorporación del análisis de sentimiento a la ecuación

Classora dispone de algoritmos para evaluar el sentimiento. El objetivo del análisis de los sentimientos es determinar la actitud, la opinión y el estado emocional que tiene una persona al escribir sobre un determinado tema. Si trasladamos este concepto a un punto de vista más amplio, surgen muchas aplicaciones prácticas y de negocio, y el objetivo no es otro que cuantificar las impresiones y opiniones subjetivas que, ante una determinada marca, empresa o persona, tiene la audiencia de Internet en general y de un medio de comunicación en particular.

10º) Estudio del comportamiento de las audiencias

Classora dispone de la capacidad para generar perfiles multidimensionales, basados en la navegación de los usuarios, mucho más exhaustivos que los que se limitan a analizar las tres dimensiones de siempre: sexo, ubicación geográfica y edad. Classora puede llegar a inferir si un usuario es fan del Real Madrid o del FC Barcelona, es capaz de saber si le gusta la carne o si es vegetariano. Es posible que pueda llegar a conocer a fondo sus intereses y generar un perfil más completo que nunca para trasladar a cualquier adserver.

Y todo para distintas plataformas…

Classora está trabajando para trasladar su core tecnológico a otros sectores en los que también tienen cabida los fabricantes de CMS. Estamos hablando de enriquecer la experiencia del usuario que tiene una Smart TV, del usuario que tiene una tablet o un smartphone y lo utiliza como Segunda Pantalla (Second Screen) o de un usuario que disfruta de la lectura de un libro electrónico. De momento esta parte está compuesta solo por una serie de proyectos piloto, pero los productos para la prospección comercial y las capacidades de innovación ya están servidos.

Más información

Como en otras ocasiones, si te interesa conocer más información sobre este tema no dudes en contactar con nosotros para que te enviemos documentación adicional. Cuenta con Classora Technologies para estar informado sobre tendencias semánticas y para estudiar las alternativas de modernización de CMS y rentabilización de medios digitales.

Participación de Classora durante la Asamblea General de la SIP en Santiago de Chile

2014 octubre 28
por classora

Al igual que en las anteriores ediciones de Denver (Colorado) y de Barbados, Classora Technologies ha tenido la oportunidad de participar, en calidad de ponente, en una nueva reunión de la Sociedad Interamericana de Prensa (SIP). En esta ocasión, la asamblea fue celebrada en Santiago de Chile. La SIP es una asociación de propietarios y altos ejecutivos de periódicos y agencias informativas de América, cuyo objetivo es defender la libertad de prensa y los derechos de los periodistas, así como promover un mayor intercambio de información entre la sociedad. Los miembros de la SIP se reúnen dos veces al año: en la Asamblea General y en la Reunión de Medio Año.

Logo de la Asamblea SIP en Santiago de Chile

La última Asamblea General tuvo lugar del 17 al 21 de Octubre en Santiago de Chile. En esta ocasión, nuestro partner Ángel Leo-Revilla sustituyó a Francisco Vasquez, debido a una afonía de este último, en el repaso al estado de los medios en Latinoamérica. Además, y de manera completamente independiente, Ángel impartió un seminario acerca de las tecnologías semánticas aplicadas a medios digitales y las posibilidades de enriquecer diarios online con contenidos externos. En Classora Technologies ya habíamos tenido la oportunidad de participar en anteriores reuniones de la SIP. Concretamente, nuestro compañero Iván Gómez fue ponente en Denver (Colorado) y nuestro compañero Diego Cobelo fue ponente en Barbados. En todas estas presentaciones Classora Technologies ha tratado de trasladar el expertise tecnológico, el conocimiento del mercado y las últimas tendencias del sector a las compañías de prensa de los diferentes países del continente americano.

Participación de Ángel Leo-Revilla

Las conferencias dispusieron de traducción simultánea a inglés y portugués, y fueron seguidas por decenas de personas en los salones del Hotel W Santiago y por cientos de personas en Internet.

Estado de los medios latinoamericanos en el negocio digital

En su participación inicial, Ángel se encargó de exponer la primera parte del estudio que organiza la SIP para monitorizar el estado de los medios editoriales latinoamericanos en el negocio digital. A diferencia de otras ediciones, en las que el estudio se basaba exclusivamente en el desarrollo de encuestas directas a ejecutivos de los medios editoriales en la región, en esta ocasión se han integrado datos procedentes de distintas fuentes independientes como: la Unión Internacional de Telecomunicaciones, comScore, Zenith Optimedia, Facebook, Twitter, Klout Score, Google+ o Alexa. Partiendo de esta premisa, Ángel centró su discurso en los resultados del análisis llevado a cabo, destacando puntos como:

  • El nº de internautas en Latinoamérica crece a un ritmo muy elevado, debido a la relativa baja penetración de Internet en comparación con otras regiones como Estados Unidos o Europa.
  • Los usuarios latinoamericanos mantienen uno de los tiempos de permanencia en los medios más elevados del mundo.
  • En cuanto a las características demográficas, el perfil medio de los internautas latinoamericanos es muy joven: los menores de 35 años ocupan el 60% de la población activa en La Red.
  • Con respecto a los dispositivos de conexión, el PC mantiene su hegemonía pero se prevé que en pocos años el tráfico móvil lo supere con creces.

En el siguiente enlace (EN) se puede acceder al resumen ejecutivo de este estudio.

Participantes en el seminario

En la imagen anterior se muestran los participantes en el panel. De izquierda a derecha, el jefe digital Oficial CDO del Diario Deportivo AS, Adrián Segovia; el coordinador de la mesa, Álvaro Cavieres, el CEO de Audience Circles Inc. Francisco Vásquez y el COO de Audience Circles Inc. y partner de Classora Technologies Angel Leo-Revilla.

Más información

Como en otras ocasiones, si te interesa conocer más información sobre este tema no dudes en contactar con nosotros para que te enviemos documentación adicional. Cuenta con Classora Technologies para estar informado sobre tendencias semánticas y para estudiar las alternativas de modernización y rentabilización de medios digitales.

Componentes de I+D+i en los proyectos de enriquecimiento semántico de Classora

2014 septiembre 24
por classora

A día de hoy, el enriquecimiento semántico se encuentra en un momento incipiente ya que, por una parte se ha demostrado su utilidad práctica, avalada por proyectos de la BBC, The Guardian, The New York Times o el propio Google, pero por otra parte, las tecnologías y los productos construidos no han llegado a un punto estacionario. La situación es más bien la contraria: las tecnologías de enriquecimiento están en plena fase de eclosión, buscando alcanzar el límite de las aplicaciones y ventajas que pueden llegar a aportar. Muy probablemente continuarán evolucionando durante los próximos años buscando una mayor integración con las tecnologías de Lenguaje Natural y una mayor convergencia con la Web Semántica. Esto ha propiciado que todavía no existan soluciones genéricas sectoriales, y que los principales casos de éxito vengan precisamente de la mano de los grandes jugadores del sector web-digital, donde se destina mucho capital y esfuerzo a Investigación, Desarrollo e Innovación.

De hecho, el enriquecimiento semántico se basa actualmente, y en su mayor parte, en procesar textos digitales en web (noticias, reportajes, documentos, posts en blogs, páginas temáticas, resultados de búsqueda… etc.) y tiene una implantación muy escasa en otros formatos más allá de la palabra escrita en la Red. En este sentido, todavía queda mucho margen para la experimentación y la innovación:

Aplicaciones en la TV interactiva

El enriquecimiento semántico puede ser trasladado a la pantalla del salón utilizando tres puertas de entrada: en primer lugar, utilizando el texto de las EPG (Electronic Programmation Guides) que facilitan la parrilla televisiva de un determinado canal. En segundo lugar, utilizando las bases de datos de empresas intermediarias, que facilitan información adicional a las EPGs (como sinopsis de películas, series y personajes). En tercer y último lugar, procesando semánticamente los propios subtítulos del programa (película, serie, partido… etc.) que se emite en un momento dado. A partir de cualquiera de estos puntos, un usuario de TV podría consultar bajo demanda, desde el sofá y directamente con el mando, contenidos relacionados con lo que está viendo: podría comprobar lo que se está comentando en Twitter sobre un determinado evento, podría ver información enciclopédica, encuestas, gráficas, mapas… realizar comparaciones a medida con miles de millones de posibilidades, etc. Y todo ello sin tener que recurrir a Google, Wikipedia o Facebook: directamente como contenido adicional enriquecido de la TV. Este contenido se podría mostrar superpuesto en la propia TV o utilizando soluciones de Segunda Pantalla.

Aplicaciones en la radio

Gracias a la transcripción a texto de programas de radio, canciones (si no hubiese lyrics disponibles), podcasts… etc. se podría llegar a etiquetar automáticamente cualquier archivo de audio. Esto permitiría aplicar todas las ventajas del enriquecimiento semántico a la radio. Entre estas ventajas conviene destacar la posibilidad de mejorar la organización interna de los contenidos de audio y linkarlos automáticamente con otros contenidos de audio, video o texto (incluyendo canciones, programas previos, notas de prensa… etc.). Incluso, en función del nivel de detalle de la transcripción, podría llegar a ser posible incluir marcas de tiempo, para que al demandar el contenido de una determinada etiqueta sea posible posicionarnos en el momento exacto del audio en el que se menciona dicha etiqueta. Pero los beneficios no se basarían exclusivamente en acceder mejor a la hemeroteca de la radio (con el subsiguiente aumento de productividad), sino en que se favorecería la reutilización de los propios documentos sonoros, y se optimizaría el negocio de vender contenidos propios a terceros para aumentar la rentabilidad.

Aplicaciones a la realidad aumentada

De hecho, la realidad aumentada también puede ser considerada en sí misma una variante del concepto de enriquecimiento semántico llevada a lo que estamos experimentando, en vivo y en directo, en un momento dado. Las aplicaciones de realidad aumentada, donde a la imagen real que captura un dispositivo se superpone un contenido informativo virtual, pueden verse beneficiadas de este enriquecimiento si de alguna manera se consigue establecer una conexión semántica entre el contenido virtual que se está visualizando y la base de conocimiento que se esté utilizando para cruzar los datos. Las gafas interactivas de Google, en pleno proceso de depuración, serán un claro exponente de la potencia que esta conexión semántica puede llegar a ofrecer.

Más información

Como en otras ocasiones, si te interesa conocer más información sobre este tema no dudes en contactar con nosotros para que te enviemos documentación adicional. Cuenta con Classora Technologies para estar informado sobre enriquecimiento semántico de medios online y de cualquier otra plataforma con textos digitales.

Behavioral analytics: los medios ante el reto de estudiar las interacciones con su audiencia

2014 agosto 12
por classora

Empresas de todo tipo ya lo están utilizando: instituciones financieras están empleando Business Intelligence y Big Data para maximizar la lealtad de sus clientes y mejorar sus niveles de servicio. En el sector de la venta minorista, el análisis conjunto de la información de visitas a tiendas, llamadas a call centers, información de weblogs y transacciones online provee una visión multidimensional de los clientes donde se observan sus compras, preferencias y comportamientos para poder sugerir qué productos incluir en la próxima visita.

Hoy en día para cualquier organización no solo es importante comprender que rentabilidad obtienen por un cliente o por un determinado producto. Es quizás más importante poder predecir el comportamiento de un cliente concreto para poder influenciarlo. Esto se hace desde hace años con Business Intelligence, pero las nuevas técnicas de Big Data permiten que las organizaciones puedan profundizar, potenciar mucho más su información interna, desarrollando el concepto de Behavioral Analytics, mediante el que dejan de analizar transacciones para pasar a analizar interacciones.

Análisis de comportamiento

En un escenario como el actual, en el que la información fluye libremente y hay veces que un hecho noticioso llega a las audiencias antes de que los tradicionales mass media se hagan eco del mismo, los medios de comunicación tradicionales deberían reaccionar para conocer, lo antes posible:

  • ¿Qué información le interesa a cada uno de sus usuarios?
  • ¿Cómo acceden a la información cada uno de sus usuarios?
  • ¿Cuándo acceden a la información cada uno de sus usuarios?
  • ¿Dónde y desde dónde acceden a la información cada uno de sus usuarios?
  • ¿Por qué acceden a la información cada uno de sus usuarios?

Con la implantación del concepto analítico en sus sistemas de información, los medios, podrán maximizar el valor de la información NoSQL, podrán alcanzar el conocimiento sobre el qué, cómo, cuándo, dónde y por qué de sus usuarios digitales.

La automatización del análisis de sentimiento

2014 julio 2
por classora

El objetivo del análisis de los sentimientos es determinar la actitud, la opinión y el estado emocional que tiene una persona al escribir sobre un determinado tema. Si trasladamos este concepto a un punto de vista más amplio, el objetivo no es otro que cuantificar las impresiones y opiniones subjetivas que, ante una determinada marca, empresa o persona, tiene la audiencia de Internet en general y de las redes sociales en particular.

El análisis de sentimientos tiene una amplia aplicación práctica e incluye el trabajo en la clasificación de la subjetividad, la polaridad, la tonalidad o el análisis de la emoción. Pero a la hora de implementar modelos que nos permitan automatizar los procesos de análisis de sentimiento, debemos tener claro cómo vamos tratar los datos, cómo los vamos a extraer, cómo los vamos a revisar, cómo los vamos a etiquetar y cómo los vamos a almacenar.

Análisis de sentimiento

Por tanto, a la hora de realizar un análisis de sentimiento, son dos, principalmente, las líneas de acción que podemos acometer:

  • Cuantificar el sentimiento de la audiencia a través del tiempo.
  • Recuperar ejemplos o resúmenes de confianza a lo largo de esas mismas dimensiones.

Pero a la hora de medir la eficiencia de una solución de análisis de sentimiento, es más complicado que la que cabría esperar, por varias razones:

  • El sentimiento puede ser subjetivo. Sin embargo, distintas investigaciones han demostrado que sólo se da en la menor parte de los casos.
  • Hay diferentes grados de sentimiento. Incluso si varias personas están de acuerdo en una etiqueta cualitativa (por ejemplo muy positivo), no existe una medida cuantitativa de lo que eso realmente significa.
  • La evaluación de sentimiento depende en gran medida del contexto (por ejemplo, proximidad). La sentencia “Me encanta la Coca Cola, pero odio Pepsi” es positiva para Coca-Cola, pero negativa para Pepsi.
  • La confianza también se puede medir en diferentes capilaridades. Por ejemplo, dado el contexto de una consulta o tema, el sentimiento se puede medir en el documento global, en un párrafo, en una oración, en un determinado nivel menor o mediante una combinación de todos ellos.

Al crear un modelo de análisis de sentimiento, el resultado quedará condicionado por el proceso de aprendizaje supervisado (entrenamiento previo) que hagamos del sistema. Vamos a requerir de una experiencia anterior y aplicar algoritmos que nos permitan establecer un modelo matemático generalizado en base a esa experiencia. El modelo resultante podrá, entonces, ser utilizado para hacer predicciones exactas o decisiones en un punto futuro o en diferentes datos (fase de predicción / de puntuación).

La calidad de nuestro modelo dependerá:

  • De que los datos que el modelo tenga para “poder aprender” estén correcta y debidamente etiquetados y puntuados en función de su subjetividad (neutral frente a parcial) y de su polaridad (positiva, negativa o mixta).
  • En la robustez del algoritmo o algoritmos que serán utilizados para derivar el modelo matemático. Hay dos grandes categorías de funciones que podremos utilizar en la concepción de los algoritmos: los derivados del procesamiento del lenguaje natural (NLP) y los derivados del análisis del contexto de los medios donde se publican.

Más información

Como en otras ocasiones, si te interesa conocer más información sobre este tema no dudes en contactar con nosotros para que te enviemos documentación adicional. Cuenta con Classora Technologies para estar informado sobre análisis de sentimiento y para estudiar las alternativas de modernización y rentabilización de medios digitales.

El márketing de contenidos en los medios digitales

2014 junio 2
por classora

El marketing de contenidos es el arte de preparar contenidos valiosos y distribuirlos de forma gratuita con el doble objetivo de atraer a nuevos posibles clientes y de fidelizar a los clientes actuales y tratar de hacerles comprar nuevos servicios/productos.

El marketing de contenidos se enmarca en una estrategia de aportar valor antes de pedir nada a cambio (Givers Get), y de no interrumpir, como lo suelen hacer los anuncios en TV / radio o las tácticas tradicionales de marketing directo.
Márketing de contenidos

El objetivo principal de esta estrategia es conseguir que los lectores de una web o blog se transforman en suscriptores a la lista de correo. Es decir, dejar de tratar con IPs (visitas anónimas) y empezar a tratar con personas (emails).

Por supuesto la idea es seguir aportando valor añadido por email de forma periódica con la idea de consolidar tu relación con estos suscriptores, porque ellos son tus futuros clientes.

Lo que no es el marketing de contenidos

Igual de importante que definir lo que es el marketing de contenidos, es definir lo que NO es el marketing de contenidos.

No nos referimos a técnicas de escritura para publicidad (copywritting). No se trata tampoco de escribir páginas de venta o folletos para tus servicios y/o productos.

La gente busca en Internet soluciones a sus problemas. no quieren que alguien trate de venderles algo a la primera visita (Hard Sell).

La idea es más bien generar confianza, credibilidad y autoridad con tu marketing de contenidos. Una vez que tengas ganada esta batalla, al presentar una oferta para un producto y/o un servicio encontrarás menos resistencia en el proceso de compra.

Se habla de Soft Sell o el arte de presentar tu oferta sin insistir: Esto es lo que hay. Si te interesa, súmate, si no, sigue tu camino.

A nadie le guste que le vendan. Pero si quieres vivir de tus contenidos, tendrás que presentar ofertas.

¿Cuáles son los formatos más comunes?

Existen muchas formas distintas de tratar de sacarle provecho a tus contenidos. Puedes, por ejemplo:

  • Montar un blog
  • Preparar un informe sectorial o un white paper (algún tipo de PDF gratis para descarga)
  • Escribir una newsletter
  • Curso con vídeos tutoriales distribuidos por email mediante un sistema de autoresponders
  • Hacer un webinar, un seminario en internet

Aun así resulta confuso, a veces, el hecho de tener que elaborar una estrategia de marketing de contenidos eficaz para un sector determinado. Esto es especialmente acuciante para el caso de los medios de comunicación digitales, en los que el contenido se supone que es el rey.

Marketing de contenidos y medios digitales

Cada caso es distinto, en el caso de los medios de comunicación digitales, dado que ya publican constantemente blogs, newsletters y otros contenidos semejantes, el marketing de contenidos se basa en detectar temas recurrentes que puedan interesar y satisfacer a la audiencia. Temas que no sean necesariamente de actualidad, pero que la complementen aportando valor e ideas que los lectores están deseando escuchar. La clave está en estudiar a la audiencia y preparar materiales ad-hoc para satisfacer sus necesidades. La gran mayoría de las empresas que sacan provecho del marketing de contenidos suelen tener un ratio de uno a cinco entre contenido gratuito y valioso y contenido de tipo promocional.

Estudiando los DMP: herramientas para analizar audiencias que pueden generar más ingresos a una web sin agregar anuncios

2014 mayo 15
por classora

Tanto a los editores y como a los comercializadores de espacios publicitarios les interesa ser capaces de identificar y clasificar los segmentos de la audiencia que manejan a un nivel significativamente más profundo. Esto les permite comprender mejor a su público, crear RFP eficaces y ampliar el alcance para aumentar la efectividad de las campañas de sus clientes, los anunciantes y marcas.

Asimismo, los editores de soportes de Internet tienen una nueva ventana de oportunidad al poderse convertir en proveedores de data, procedentes de sus audiencias, para las plataformas de otras organizaciones que se dedican a la comercialización de publicidad, tal y como hacen Google, Twitter, Facebook…

Y precisamente, como la mejor recomendación para un webmaster es «no llenar de publicidad sus páginas web» y «no usar más de una red en una página«, siempre está latente la idea de cómo ganar más dinero. Especialmente teniendo en cuenta que incluso los anuncios por links dentro de los mismos artículos bajan el CTR de la red principal. Así que ya no habría forma de ganar un dinero extra, pero afortunadamente llegaron los DMP.

Los DMP (Data Management Platforms) son plataformas que recopilan datos de los usuarios, como su ubicación, qué otras páginas visitan, la hora, el día, lo combinan con el clima… etc. Luego venden esa información a los Ads Servers quienes muestran los anuncios acordes al perfil del usuario que está navegando. Por tanto, los publishers que trabajan con algún DMP ganan dinero sin mostrar banners en su sitio web. Porque el código javascript instalado los único que hace es recopilar información.

Es el mismo sistema que tiene Google Adwords con los anuncios por intereses.

DMP

¿Cómo funciona?

Normalmente se instala javascript en todas las páginas del sitio. Esto es fácil y rápido si trabajamos en base a plantillas, con una sola instalación hacemos todo el trabajo.

Luego los servidores de los DMP recolectan la información y se la traspasan a los servidores de anuncios mostrando anuncios más inteligentes a los usuarios.

¿Cuánto se gana?

Se puede ganar mucho o poco. Depende de si en ese momento hay empresas en campaña que estén pagando por los datos proporcionados. En países como EE.UU, Alemania o Reino Unido ya es un negocio rentable. Para el caso de España y Latinoamérica aún es un negocio nuevo.

Se puede llegar a ganar, por ejemplo, 20€ por cada 100.000 visitantes únicos (por campaña). Si no hay campaña no se gana nada, pero el sistema sigue recopilando datos… y aprendiendo.

¿Interfiere con Adsense u otras redes?

No, este código no muestra nada, funciona en modo asíncrono por lo que no ralentiza las páginas, es como si no estuviera. Y puede ser colocado al final, final de la página. En el mercado hispanoamericano las plataformas DMP más extendidas hasta el momento son CrossPixel y DataXpand.

Conferencia de Classora durante la Reunión de Medio Año de la SIP en Barbados

2014 abril 10
por classora

Classora Technologies ha tenido la oportunidad de participar, en calidad de ponente, en una nueva reunión de la Sociedad Interamericana de Prensa (SIP). La SIP es una asociación de propietarios y altos ejecutivos de periódicos y agencias informativas de América, cuyo objetivo es defender la libertad de prensa y los derechos de los periodistas, así como promover un mayor intercambio de información entre la sociedad. Los miembros de la SIP se reúnen dos veces al año: en la Asamblea General y en la Reunión de Medio Año.

sip-barbados

La última Reunión de Medio Año tuvo lugar del 4 al 7 de abril en Bridgetown, Barbados. En esta ocasión, nuestro compañero Diego Cobelo impartió un seminario acerca de la obsolescencia de las páginas web y la adaptación de los medios digitales a las nuevas formas de acceder a Internet. En Classora Technologies ya habíamos tenido la oportunidad de participar en la anterior Asamblea General de la SIP celebrada en Denver, Colorado. En aquella ocasión, nuestro compañero Iván Gómez habló del impacto del Big Data en los medios de comunicación. En ambas presentaciones Classora Technologies ha tratado de trasladar el expertise tecnológico, el conocimiento del mercado y las últimas tendencias del sector a las compañías de prensa de los diferentes países del continente americano.

Los seminarios de la SIP en Barbados estuvieron impartidos por los siguientes ponentes:

sip-barbados-oradores

Las conferencias, que se realizaron en inglés por cortesía con el país anfitrión, dispusieron de traducción simultánea a español y portugués, y fueron seguidas por decenas de personas en el Salón Needham del Hotel Hilton Barbados Resort, y por cientos de personas en Internet vía streaming. Ante la presencia de la agencia EFE, diversos medios de comunicación de varios países se hicieron eco de nuestro seminario, como El País, La Vanguardia, El Confidencial, La Información o El Diario, por mencionar algunos sólo en España.

La obsolescencia de las webs clásicas a debate

El seminario de Diego mencionó el reciente 25 cumpleaños de la web, propuesta originalmente por Tim Berners-Lee en 1989, para después hablar de otras tendencias tecnológicas relevantes que afectan de manera directa a los medios de comunicación. Es el caso del márketing de contenidos, la publicidad nativa y la publicidad programática:

  • Márketing de contenidos: consiste en crear contenido relevante para clientes o potenciales clientes y distribuirlo mediante los formatos adecuados, con el objetivo de atraerlos hacia nuestra empresa y conectar con ellos.
  • Publicidad nativa: es un término nuevo para un concepto ya antiguo. Consiste en anuncios que se incorporan al medio como parte del contenido (concepto reciclado de los publireportajes). El usuario debe saber que se trata de publicidad.
  • Publicidad programática: es un sistema de compra-venta de publicidad a través de pujas en tiempo real (RTB). Funciona buscando espacios publicitarios que concuerden con las audiencias a las que el anunciante se quiere dirigir.

Finalmente se realizó una presentación y un pequeño debate acerca del futuro de los dispositivos de segunda pantalla (second screen) y las posibilidades, en muchos casos todavía por explotar, de incorporar tecnologías semánticas al consumo de vídeos y TV para aportar valor al usuario.

foto-ponencia-barbados

Más información

Como en otras ocasiones, si te interesa conocer más información sobre este tema no dudes en contactar con nosotros para que te enviemos documentación adicional. Cuenta con Classora Technologies para estar informado sobre márketing de contenidos, publicidad nativa, compra-venta programática de publicidad y para estudiar las alternativas de modernización y rentabilización de medios digitales.

Proyecto de Lenguaje Natural con la Universidad de La Coruña para acceder a Classora Knowledge Base

2014 marzo 30
por classora

Classora Knowledge Base es una base de conocimiento creada por Classora Technologies que agrega e integra la información volcada en diversas fuentes públicas de Internet. La base de conocimiento dispone de un API comercial para enriquecimiento semántico, y de una web abierta en la que es posible consultar de forma libre parte de la información recopilada.

Para la consulta de los datos contenidos en la base de conocimiento es necesario disponer de herramientas que guíen al usuario y faciliten el acceso a toda la información disponible. En este sentido, Classora Technologies ha desarrollado un lenguaje semiformal muy básico, denominado Classora Query Languaje (CQL), que actúa como base para la comprensión de los requisitos del usuario. En la aproximación inicial de CQL, este lenguaje permitía realizar dos tipos de consulta:

Obtener atributos de una unidad de conocimiento:

facturación, microsoft 
fecha de nacimiento, barack obama

Obtener unidades de conocimiento que satisfacen una determinada condición:

edificio*, ubicación = estados unidos, altura < 300 metros

Sin embargo, un lenguaje formal de consulta no resulta intuitivo ni práctico para usuarios inexpertos, acostumbrados a formular la consulta en su propio idioma o apoyándose solo en palabras clave (keywords) debido al efecto Google:

«Edificios construídos en USA antes de 1.930 que midan más de 300 metros de altura»

Colaboración con la Universidad de La Coruña

Para abordar el problema, y debido a la cantidad de recursos necesarios y a la especialización requerida para obtener resultados de calidad, se planteó una colaboración entre Classora y el Grupo de Lengua y Sociedad de la Información (LyS) de la Universidade da Coruña.

Grupo LyS - Universidad de A Coruña

El Grupo LyS está formado por profesores e investigadores de las áreas de Lingüística General y de Ciencias de la Computación e Inteligencia Artificial. En 2012 este grupo fue sometido a una evaluación externa por parte de la Agencia Nacional de Evaluación y Prospectiva (ANEP) en la que obtuvo una calificación cualitativa de A: Excelente, calidad comparable a nivel internacional en su área científica.

Además, un miembro este grupo, Jesús Vilares, involucrado directamente en el proyecto con Classora, forma parte de la junta directiva de la Sociedad Española de Recuperación de Información (SERI). La SERI se encuentra organizando en estos momentos su conferencia anual (Spanish Conference on Information Retrieval) que en esta edición se celebrará precisamente en nuestra ciudad, La Coruña, dentro de unas semanas.

Ask Classora!

Fruto de esta colaboración universidad-empresa se ha desarrollado un prototipo de Interfaz de Lenguaje Natural (ILN) para Classora Knowledge Base al que se ha denominado Ask Classora! El objetivo de este sistema no es otro acceder a la base de conocimiento permitiendo expresar las consultas en español, sirviendo a modo de traductor entre el lenguaje natural y el lenguaje formal subyacente, en este caso CQL.

Esquema general del proceso

Por ejemplo, para encontrar la respuesta a la pregunta ¿Qué ocupación tiene Fernando Alonso?, un usuario puede interactuar con el sistema a través de la interfaz web.

Una vez introducida la consulta, y desde un punto de vista general, ocurre lo siguiente:

  1. La pregunta es enviada desde la interfaz a nuestro sistema traductor, que tratará de interpretarla y traducirla al lenguaje formal de consulta. En caso de no poder completar este proceso de forma automática, el sistema pedirá ayuda al usuario a través de diálogos de desambiguación y clarificación de términos. Los resultados de esta interacción servirán además para el aprendizaje del sistema, lo que permite mejorar paulatinamente los resultados y dotarlo de un mayor grado de autonomía para futuros casos similares.
  2. La base de conocimiento es interrogada empleando esta representación formal de la pregunta original en lenguaje natural.
  3. Antes de mostrar los resultados de la consulta, se añade a estos información extra de posible interés para el usuario: consultas relacionadas y una breve descripción del proceso de interpretación seguido por el traductor.
  4. Finalmente, toda esta información es presentada al usuario a través de la interfaz web.

Pantalla inicial de Ask Classora! aún no publicada

Un prototipo de este sistema ha sido probado en un entorno cerrado con resultados muy prometedores, por lo que esperamos poder lanzar una beta pública próximamente.

Más información

Como en otras ocasiones, si te interesa conocer más información sobre este tema no dudes en contactar con nosotros para que te enviemos documentación adicional. Cuenta con Classora Technologies para estar informado sobre bases de conocimiento y recuperación de información procedente de fuentes públicas a través de NLP.