lunes, 22 de febrero de 2010

MEJORANDO LA INDEXACION DE FLASH

ENTREVISTA A LOS INGENIEROS DE SOFTWARE DE GOOGLE, SOBRE LAS MEJORAS DE GOOGLE CON RESPECTO A ESTE TEMA.

P: ¿Qué archivos Flash indexa Google mejor ahora?
Hemos mejorado nuestra habilidad para indexar texto en archivos SWF de todo tipo. Esto incluye "gadgets" en Flash como botones o menus, páginas web hechas con Flash y todo lo demás.

P: ¿Qué contenido indexa Google mejor de estos archivos Flash?
Todo el texto que los usuarios pueden ver cuando interactúan con tu sitio web en Flash. Si tu sitio web contiene Flash, el texto de los archivos Flash puede utilizarse cuando Google crea las descripciones (snippets) de tu sitio web. Además, las palabras que aparecen en tus archivos Flash se pueden usar para las búsquedas de Google.

Además de encontrar e indexar el contenido de texto en los archivos Flash, descubrimos URL que aparecen en los archivos Flash y las rastreamos, tal y como hacemos con las URL que aparecen en páginas que no son Flash. Por ejemplo, si tu aplicación Flash tiene enlaces a páginas internas de tu sitio web, Google puede ser capaz de encontrar y rastrear mejor tu sitio web.

P: ¿Qué ocurre con contenido no textual, como las imágenes?
Por el momento, sólo estamos buscando e indexando contenido de texto en archivos Flash. Si tus archivos Flash tan solo incluyen imágenes, no leeremos o indexaremos el texto que pueda aparecer en estas imágenes. De la misma forma que no generaremos texto ancla para los botones Flash que tengan alguna URL, pero que no tengan asociado ningún texto.

Además no indexaremos archivos FLV, tales como los videos de Youtube porque esos archivos no contienen elementos de texto.

P: ¿Cómo ve Google el contenido de los archivos Flash?
Hemos desarrollado un algoritmo que explora los archivos Flash de la misma forma que lo haría una persona: haciendo clic en los botones, introduciendo contenido y demás. Nuestro algoritmo recuerda todo el texto que encuentra en el camino y que luego estará disponible para ser indexado. No podemos contarte todos los detalles, pero podemos decirte que la efectividad del algoritmo ha sido mejorada utilizando la nueva librería para búsqueda SWF de Adobe.

P: ¿Qué necesito hacer para que Google indexe el texto de mis archivos Flash?
Pues realmente nada. Las mejoras que hemos realizado no requieren ninguna acción especial por parte de diseñadores web o webmasters. Si tienes contenido Flash en tu página web empezaremos a indexarlo automáticamente con las limitaciones que nuestra tecnología tiene (ver siguiente pregunta).

Así que deberías saber que Google es ahora capaz de ver el texto que se muestra a los visitantes de tu sitio web. Si prefieres que Google ignore la parte menos informativa de tu contenido, como el copyright o el aviso de carga, considera remplazar este texto por una imagen, lo cual lo hará invisible para nosotros.

P: ¿Cuáles son las limitaciones técnicas de Google en la indexación Flash?
Hay tres limitaciones principales por el momento y estamos trabajando para resolverlas:

1. Googlebot no ejecuta algunos tipos de JavaScript. Así que si tu página web carga un archivo Flash vía JavaScript, Google quizás no se de cuenta de ese archivo Flash, en cuyo caso no será indexado.
2. Por el momento no añadimos contenido de fuentes externas que se carguen a través de tus archivos Flash. Si tus archivos Flash cargan un archivo HTML, otro archivo XML, otro SWF, etc. Google indexará esa fuente (o fuentes), pero no será considerado parte del contenido de tu archivo Flash.
3. Mientras que sí somos capaces de indexar Flash en casi todos los lenguajes que hay en la web, tenemos por el momento dificultades con el contenido Flash escrito en lenguajes bidireccionales. Hasta que esto no se arregle, no seremos capaces de indexar contenido en hebreo o en árabe de archivos Flash.

viernes, 19 de febrero de 2010

CMS: ¿qué es? y ¿cómo funciona?

Un sistema de gestión de contenidos (en inglés content management system, abreviado CMS) es un programa que permite crear una estructura de soporte (framework) para la creación y administración de contenidos, principalmente en páginas web, por parte de los participantes.

Consiste en una interfaz que controla una o varias bases de datos donde se aloja el contenido del sitio. El sistema permite manejar de manera independiente el contenido y el diseño. Así, es posible manejar el contenido y darle en cualquier momento un diseño distinto al sitio sin tener que darle formato al contenido de nuevo, además de permitir la fácil y controlada publicación en el sitio a varios editores. Un ejemplo clásico es el de editores que cargan el contenido al sistema y otro de nivel superior (directorio) que permite que estos contenidos sean visibles a todo el público (los aprueba).

DEFINICION

El gestor de contenidos es una aplicación informática usada para crear, editar, gestionar y publicar contenido digital en diversos formatos. El gestor de contenidos genera páginas dinámicas interactuando con el servidor para generar la página web bajo petición del usuario, con el formato predefinido y el contenido extraído de la base de datos del servidor.

Esto permite gestionar, bajo un formato padronizado, la información del servidor, reduciendo el tamaño de las páginas para descarga y reduciendo el coste de gestión del portal con respecto a una página estática, en la que cada cambio de diseño debe ser realizado en todas las páginas, de la misma forma que cada vez que se agrega contenido tiene que maquetarse una nueva página HTML y subirla al servidor.

COMO FUNCIONA

Un sistema de administración de contenido siempre funciona en el servidor web en el que esté alojado el portal. El acceso al gestor se realiza generalmente a través del navegador web, y se puede requerir el uso de FTP para subir contenido.

Cuando un usuario accede a una URL, se ejecuta en el servidor esa llamada, se selecciona el esquema gráfico y se introducen los datos que correspondan de la base de datos. La página se genera dinámicamente para ese usuario, el código HTML final se genera en esa llamada. Normalmente se predefine en el gestor varios formatos de presentación de contenido para darle la flexibilidad a la hora de crear nuevos apartados e informaciones.

TIPOS DE CMS

Los gestores de contenido se pueden segmentar según diferentes criterios:

* Según el lenguaje de programación empleado: Active Server Pages, Java, PHP, ASP.NET, Ruby On Rails, Python
* Según la propiedad del código
o Open Source (código abierto); permite que se desarrolle sobre el código,
o Código propietario; sólo su desarrollador puede desarrollar la aplicación.
* Según el tipo de uso o funcionalidades:
o Plataformas generales
o Sistemas específicos
o Blogs; pensados para páginas personales
o Foros; pensados para compartir opiniones
o Wikis; pensados para el desarrollo colaborativo
o e-learning; plataforma para contenidos de enseñanza on-line
o e-commerce; plataforma de gestión de usuarios, catálogo, compras y pagos
o Publicaciones digitales
o Difusión de contenido multimedia
VENTAJAS

El gestor de contenidos facilita el acceso a la publicación de contenidos a un rango mayor de usuarios. Permite que sin conocimientos de programación ni maquetación cualquier usuario pueda indexar contenido en el portal.

Además permite la gestión dinámica de usuarios y permisos, la colaboración de varios usuarios en el mismo trabajo, la interacción mediante herramientas de comunicación.

Los costes de gestión de la información son mucho menores ya que se elimina un eslabón de la cadena de publicación, el maquetador. La maquetación es hecha al inicio del proceso de implantación del gestor de contenidos.

La actualización, backup y reestructuración del portal son mucho más sencillas al tener todos los datos vitales del portal, los contenidos, en una base de datos estructurada en el servidor.

Fuente: wikipedia.org

jueves, 18 de febrero de 2010

¿que es un DHTML o HTML dinámico?

Una página de HTML Dinámico es cualquier página web en la que los scripts en el lado del cliente cambian el HTML del documento, después de que éste haya cargado completamente, lo cual afecta a la apariencia y las funciones de los objetos de la página. La característica dinámica del DHTML, por tanto, es la forma en que la página interactúa con el usuario cuando la está viendo, siendo la página la misma para todos los usuarios.

En contraste, el término más general "página web dinámica" lo usamos para referirnos a alguna página específica que es generada de manera diferente para cada usuario, en cada recarga de la página o por valores específicos de variables de entorno. Este término no debe ser confundido con DHTML. Estas páginas dinámicas son el resultado bien de la ejecución de un programa en algún tipo de lenguaje de programación en el servidor de la página web (como por ejemplo ASP.NET, PHP o Perl), el cual genera la página antes de enviarla al cliente, o bien de la ejecución en la parte cliente de un código que crea la página completa antes de que el programa cliente (usualmente, un navegador) la visualice.

En una página DHTML, una vez ésta ha sido cargada completamente por el cliente, se ejecuta un código (como por ejemplo en lenguaje JavaScript) que tiene efectos en los valores del lenguaje de definición de la presentación (por ejemplo CSS), logrando así una modificación en la información presentada o el aspecto visual de la página mientras el usuario la está viendo.

Usos
Entre los usos más habituales del DHTML están el hacer menús desplegables, imágenes que cambian al pasar el cursor sobre ellas, objetos en movimiento, botones que permiten desplazar el texto que se está mostrando, textos explicativos que aparecen al situar el cursor sobre ciertas palabras clave, cronómetros, etc.

Otro uso interesante de esta tecnología es la creación de juegos de acción que utilizan el navegador web para funcionar, aunque tradicionalmente este tipo de desarrollos han sido complicados debido a las diferencias en el lenguaje y las características soportadas por los distintos navegadores existentes. Recientemente los navegadores más populares han empezado a soportar estándares comunes, como el DOM, lo cual ha facilitado mucho la creación de este tipo de aplicaciones.

Fuente: Wikipedia.org

Como indexar rápidamente una página web en Google

Normalmente se piensa que para indexar una página al famoso buscador de Google solo se requiere entrar a la dirección: http://www.google.com/addurl para anexar la dirección URL. Sin embargo, esto por sí sólo no es garantía de una pronta indexación, ni tan siquiera que el sitio tendrá un posicionamiento adecuado. Para eso hace falta tomar en cuenta otros pasos o estrategias que resumiremos a continuación.
Lo primero que se debe hacer es analizar si el sitio web que se quiere incluir en el índice de Google es potencialmente indexable por el mismo. Una forma de hacer esto es utilizando la versión online de Lynx Viewer de Linux el cual permitirá saber que información de determinada pagina web puede ser indexable. Algunos de los puntos que impediría a Google indexar determinada página son: una página hecha en una versión vieja de Flash, una página creada a base de frames, y páginas que no tenga un formato HTML o DHTML.
Luego se debe comprobar que todas las páginas de un sitio web están enlazadas de alguna forma con el home y que no existan enlaces rotos o con errores, de esta forma Goolge podrá recorrer cada uno de los enlaces e indexar la página más efectivamente
También es muy importante es seguir el protocolo y las reglas de Google para webmasters, las cuales incluyen no crear contenido duplicado con el propósito de rankear un sitio, no compra enlaces fraudulentos, y no tener enlaces ocultos entre muchas otras. En resumen, no tratar de ganar un mejor ranking utilizando estrategias fraudulentas, ya que siGoogle penaliza la página será muy difícil levantarla luego.
El siguiente paso para indexar una página es tener enlaces hacia nuestro sitio desde otros sitios web que ya estén indexados, y utilizar directorios deGoogle, Yahoo y Vlib para obtener buenos enlaces. Por último, crear un site map para Google ayudara a indexar el sitio web más rápidamente. Para esto hay una herramienta gratuita llamada XML Site Maps.