WO2003042831A1 - Automatic system for inferring data relating to items of information visible on navigation screens which are accessed from communication terminals - Google Patents

Automatic system for inferring data relating to items of information visible on navigation screens which are accessed from communication terminals Download PDF

Info

Publication number
WO2003042831A1
WO2003042831A1 PCT/ES2002/000524 ES0200524W WO03042831A1 WO 2003042831 A1 WO2003042831 A1 WO 2003042831A1 ES 0200524 W ES0200524 W ES 0200524W WO 03042831 A1 WO03042831 A1 WO 03042831A1
Authority
WO
WIPO (PCT)
Prior art keywords
computer
navigation
information
files
computer files
Prior art date
Application number
PCT/ES2002/000524
Other languages
Spanish (es)
French (fr)
Inventor
Daniel Cuende Alonso
Original Assignee
Cuende Asociados, Analistas De Gestion Publicitaria, S.A.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cuende Asociados, Analistas De Gestion Publicitaria, S.A. filed Critical Cuende Asociados, Analistas De Gestion Publicitaria, S.A.
Publication of WO2003042831A1 publication Critical patent/WO2003042831A1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/048Interaction techniques based on graphical user interfaces [GUI]
    • G06F3/0481Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Development Economics (AREA)
  • Strategic Management (AREA)
  • Quality & Reliability (AREA)
  • Computer Hardware Design (AREA)
  • Human Computer Interaction (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Information Transfer Between Computers (AREA)

Abstract

The invention relates to a system that can be used to deduce items of information which are visible to users accessing navigation screens. The inventive system involves the identification of: the files sent; the recipients of said files; and at least one property of said navigation screens. In one version of the invention, the system transforms the content of the log files of files sent into files in which the items of information visible on said navigation screens are logged. More specifically, the system comprises at least: first computer means which are used to identify the computer files sent; second computer means which are used to identify the data associated with the aforementioned sent computer files; third computer means which are used to identify at least one property of the navigation screens; and fourth computer means which are used to infer items of information visible on the navigation screens of each communication terminal.

Description

SISTEMA AUTOMÁTICO DE INFERENCIA DE DATOS RELATIVOS A ELEMENTOS DE INFORMACIÓN QUE ESTÁN VISIBLES EN PANTALLAS DE NAVEGACIÓN ACCEDIDAS DESDE TERMINALES DE COMUNICACIÓN AUTOMATIC DATA INFERENCE SYSTEM RELATING TO INFORMATION ELEMENTS THAT ARE VISIBLE ON NAVIGATION SCREENS ACCESSED FROM COMMUNICATION TERMINALS
Antecedentes de la InvenciónBackground of the Invention
Ante la creciente utilización de Internet y de los "Web Sites" (o sitios Web) como medio de negocio, de información, de conocimiento, de ocio y de entretenimiento, se hace necesaria una herramienta de análisis de dichos "Web Sites".In view of the increasing use of the Internet and of the "Web Sites" (or Web sites) as a means of business, information, knowledge, leisure and entertainment, an analysis tool of these "Web Sites" is necessary.
Los "Servidores Web" (o servidores de páginas Web) registran en ficheros "Log" (o ficheros de registro) todos los accesos de los usuarios de "páginas Web" a los recursos del "Web Site" que se encuentran hospedados en el "Servidor Web" . Para dar repuesta a esta necesidad existen en el mercado muchos programas que analizan los ficheros "Log" generados en el "Servidor Web". Estos programas realizan análisis estadísticos, como por ejemplo las visitas que recibe cada "Archivo Web" del "Web Site" (o archivo de una "página Web") , partiendo de los registros del fichero "Log".The "Web Servers" (or servers of Web pages) record in "Log" files (or log files) all the accesses of the "Web pages" users to the resources of the "Web Site" that are hosted in the " Web server" . To respond to this need, there are many programs on the market that analyze the "Log" files generated on the "Web Server". These programs perform statistical analyzes, such as the visits received by each "Web Archive" of the "Website" (or archive of a "Website"), based on the records of the "Log" file.
Lo que se entiende por "Página Web" en el mundo de Internet, no tiene porque estar constituido por un solo "Archivo Web", sino que puede estar compuesto por varios "Archivos Web" anidados cada uno dentro de un "Marco", que vendría a ser como varias "Páginas Web" dentro de otra. Los "Servidores Web" existentes generan los "Logs" según un formato estándar según lo establece el Consorcio "W3C" ("The World Wide Web Consortium") . En la actualidad, existen muchos programas informáticos, que analizan los ficheros "Logs" generados en los "Servidores Web" de Internet, para contabilizar el número de "Páginas Web" visitadas, el número de "Usuarios Web" (o usuarios que visitan páginas Web) y realizar análisis diversos estadísticos a partir de los datos registrados en los ficheros "Log". Este tipo de información es muy útil, pero tiene carencias debido a que:What is understood by "Web Page" in the Internet world, does not have to be constituted by a single "Web Archive", but can be composed of several "Web Files" nested each within a "Framework", which It would be like several "Web Pages" within another. Existing "Web Servers" generate the "Logs" according to a standard format as established by the Consortium "W3C"("The World Wide Web Consortium"). At present, there are many computer programs, which analyze the "Logs" files generated in the "Web Servers" of the Internet, to count the number of "Web Pages" visited, the number of "Web Users" (or users who visit pages Web) and perform various statistical analyzes based on the data recorded in the "Log" files. This type of information is very useful, but it is lacking because:
- la contabilización de los "Archivos Web", como "Páginas Web" no es correcta, ya que se contabilizan las partes que integran una "Página Web", como si cada una de dichas partes fuera una "Página Web";- the accounting of the "Web Files", such as "Web Pages" is not correct, since the parts that make up a "Web Page" are counted, as if each of these parts were a "Web Page";
- una vez descargado el "Archivo Web", éste puede ser "cacheado" (o almacenado) en la memoria del ordenador del "Usuario Web", no generándose posteriormente nuevos registros en el fichero "Log", en el caso de volver a ser solicitado por dicho "Usuario Web" al no tener que ser éste enviado nuevamente;- Once the "Web File" has been downloaded, it can be "cached" (or stored) in the "Web User" computer memory, and new records are not subsequently generated in the "Log" file, in the case of being again requested by said "Web User" by not having to be sent again;
- los "Enlaces" de navegación de una "Archivo Web", pueden hacer cambiar una o varias partes ("Componentes") de los que integran una "Página Web", permaneciendo visibles el resto de "Componentes"; o también pueden hacer que se abra una nueva ventana de navegación en la que cargar el nuevo "Archivo Web".- the "Links" navigation of a "Web File" can change one or more parts ("Components") of those that make up a "Web Page", remaining the rest of "Components"; or they can also open a new navigation window in which to load the new "Web File".
Todas estas carencias distorsionan la información obtenida por los programas de análisis de ficheros "Logs" respecto a lo que en realidad está viendo el "Usuario Web" en cada momento y también distorsionan el tiempo de lo que se está viendo. Dichas distorsiones se deben a que se trata cada "Archivo Web" como si fuese una "Página Web", lo cual es incorrecto.All these shortcomings distort the information obtained by the "Logs" file analysis programs regarding what the "Web User" is actually seeing at all times and also distort the time of what is being viewed. These distortions are due to the fact that each "Web File" is treated as if it were a "Web Page", which is incorrect.
Si se quiere estudiar lo que un "Usuario Web" ve en cada instante (lo que tiene en el monitor de su ordenador) no basta con realizar un contador de "Archivos Web" descargados en el fichero "Log" del "Servidor Web", como se está haciendo en la actualidad, ya que un tratamiento de estas características produce errores y desviaciones importantes respecto a lo que ocurre realmente en el lado del "Usuario Web", ya que se considera cada "Archivo Web" de forma individual, independiente del resto, como si fuese lo único que se ve en ese momento, no reflejando la realidad al ser simplemente una parte del total de la "Pantalla" la que es actualizada, o al no ser modificada dicha pantalla por aparecer el nuevo componente en una ventana nueva' del navegador, por lo que no se controla realmente lo que ve, ni cuanto tiempo está viéndose.If you want to study what a "Web User" sees at every moment (what you have on your computer monitor) it is not enough to perform a "Web Files" counter downloaded in the "Log" file of the "Web Server", as it is being done at present, since a treatment of these characteristics produces errors and important deviations from what actually occurs on the "Web User" side, since each "Web Archive" is considered individually, independently of the rest, as if it were the only thing seen at that time, not reflecting the reality by simply being a part of the total "Screen" which is updated, or by not modifying said screen by appearing the new component in a new window ' of the browser, so you do not really control what you see, or How long is he watching?
El origen de este problema, en general, es que la función o finalidad inicial de los ficheros "Log" es la de mostrar y registrar el rendimiento y la actividad de la máquina servidora (o "Servidor") del "Web Site". Pero al reutilizarse dichos ficheros "Logs" para analizar directamente la actividad de los "Usuarios Web", se produce una distorsión entre la actividad registrada y la información vista por dichos "Usuarios Web", al partir del supuesto erróneo de que la actividad del "Servidor Web" es igual a la de la información que ven los "Usuarios Web". No obstante, el problema que se ha descrito no ocurre de manera exactamente igual con todos los "Web Sites", ni tampoco ocurre exactamente en todos por igual; lógicamente dependerá de la tecnología y en la forma de programación empleada en cada caso.The origin of this problem, in general, is that the function or initial purpose of the "Log" files is to show and record the performance and activity of the server machine (or "Server") of the "Web Site". But when these "Logs" files are reused to directly analyze the activity of the "Web Users", there is a distortion between the registered activity and the information seen by said "Web Users", based on the wrong assumption that the activity of the "Web Users" Web Server "is the same as the information that" Web Users "see. However, the problem that has been described does not occur in exactly the same way with all "Web Sites", nor does it occur exactly in all of them equally; logically it will depend on the technology and the form of programming used in each case.
Entre los antecedentes a la presente invención, cabría mencionar el documento US-6.182.097, el cual describe un sistema para visualizar información perteneciente al uso de páginas Web. Dicho sistema comprende primeros y segundos sitios Web. El primer sitio Web comprende una pluralidad de ficheros de componentes Web, cada uno de ellos teniendo un nombre en un directorio de sitios Web. El segundo sitio Web comprende una pluralidad de ficheros estadísticos, cada uno conteniendo información acerca de un fichero de componente Web correspondiente o un subdirectorio de ficheros de componentes Web. El sistema además comprende un dispositivo de computación que tiene una pantalla de visualización operable por un usuario y en comunicación los primeros y segundos sitios Web. El dispositivo de computación es operado bajo el control de una aplicación informática de buscador Web que presenta en pantalla los componentes Web de los respectivos sitios Web. Además, el dispositivo de computación tiene capacidad de solicitar y obtener, de cada uno de los sitios Web, datos que corresponden a componentes Web designados por el usuario; , y es eficaz para solicitar datos a cada uno de los sitios Web en respuesta a componentes Web designados por el usuario desde otro sitio Web. También cabría citar los documentos US-5.870.559 y US- 6.237.006, que tratan de programas de análisis visual de sitios Web, implementados como una colección de componentes de aplicaciones que proporcionan una variedad de posibilidades para facilitar el análisis y gestión de sitios Web y de contenidos de sitios Web. Un componente de mapeado escanea un sitio Web de una red y construye un mapa de sitios Web el cual representa gráficamente las localizaciones remotas (o "URL"s) y los enlaces de el sitio Web. Los mapas de sitios Web son generados usando una única plantilla y metodología de presentación que permite al usuario visualizar toda la arquitectura del sitio Web. Se ofrecen varias posibilidades de navegación y de filtrado de "URL"s para facilitar la tarea de identificar y reparar problemas comunes de sitios Web, tales como enlaces a "URL"s inexistentes. Una característica de escaneo de páginas dinámicas posibilita al usuario incluir páginas Web generadas dinámicamente dentro del mapa del sitio Web.Among the background to the present invention, it is worth mentioning document US-6,182,097, which describes a system for displaying information pertaining to the use of Web pages. Said system comprises first and second websites. The first Web site comprises a plurality of Web component files, each having a name in a directory of Web sites. The second Web site comprises a plurality of statistical files, each containing information about a corresponding Web component file or a subdirectory of Web component files. The system also comprises a computing device that has a display screen operable by a user and in communication the first and second Web sites. The computing device is operated under the control of a web browser computer application that displays the web components of the respective websites on the screen. In addition, the computing device has the capacity to request and obtain, from each of the Web sites, data corresponding to Web components designated by the user; , and is effective for requesting data from each of the Web sites in response to Web components designated by the user from another Web site. It is also worth mentioning documents US-5,870,559 and US-6,237,006, which deal with visual website analysis programs, implemented as a collection of application components that provide a variety of possibilities to facilitate the analysis and management of sites Web and Web site content. A mapping component scans a website from a network and builds a map of websites that graphically represents remote locations (or "URLs") and links to the website. Web site maps are generated using a single template and presentation methodology that allows the user to visualize the entire architecture of the Web site. There are several possibilities for browsing and filtering "URLs" to facilitate the task of identifying and repairing common problems of websites, such as links to non-existent "URLs". A dynamic page scanning feature allows the user to include dynamically generated Web pages within the website map.
Objeto de la Invención El objetivo de la invención es el de corregir y ampliarObject of the Invention The object of the invention is to correct and expand
(enriquecer, en definitiva) los ficheros "Logs" para convertirlos en lo que denominaremos ficheros "MetaLogs" que representen la actividad del "Usuario Web", lo que realmente ve dicho "Usuario Web". Debido a que el término intuitivo de "Página Web" es ya utilizado de forma generalizada en el mundo del software de análisis de "Logs" con un significado equívoco, tenemos que definir otro nombre o concepto: el de "Pantalla", que incluya todo lo que realmente aparece en la ventana del navegador como conjunto de "Archivos Web".(enrich, in short) the "Logs" files to convert them into what we will call "MetaLogs" files that represent the activity of the "Web User", what the "Web User" really sees. Because the intuitive term of "Website" is already widely used in the world of "Logs" analysis software with an equivocal meaning, we have to define another name or concept: "Screen", which includes everything that really appears in the browser window as a set of " Web Files ".
El propósito de la invención es el de convertir el fichero "Log" en uno o varios ficheros "MetaLog" que registren lo que verdaderamente visualiza el "Usuario Web" después de cada "Click" de ratón, de tal forma que sean correctos los posteriores resultados de los programas estándar de análisis de "Logs".The purpose of the invention is to convert the "Log" file into one or more "MetaLog" files that record what the "Web User" truly displays after each mouse "Click", so that the subsequent ones are correct results of the standard "Logs" analysis programs.
A partir de este nuevo modelo, se pueden realizar todos los análisis estadísticos pertinentes con mayor rigor y precisión, muchos de ellos, similares a los realizados actualmente por los programas de análisis de "Logs", pero siempre desde una nueva perspectiva más real de lo que realmente ocurre en la navegación de cada "Usuario Web" del "Web Site", y no en la actividad del "Servidor Web". Opcionalmente, partiendo de la información generada con el concepto de "Pantalla" tal y como se definió anteriormente, se pueden obtener análisis estadísticos diferentes y/o adicionales a los obtenidos por los analizadores de "Logs" o de "Minería de Datos". La presente invención presenta multitud de efectos ventajosos:From this new model, all relevant statistical analyzes can be performed with greater rigor and precision, many of them, similar to those currently performed by the "Logs" analysis programs, but always from a new perspective more real than which actually occurs in the navigation of each "Web User" of the "Web Site", and not in the activity of the "Web Server". Optionally, based on the information generated with the "Screen" concept as defined above, different and / or additional statistical analyzes can be obtained from those obtained by "Logs" or "Data Mining" analyzers. The present invention has many advantageous effects:
- permite controlar lo que hacen los "Usuarios Web" en un "Web Site" de Internet, permitiendo por tanto optimizar el diseño y la estructura del "Web Site";- allows you to control what "Web Users" do on an Internet "Web Site", thus allowing you to optimize the design and structure of the "Web Site";
- plantea el nuevo concepto de "Pantalla", más completo que el de meras páginas descargadas como se hace actualmente, permitiendo una valoración de los "Web Sites" más exacta;- raises the new concept of "Screen", more complete than that of mere pages downloaded as it is currently done, allowing a more accurate assessment of the "Web Sites";
- se obtienen también valores correctos de tiempos, de números de sesiones y de números de conexiones de un "Usurario Web"; - es independiente de la plataforma que se utilice como "Servidor Web" (tanto en hardware como en sistema operativo y software de servidor) ;- Correct values of times, session numbers and connection numbers of a "Web User" are also obtained; - it is independent of the platform used as "Web Server" (both hardware and operating system and server software);
- proporciona una información más precisa respecto a la actividad del "Usuario Web" (y no del "Servidor Web" como se hace en la actualidad) ;- provides more precise information regarding the activity of the "Web User" (and not the "Web Server" as it is currently done);
- este proceso sirve para todos los "Web Sites" que presenten su información dentro de un formato codificado- This process is useful for all "Web Sites" that present their information in an encoded format
(como HTML, ASP, XML, PHP, JavaScript,...) y puede ser aplicado a distintos medios: PC, Teléfono WAP, UMTS, PDAs, ... que generen algún tipo de registro de los objetos enviados desde la máquina del servidor;(such as HTML, ASP, XML, PHP, JavaScript, ...) and can be applied to different media: PC, WAP Phone, UMTS, PDAs, ... that generate some type of record of the objects sent from the machine of the server;
- aparece un nuevo tipo de información basado en el concepto de "Pantalla", descrito anteriormente; - no requiere ninguna modificación ni adaptación por parte del "Web Site" (si bien cabe la posibilidad de orientar la programación del "Archivo web") ;- a new type of information appears based on the concept of "Screen", described above; - it does not require any modification or adaptation by the "Web Site" (although it is possible to guide the programming of the "Web Archive");
- optimiza, mejora y maximiza la rentabilidad de las inversiones realizadas en las aplicaciones de análisis de ficheros "Log";- optimizes, improves and maximizes the profitability of the investments made in the applications of analysis of files "Log";
- al contemplar el concepto de "Pantalla" como conjunto de "Archivos Web", permite comprimir la información contenida en los ficheros "Log" actuales con el consiguiente ventaja de ahorro de espacio en disco duro.- by contemplating the concept of "Screen" as a set of "Web Files", it allows compressing the information contained in the current "Log" files with the consequent advantage of saving hard disk space.
Descripción de la Invención La presente invención consiste en un Sistema Automático de Inferencia de Datos relativos a Elementos de Información que están Visibles en Pantallas de Navegación accedidas desde terminales de comunicación al navegar por una red de acceso a ficheros informáticos que contienen dichos elementos de información, donde dicho sistema automático de inferencia comprende, al menos: primeros medios informáticos de identificación de los ficheros informáticos enviados a los terminales de comunicación desde al menos un servidor proveedor de ficheros informáticos, así como segundos medios informáticos de identificación de al menos un dato asociado a los ficheros informáticos enviados, seleccionado entre: terminales de comunicación destinatarios, tiempos de envío y combinaciones de los mismos ; estando el sistema automático de inferencia caracterizado porque adicionalmente comprende : terceros medios informáticos de identificación de al menos una propiedad de las pantallas de navegación, seleccionada entre: propiedades estructurales de cada pantalla de navegación, determinadas a partir de al menos un código relativo a al menos uno de los ficheros informáticos que integran dicha pantalla de navegación, siendo seleccionado dicho fichero entre: primeros ficheros informáticos que contienen páginas de navegación integrantes mínimos de cada pantalla de navegación, escritos en un lenguaje de programación orientado a la navegación que permite incluir referencias a ficheros informáticos presentes en una misma pantalla de navegación, seleccionados entre: segundos ficheros informáticos, terceros ficheros informáticos y combinaciones de los mismos, segundos ficheros informáticos que contienen componentes de navegación integrantes de una ventana de navegación, referenciados desde al menos un fichero informático seleccionado entre: primeros ficheros informáticos, segundos ficheros informáticos y combinaciones de los mismos, estando escritos dichos segundos ficheros informáticos en un lenguaje de programación orientado a la navegación que permite incluir referencias a ficheros informáticos presentes en una misma pantalla de navegación, seleccionados entre: segundos ficheros informáticos, terceros ficheros informáticos y combinaciones de los mismos, terceros ficheros informáticos de objetos adjuntos cuyo contenido no es un lenguaje de programación orientado a la navegación, referenciados desde al menos un fichero informático seleccionado entre: primeros ficheros informáticos, segundos ficheros informáticos y combinaciones de los mismos, y combinaciones de dichos ficheros informáticos; propiedades de formato de cada pantalla de navegación, seleccionadas al menos entre: ubicación, tamaño, solapamiento, temporalidad, tipo de letra, tamaño de letra, color de letra, color de fondo y combinaciones de los mismos, siendo determinadas dichas propiedades de formato a partir de al menos un código relativo a al menos un fichero informático seleccionado entre: primeros ficheros informáticos, segundos ficheros informáticos, terceros ficheros informáticos y combinaciones de los mismos; propiedades de contenido de cada pantalla de navegación, determinadas a partir de al menos un código relativo a al menos un fichero informático seleccionado entre: primeros ficheros informáticos, segundos ficheros informáticos y combinaciones de los mismos; siendo seleccionadas dichas propiedades de contenido entre: enlaces de navegación existentes en dichas pantallas de navegación, mediante los cuales se posibilita un acceso a ficheros informáticos seleccionados entre primeros y segundos ficheros informáticos que, al ser accedidos por el terminal de comunicaciones, son incorporados a al menos una página de navegación seleccionada entre páginas de navegación presentes en el terminal de comunicaciones y páginas de navegación de nueva aparición; texto existente en dichas pantallas de navegación; y combinaciones de dichas propiedades de contenido; y combinaciones de dichas propiedades de las pantallas de navegación; comprendiendo asimismo : cuartos medios informáticos de inferencia de elementos de información visibles en las pantallas de navegación de cada terminal de comunicaciones que, partiendo de identificaciones: de al menos una secuencia de envío de elementos de información contenidos en los ficheros informáticos enviados, identificados mediante los primeros medios informáticos; de al menos un dato asociado a los ficheros informáticos enviados a cada terminal de comunicaciones, identificado mediante los segundos medios informáticos; y de al menos una propiedad de las páginas de navegación, identificada mediante los terceros medios informáticos ; los cuartos medios informáticos transforman dichas secuencias de envío de elementos de información, en conjuntos de elementos de información que son visibles en cada pantalla de navegación cada vez que se produce una modificación en dicha pantalla de navegación, al no coincidir necesariamente los elementos de información enviados en cada instante con los elementos de información que son visibles en dichos instantes, ya que la visibilidad de dichos elementos de información depende adicionalmente de las propiedades de las pantallas de navegación; infiriendo dichos cuartos medios informáticos al menos un dato sobre los elementos de información visibles, seleccionados entre: identificación de los elementos de información visibles, identificación de los ficheros informáticos que contienen dichos elementos de información visibles, y combinaciones de los mismos; y donde al menos uno de dichos elementos de información es seleccionado entre: pantallas de navegación, páginas de navegación, componentes de navegación, objetos adjuntos y combinaciones de los mismos. Los terceros medios informáticos de dicho sistema automático de inferencia, pueden obtener los códigos relativos a ficheros informáticos que determinan las propiedades de las pantallas de navegación, mediante al menos un procedimiento seleccionado entre: análisis del lenguaje de programación orientado a la navegación contenido dichos ficheros informáticos; análisis de al menos un elemento seleccionado entre etiquetas, cabeceras, campos y combinaciones de los mismos, contenidos en dichos ficheros informáticos; análisis del nombre de dichos ficheros informáticos; análisis de los datos asociados a ficheros informáticos identificados por los segundos medios informáticos que, en base a tiempos de envío consecutivos de dichos ficheros informáticos a un mismo terminal de comunicaciones, permiten detectar los elementos de información integrantes de una misma pantalla de navegación; y combinaciones de dichos procedimientos.Description of the Invention The present invention consists of an Automatic Data Inference System relating to Information Elements that are Visible on Navigation Screens accessed from communication terminals when navigating a computer file access network containing said information elements, wherein said automatic inference system comprises, at least: first computer means of identification of the computer files sent to the terminals of communication from at least one server providing computer files, as well as second computer means for identifying at least one data associated with the computer files sent, selected from: target communication terminals, delivery times and combinations thereof; the automatic inference system being characterized in that it additionally comprises: third-party computer means for identifying at least one property of the navigation screens, selected from: structural properties of each navigation screen, determined from at least one code relating to at least one of the computer files that integrate said navigation screen, said file being selected from: first computer files containing minimum integral navigation pages of each navigation screen, written in a navigation-oriented programming language that allows file references to be included computer files present in the same navigation screen, selected from: second computer files, third computer files and combinations thereof, second computer files containing navigation components integral to a navigation window, referral from at least one computer file selected from: first computer files, second computer files and combinations thereof, said second computer files being written in a navigation-oriented programming language that allows file references to be included software present on the same navigation screen, selected from: second computer files, third computer files and combinations thereof, third computer files of attached objects whose content is not a navigation-oriented programming language, referenced from at least one file computer selected from: first computer files, second computer files and combinations thereof, and combinations of said computer files; formatting properties of each navigation screen, selected at least among: location, size, overlapping, temporality, typeface, font size, font color, background color and combinations thereof, said formatting properties being determined to from at least one code relating to at least one computer file selected from: first computer files, second computer files, third computer files and combinations thereof; content properties of each navigation screen, determined from at least one code relating to at least one computer file selected from: first computer files, second computer files and combinations thereof; said content properties being selected among: navigation links existing in said navigation screens, whereby access to selected computer files between first and second computer files is allowed which, when accessed by the communications terminal, are incorporated into the minus a navigation page selected from navigation pages present in the communications terminal and pages of navigation of new appearance; existing text on these navigation screens; and combinations of said content properties; and combinations of said properties of the navigation screens; also comprising: fourth computer means of inference of information elements visible on the navigation screens of each communication terminal which, based on identifications: of at least one sequence of sending information elements contained in the sent computer files, identified by means of first computer media; of at least one data associated with the computer files sent to each communication terminal, identified by the second computer means; and of at least one property of the navigation pages, identified by the third computer means; the fourth computer means transform said sequences of sending information elements, into sets of information elements that are visible on each navigation screen each time there is a modification in said navigation screen, as the information elements sent do not necessarily coincide at every moment with the information elements that are visible in said instants, since the visibility of said information elements depends additionally on the properties of the navigation screens; inferring said fourth computer means at least one data on the visible information elements, selected from: identification of the visible information elements, identification of the computer files containing said visible information elements, and combinations thereof; and where at least one of said information elements is selected from: navigation screens, navigation pages, navigation components, attached objects and combinations thereof. The third computer means of said automatic inference system, can obtain the codes related to computer files that determine the properties of the navigation screens, by at least one procedure selected from: analysis of the programming language oriented to navigation contained in said computer files ; analysis of at least one element selected among labels, headers, fields and combinations thereof, contained in said computer files; analysis of the name of said computer files; analysis of the data associated with computer files identified by the second computer means which, based on consecutive delivery times of said computer files to the same communications terminal, allow the detection of the information elements integral to the same navigation screen; and combinations of said procedures.
Al menos uno de los primeros, segundos, terceros y cuartos medios informáticos del sistema automático de inferencia, pueden operar en al menos un modo de funcionamiento seleccionado entre: modo de funcionamiento en línea, monitorizando en tiempo real información relativa a los ficheros informáticos enviados en cada instante; modo de funcionamiento fuera de línea, recopilando a posteriori información relativa a los ficheros informáticos enviados desde al menos un cuarto fichero informático de registro de ficheros informáticos enviados, habiendo sido obtenida dicha información mediante los primeros y segundos medios informáticos desde al menos una ubicación seleccionada entre: servidores proveedores de ficheros informáticos, terminales de comunicaciones, puntos intermedios de la red de acceso a ficheros informáticos, y combinaciones de dichas ubicaciones; y combinaciones de dichos modos de funcionamiento. El sistema automático de inferencia puede estar dotado, opcionalemnte, de quintos medios informáticos de inferencia de datos de visibilidad relativos a al menos un elemento de información seleccionado entre: pantallas de navegación, páginas de navegación, componentes de navegación, objetos adjuntos y combinaciones de los mismos que, a partir de al menos una identificación de: al menos uno de los ficheros informáticos enviados a cada terminal de comunicaciones, identificados mediante los primeros medios informáticos; al menos un dato asociado a los ficheros informáticos enviados a cada terminal de comunicaciones, identificado mediante los segundos medios informáticos y seleccionado entre, al menos: terminales de comunicación destinatarios, tiempos de envío, tamaño de los ficheros informáticos enviados, órdenes de petición procedentes de terminales de comunicación, tipo de terminales de comunicación, información sobre preferencias de usuarios de terminales de comunicación, peticiones sobre los ficheros informáticos enviados, preguntas a terminales comunicación sobre elementos de información visibles en las pantallas de los teminales de comunicaciones, información de identificación del terminales de comunicación, situación de medios informáticos implicados, situación de ficheros informáticos solicitados y combinaciones de los mismos; al menos una propiedad de las páginas de navegación, identificada mediante los terceros medios informáticos; y de combinaciones de dichas identificaciones; dichos quintos medios informáticos infieren al menos un dato de visibilidad seleccionado entre: tiempo total de permanencia visible del elemento de información, tiempo medio de permanencia visible del elemento de información por sesión de terminal de comunicaciones, grado medio de solapamiento del elemento de información por otro elemento de información, elemento de información visible a primera vista, índice de legibilidad del elemento de información, índice de usabilidad del elemento de información, índice de accesibilidad del elemento de información, índice de interactividad del elemento de información, índice de optimización del elemento de información, índice de efectividad del elemento de información, índice de visionado del elemento de información, índice medio de lectura de un elemento de información asumiendo un tiempo arbitrario por palabra leída, porcentaje visionado de un elemento de información en función de sus propiedades, clasificación de usuarios de terminales de comunicación en función de una graduación de velocidad de media de visionado en combinación con una cobertura e índice de lectura, clasificación de usuarios de terminales de comunicación en función de visitas concurrentes a elemento de información de inicio de conexión, clasificación de perfiles de usuarios de terminales de comunicación según al menos un tipo de comportamiento de navegación seleccionado entre: fiel, de fuga, de abandono, de recuerdo y combinaciones de los mismos, número de usuarios de terminales de comunicación que navegan de forma concurrente, número de usuarios de terminales de comunicación que navegan de forma no concurrente, porcentaje de tamaño de texto legible en un elemento de información en relación a su tamaño total, porcentaje de tamaño de imágenes en un elemento de información en relación a su tamaño total, relación entre tamaño en texto y tamaño en imágenes en un elemento de información, características de terceros ficheros informáticos en función de que dichos terceros ficheros informáticos sean: de texto, de imagen, de sonido, ejecutables, multimedia y combinaciones de los mismos, características de terceros ficheros informáticos en función de que dichos terceros ficheros informáticos sean referenciados desde al menos un fichero informático seleccionado entre: primeros ficheros informáticos, segundos ficheros informáticos y combinaciones de los mismos, situación física de al menos un elemento seleccionado entre: páginas de navegación, componentes de navegación, objetos adjuntos y combinaciones de los mismos, en las pantallas de navegación de los terminales de comunicación, color predominante en un elemento de información, estilo de fuente predominante en un elemento de información, listado de palabras de referencia contenidas en al menos un elemento de información, listado de palabras más redundantes contenidas en al menos un elemento de información, listado de palabras más buscadas contenidas en al menos un elemento de información, densidad de texto en función de un ratio entre número de palabras por párrafo y tiempo de lectura, número de usuarios de terminales de comunicación por tipo de navegación definida en función del grado de solapamiento, porcentaje total de lectura por sesión de terminal de comunicaciones , porcentaje total de lectura por conexión de terminal de comunicaciones , porcentaje total de lectura por usuario de terminal de comunicaciones , porcentaje total de lectura por elemento de información, porcentaje total de visionado por sesión de terminal de comunicaciones , porcentaje total de visionado por conexión de terminal de comunicaciones , porcentaje total de visionado por usuario de terminal de comunicaciones, porcentaje total de visionado por elemento de información, número de usuarios por cobertura, relación entre tiempos de conexión y número máximo de solapamientos, relación entre tiempos de conexión y número medio de solapamientos, elemento de información más leído con visitas recurrentes, elemento de información más leído sin visitas recurrentes, calidad del elemento de información en función de un ratio entre tiempo de visibilidad y tiempo de descarga, ratio de lectura del elemento de información, clasificación del elemento de información en función de su rapidez de descarga, clasificación por tipo de elemento de información que se visita recurrentemente, origen de visitas recurrentes a elementos de información, comparativa de tiempos de visitas recurrentes en relación con el tiempo de primeras visitas a elementos de información, reiteración de cada origen de visitas recurrentes a elementos de información, porcentaje de visitas recurrentes sobre cada elemento de información, ratio entre frecuencia de visitas recurrentes y frecuencia de visitas no recurrentes a elementos de información, clasificación de trayectorias más frecuentes de los usuarios en las conexiones del terminal de comunicación sobre los elementos de información, relación entre elementos de información y las trayectorias que apuntan a dichos elementos de información, clasificación de trayectorias más concurrentes asociadas a una finalización de una conexión del terminal de comunicaciones, clasificación de las trayectorias más concurrentes asociadas a la finalización de una sesión del terminal de comunicaciones, clasificación de las trayectorias más concurrentes asociadas a un comienzo de una sesión del terminal de comunicaciones , tiempo pasivo como comparación de tiempo entre pulsaciones de ratón en una conexión del terminal de comunicaciones y tiempo entre pulsaciones de ratón en una sesión de terminal de comunicaciones, número medio de pulsaciones de ratón por sesión de terminal de comunicaciones, calidad del elemento de información como relación entre tiempos de usabilidad y tiempos de descarga por cada usuario de terminal de comunicaciones, calidad del elemento de información como relación entre tiempos de usabilidad y tamaños de archivos de descarga por cada usuario de terminal de comunicaciones, grado de optimización de lenguaje de programación orientado a navegación, clasificación de día semanal según actividad de conexión de usuarios de terminales de comunicación, clasificación de franja horaria según actividad de conexión de usuarios de terminales de comunicación, clasificación de nivel de actividad de usuarios de terminales de comunicación dependiendo de duración de la conexión y en la franja horaria donde se produce dicha conexión, clasificación de usuarios de terminales de comunicación según referencias geográficas, clasificación según plataformas más utilizadas en las conexiones, informe de errores producidos, informes estadísticos de los elementos de información de un sitio web en relación con otros sitios web de una misma agrupación en una clasificación jerarquizada sectorialmente según contenidos de los elementos de información, palabra relacionada más leída, imagen relacionada más vista, frecuencia de pulsación de ratón por elemento de información, palabras descargadas por sesión de terminal de comunicaciones, palabras descargadas por conexión de terminal de comunicaciones, imágenes descargadas por sesión de terminal de comunicaciones, imágenes descargadas por conexión de terminal de comunicaciones, clasificación de terminales de comunicaciones por tamaño de datos descargados, primer elemento de información visible al comenzar una conexión del terminal de comunicaciones, primer elemento de información visible al comenzar una sesión del terminal de comunicaciones, último elemento de información visible al terminar una conexión del terminal de comunicaciones, último elemento de información visible al terminar una sesión del terminal de comunicaciones, importancia de cada objeto de un elemento de información en función de un porcentaje de pulsaciones de ratón en relación con un total de pulsaciones de ratón, nube de palabras próximas a una pulsación de ratón, elemento de información más visto, y combinaciones de los mismos. Adicionalmente, dicho sistema automático de inferencia también puede incorporar al menos una base de datos relacional donde se realiza al menos una operación seleccionada entre: almacenamiento de propiedades de las pantallas de navegación identificadas por los terceros medios informáticos; almacenamiento de asociaciones entre elementos de información integrantes de una misma pantalla de navegación, seleccionados entre: pantallas de navegación, páginas de navegación, componentes de navegación, objetos adjuntos y combinaciones de los mismos, identificados por los terceros medios informáticos; almacenamiento de al menos un dato identificado por los primeros y segundos medios informáticos; agrupación por terminal de comunicación destinatario, de al menos un dato identificado por los primeros y segundos medios informáticos; almacenamiento de al menos uno de los datos inferidos por los cuartos medios informáticos; almacenamiento de al menos uno de los datos inferidos por los quintos medios informáticos ,- recuperación de datos previamente almacenados; y combinaciones de dichas operaciones . El sistema automático de inferencia también puede incorporar al menos un medio informático adicional seleccionado entre: sextos medios informáticos de registro de datos inferidos que, a partir de la información almacenada en la base de datos relacional, generan quintos ficheros informáticos de registro de datos inferidos, donde dichos datos inferidos son relativos a al menos un tipo de agrupación de elementos de información visibles, seleccionado entre : agrupación por pantallas de navegación, agrupación por componentes de navegación, agrupación por objetos adjuntos, y agrupación por combinaciones de agrupaciones, sin agrupación, donde cada elemento de información es registrado cada vez que se produce una modificación en la pantalla de navegación y sea visible dicho elemento de información; séptimos medios informáticos de análisis estadísticos que, a partir de la información almacenada en la base de datos relacional, generan sextos ficheros informáticos con información estadística sobre datos inferidos por medios informáticos seleccionados entre : terceros medios informáticos, cuartos medios informáticos, quintos medios informáticos, sextos medios informáticos, y combinaciones de los mismos; octavos medios informáticos de interfaz, parametrización y gobierno de al menos un medio informático seleccionado entre: primeros, segundos, terceros, cuartos, quintos, sextos, séptimos medios informáticos y combinaciones de los mismos; y combinaciones de dichos medios informáticos. Como ejemplo de una aplicación práctica del sistema automático de inferencia, la red de acceso a los ficheros informáticos donde opera dicho sistema automático de inferencia es la red de Internet, verificándose al menos una de las siguientes correspondencias: al menos uno de los terminales de comunicaciones es un terminal dotado con acceso a Internet seleccionado entre: ordenadores, teléfonos, agendas electrónicas, televisores y equipos electrónicos; al menos un medio de identificación de los terminales de comunicación destinatarios consiste en una identificación de su dirección IP; al menos uno de los servidores proveedores de ficheros informáticos, es un servidor de páginas Web y de ficheros adjuntos a dichas páginas Web; al menos un medio de identificación de órdenes de petición procedentes de terminales de comunicación, consiste en una identificación de comandos "Get"; al menos un medio de identificación de elementos de información visualizados consiste en una identificación de consultas realizadas; al menos un medio de identificación de estados de medios informáticos implicados consiste en una identificación de recursos "Referer"; al menos un medio de identificación de estados de envío de ficheros informáticos solicitados consiste en una identificación de recursos accedidos; las páginas de navegación contenidas en los primeros ficheros informáticos, son páginas Web; los componentes de navegación contenidos en los segundos ficheros informáticos son con componentes Web integrantes de páginas Web; al menos uno de los terceros ficheros informáticos de objetos adjuntos, es un fichero adjunto a páginas Web seleccionado entre: ficheros de texto, de imagen, de sonido, ejecutables, multimedia y combinaciones de los mismos ; los elementos de información son elementos seleccionados entre páginas Web, componentes Web y ficheros adjuntos a páginas Web; las pantallas de navegación son pantallas de navegación deAt least one of the first, second, third and fourth computer means of the automatic inference system can operate in at least one operating mode selected from: online operating mode, real-time monitoring of information related to computer files sent in every moment; offline mode of operation, collecting subsequent information regarding the computer files sent from at least a fourth computer file for the registration of computer files sent, said information having been obtained by means of the first and second computer means from at least one location selected from: computer file provider servers, computer terminals communications, intermediate points of the computer file access network, and combinations of said locations; and combinations of said modes of operation. The automatic inference system may optionally be provided with fifth computer means of inference of visibility data relating to at least one element of information selected from: navigation screens, navigation pages, navigation components, attached objects and combinations of the same as, from at least one identification of: at least one of the computer files sent to each communications terminal, identified by the first computer means; at least one data associated to the computer files sent to each communications terminal, identified by the second computer means and selected from at least: target communication terminals, delivery times, size of the computer files sent, request orders from communication terminals, type of communication terminals, information about user preferences of communication terminals, requests about the computer files sent, questions to communication terminals about information elements visible on the screens of the communication terminals, identification information of the communication terminals, status of computer media involved, status of requested computer files and combinations thereof; at least one property of the navigation pages, identified by the third computer means; and of combinations of said identifications; said fifth computer means infers at least one visibility data selected from: total time of visible permanence of the information element, average time of visible permanence of the information element per communication terminal session, average degree of overlap of the information element by another information element, information element visible at first sight, readability index of the information element, usability index of the information element, accessibility index of the information element, interactivity index of the information element, optimization index of the information element information, effectiveness index of the information element, viewing index of the information element, average reading index of an information element assuming an arbitrary time per word read, percentage view of an information element according to its properties, classification of usu Aryans of communication terminals based on a graduation of average viewing speed in combination with a coverage and reading index, classification of communication terminal users based on concurrent visits to connection initiation information element, profile classification of terminal users of communication according to at least one type of navigation behavior selected from: faithful, leaking, abandonment, recall and combinations thereof, number of users of communication terminals that browse concurrently, number of users of communication terminals that browse non-concurrently, percentage of readable text size in an information element in relation to its total size, percentage of image size in an information element in relation to its total size, ratio between text size and image size in an information element, characteristics of third computer files depending on whether said third computer files are: text, image, sound, executables, multimedia and combinations thereof, characteristics of third computer files depending on the said third parties computer files are referenced from at least one computer file sele between: first computer files, second computer files and combinations thereof, physical situation of at least one element selected from: navigation pages, navigation components, attached objects and combinations thereof, in the terminal navigation screens of communication, predominant color in an information element, predominant font style in an information element, list of reference words contained in at least one information element, list of more redundant words contained in at least one information element, list of most searched words contained in at least one element of information, text density based on a ratio between number of words per paragraph and reading time, number of users of communication terminals by type of navigation defined according to the degree of overlap, total reading percentage per communication terminal session, total reading percentage per communication terminal connection, total reading percentage per communication terminal user, total reading percentage per information element, total viewing percentage per session of communication terminal, total percentage of viewing by connection of communication terminal, total percentage of viewing by user of communication terminal, total percentage of viewing by information element, number of users by coverage, relationship between connection times and maximum number of overlaps, relationship between time s connection and average number of overlaps, most read information element with recurring visits, most read information element without recurring visits, quality of the information element based on a ratio between visibility time and download time, reading rate of the information element, classification of the information element according to its speed of download, classification by type of information element that is visited repeatedly, origin of recurring visits to information elements, comparison of times of recurring visits in relation to the time of first visits to information elements, reiteration of each origin of recurring visits to information elements, percentage of recurring visits to each information element, ratio between frequency of recurring visits and frequency of non-recurring visits to information elements, classification of users' most frequent paths in the communication terminal connections on the information elements, relationship between information elements and the paths that point to said information elements, classification of the most concurrent paths associated with a termination of a communication terminal connection, classification of the most concurrent paths associated with the termination of a communication terminal session, classification of the most concurrent associated to a start of a communications terminal session, passive time as a comparison of time between mouse clicks on a communication terminal connection and time between mouse presses in a communications terminal session, average number of mouse clicks per communication terminal session, quality of the information element as a relationship between usability times and download times for each communication terminal user, quality of the information element as a relationship between usability times and download file sizes for each communication terminal user, degree of navigation-oriented programming language optimization, weekly day classification according to communication terminal user connection activity, time slot classification according to communication terminal user connection activity, classification level of activity of users of communication terminals depending on the duration of the connection and in the time slot where said connection occurs, classification of users of communication terminals according to geographical references, classification according to platforms most used in connections, error reporting produced, statistical reports of the information elements of a website in relation to other websites of the same grouping in a hierarchical classification according to the content of the information elements, related word more read, related image more visible a, mouse click frequency per information element, words downloaded per communication terminal session, words downloaded per communication terminal connection, images downloaded per communication terminal session, images downloaded per communication terminal connection, classification of communications terminals by size of downloaded data, first visible information element at the beginning of a communication terminal connection, first visible information element at the beginning of a communication terminal session, last visible information element at the end of a communication terminal connection, last visible information element at the end of a communications terminal session, importance of each object of an information element based on a percentage of mouse clicks in relation to a total of mouse clicks, word cloud close to a mouse click, most viewed information element, and combinations thereof. Additionally, said automatic inference system can also incorporate at least one relational database where at least one operation selected is performed between: storing properties of the navigation screens identified by the third computer means; storage of associations between information elements that are part of the same navigation screen, selected from: navigation screens, navigation pages, navigation components, attached objects and combinations thereof, identified by the third computer means; storage of at least one data identified by the first and second computer means; grouping by recipient communication terminal, of at least one data identified by the first and second computer means; storage of at least one of the data inferred by the fourth computer means; storage of at least one of the data inferred by the fifth computer means, - recovery of previously stored data; and combinations of said operations. The automatic inference system may also incorporate at least one additional computer medium selected from: sixth computer means for recording inferred data that, from the information stored in the relational database, generates fifth computer files for recording inferred data, where said inferred data are related to at least one type of grouping of visible information elements, selected from: grouping by navigation screens, grouping by navigation components, grouping by attached objects, and grouping by combinations of clusters, without grouping, where each information element is registered each time there is a modification in the navigation screen and said information element is visible; Seventh computer means of statistical analysis that, from the information stored in the relational database, generate sixth computer files with statistical information on data inferred by computer means selected from: third computer media, fourth computer media, fifth computer media, sixth computer means, and combinations thereof; eighth computer media interface, parameterization and governance of at least one computer medium selected from: first, second, third, fourth, fifth, sixth, seventh computer media and combinations thereof; and combinations of said computer means. As an example of a practical application of the automatic inference system, the access network to the computer files where said automatic inference system operates is the Internet network, at least one of the following correspondences being verified: at least one of the communication terminals It is a terminal equipped with Internet access selected from: computers, telephones, electronic agendas, televisions and electronic equipment; at least one means of identification of the destination communication terminals consists of an identification of their IP address; at least one of the servers providing computer files, is a server of Web pages and files attached to said Web pages; at least one means of identifying request orders from communication terminals, consists of an identification of "Get"commands; at least one means of identifying displayed information elements consists of an identification of queries made; at least one means of identifying states of computer media involved consists of an identification of "Referer"resources; At least one means of identifying the requested file delivery states consists of an identification of accessed resources; the navigation pages contained in the first computer files are Web pages; the navigation components contained in the second computer files are with Web components integrating Web pages; at least one of the third computer files of attached objects, is a file attached to Web pages selected from: text, image, sound, executable, multimedia files and combinations thereof; Information elements are elements selected from Web pages, Web components and files attached to Web pages; navigation screens are navigation screens of
Internet integradas por todos los elementos de información visibles desde un terminal con acceso a Internet; los primeros, segundos, terceros, cuartos, quintos, sextos, séptimos y octavos medios informáticos, son implementados mediante aplicaciones informáticas ejecutabas en al menos un computador; al menos uno de los lenguajes de programación orientados a la navegación es seleccionado entre: HTML, DHTML, XML,Internet integrated by all the information elements visible from a terminal with Internet access; the first, second, third, fourth, fifth, sixth, seventh and eighth computer means, are implemented through computer applications running on at least one computer; At least one of the navigation-oriented programming languages is selected from: HTML, DHTML, XML,
JAVA, JAVASCRIPT, ASP, PHP y FLASH; y al menos uno de los cuartos ficheros informáticos es un archivo "Log" de registro de ficheros informáticos enviados por al menos un servidor de Internet.JAVA, JAVASCRIPT, ASP, PHP and FLASH; and at least one of the fourth computer files is a "Log" file for registering computer files sent by at least one Internet server.
Breve descripción de las FigurasBrief Description of the Figures
Figura 1: representa una "Pantalla" de navegación (PT1) vista por un "Usuario Web". Dicha "Pantalla" (PT1) está integrada por una "Página Web" (PG1) que contiene un "Objeto Adjunto" (PG1-01) y dos Marcos en los que se ubican dos "Componentes Web" (PG1-C1) y (PG1-C2) . El "Componente Web" (PG1-C2) contiene a su vez dos "Objetos Adjuntos" (PG1-C2-01) y (PG1-C2-02) .Figure 1: represents a navigation "Screen" (PT1) seen by a "Web User". Said "Screen" (PT1) is composed of a "Web Page" (PG1) that contains an "Attachment Object" (PG1-01) and two Frames in which two "Web Components" (PG1-C1) and ( PG1-C2). The "Web Component" (PG1-C2) contains two "Attachments" (PG1-C2-01) and (PG1-C2-02).
Figura 2 : representa la nueva "Pantalla" de navegaciónFigure 2: represents the new navigation "Screen"
(PT2) que ve el "Usuario Web" como resultado de haber accedido a uno de los enlaces de navegación del "Componente Web" (PG1-C1) . En dicha "Pantalla" (PT2) permanecen: la "Página Web" (PG1) , el "Objeto Adjunto" (PG1-01) y el "Componente Web" (PG1-C1) de la "Pantalla" anterior; mientras que: el "Componente Web" (PG1-C2) y los "Objetos Adjuntos" (PG1-C2-01) y (PG1-C2-02) han sido reemplazados por: el(PT2) that the "Web User" sees as a result of having accessed one of the "Web Component" navigation links (PG1-C1). In said "Screen" (PT2) remain: the "Page Web "(PG1), the" Attachment Object "(PG1-01) and the" Web Component "(PG1-C1) of the previous" Screen "; while: the" Web Component "(PG1-C2) and the" Attached Objects "(PG1-C2-01) and (PG1-C2-02) have been replaced by: the
"Componente Web" (PG1-C3) y el "Objeto Adjunto" (PG1-C3-01) ."Web Component" (PG1-C3) and the "Attached Object" (PG1-C3-01).
Descripción de una Realización de la Invención Una aplicación informática realiza un análisis inicial del "Web Site" (o "Sitio Web") mediante un software que analiza el lenguaje de programación "HTML" (o cualquier Lenguaje orientado a la navegación "Web" utilizado para mostrar las Pantallas de Navegación como ASP, XML, PHP, JavaScript,...), cuyo objetivo es obtener la "Estructura" de las "Pantallas de Navegación Web" : todos los enlaces a otras "Pantallas de Navegación Web", las posibles relaciones entre las "Páginas Web", incluyendo todas las referencias a Componentes de Navegación (se denominan así a las "Páginas Web" contenidas en Marcos de "Páginas Web") y toda la información que afecte en la corrección de un fichero de registro "Log".Description of an Invention Embodiment A computer application performs an initial analysis of the "Web Site" (or "Website") using software that analyzes the "HTML" programming language (or any "Web" navigation-oriented language used to display the Navigation Screens as ASP, XML, PHP, JavaScript, ...), whose objective is to obtain the "Structure" of the "Web Navigation Screens": all links to other "Web Navigation Screens", the possible relations between the "Web Pages", including all references to Navigation Components (this is called the "Web Pages" contained in "Web Page Frames") and all the information that affects the correction of a log file "Log".
Toda esa información se guarda en una Base de Datos donde su contenido refleja la realidad del "Sitio Web" desde la perspectiva de un posible visionado, es decir, lo que se identifica son todas las "Pantallas de Navegación Web" potencialmente visibles y las "Páginas de Navegación Web", "Componentes de Navegación Web" y "Objetos" adjuntos a dichas Páginas y Componentes . Una segunda aplicación informática se emplea para realizar la reconstrucción de las actividades de los "Usuarios Web" utilizando como base el tratamiento sobre ficheros "Log" y la "Estructura" del "Web Site" almacenada en una Base de Datos . El fichero "Log" (que suele ser un fichero de texto con formato estándar, según lo establecido por el consorcio "W3C") , contiene todo lo que el ordenador envía: cada fichero informático enviado "Páginas de Navegación Web", "Componentes de Navegación Web" y "Objetos" adjuntos a dichas Páginas y Componentes, y conteniendo también a quién lo envía y en qué instante de tiempo. En este proceso, primero se identifican los registros del fichero "Log" de cada "Usuario Web", los ficheros informáticos enviados y los tiempos de descarga y visionado. Después se cruza con la información de la "Estructura", respecto a "Pantallas" y "Componentes" de Navegación "Web" del "Web Site", para poder establecer la correcta vinculación entre lo que realmente se ha visto en cada momento y asociar los ficheros informáticos "Web" enviados con la "Pantalla de Navegación Web" a la que pertenecen. De esta manera se genera un nuevo tipo de información: "Pantalla de Navegación Web Vista", es decir: un registro que guarda cada "Pantalla de Navegación Web" o los Elementos de Información que la integran: "Páginas de Navegación Web", "Componentes de Navegación Web" yAll this information is stored in a Database where its content reflects the reality of the "Website" from the perspective of a possible viewing, that is, what is identified are all the "Web Navigation Screens" potentially visible and " Web Browsing Pages "," Web Browsing Components "and" Objects "attached to those Pages and Components. A second computer application is used to perform the reconstruction of the activities of the "Web Users" using as a basis the treatment on "Log" files and the "Structure" of the "Web Site" stored in a Database. The "Log" file (which is usually a text file with Standard format, as established by the consortium "W3C"), contains everything that the computer sends: each computer file sent "Web Navigation Pages", "Web Navigation Components" and "Objects" attached to these Pages and Components, and also containing who sends it and at what instant of time. In this process, the records of the "Log" file of each "Web User" are first identified, the computer files sent and the download and viewing times. Then it intersects with the information of the "Structure", regarding "Screens" and "Components" of "Web" Navigation of the "Web Site", in order to establish the correct link between what has actually been seen at each moment and associate the "Web" computer files sent with the "Web Navigation Screen" to which they belong. In this way, a new type of information is generated: "Web Navigation Screen Vista", that is: a record that saves each "Web Navigation Screen" or the Information Elements that comprise it: "Web Navigation Pages", " Web Navigation Components "and
"Objetos" adjuntos, que cada "Usuario Web" estaba viendo, (junto con datos adicionales de interés como cuánto tiempo en total, de dónde vino, dónde se fue después, etc) . Los "Navegadores" de Internet disponen de un sistema de optimización denominado "Caché" donde almacenan los ficheros informáticos enviados de modo que, por ejemplo, basta con hacer una sola vez la petición de una fotografía para que se descargue en el ordenador del "Usuario Web", de modo que aunque luego se presente en todas las "Páginas Web", sólo habrá sido descargada una vez.Attached "Objects", which each "Web User" was seeing, (along with additional data of interest such as how much time in total, where it came from, where it went after, etc.). The "Browsers" of the Internet have an optimization system called "Cache" where they store the computer files sent so that, for example, it is enough to make a single request for a photograph to be downloaded to the "User's" computer Web ", so even if it is then presented in all" Web Pages ", it will only have been downloaded once.
Otro aspecto, que se encuentra vacío en el fichero "Log" de registro, se produce cuando un "Enlace" llama a otro "Componente de Navegación"; entonces existen varias posibilidades: puede mostrar una nueva "Página de Navegación Web", puede actualizar cualquiera de los "Marcos" de la misma "Página de Navegación Web" o puede abrir otra "Pantalla de Navegación Web". Justamente, en el fichero "Log" de registro de ficheros enviados, lo único que nos dice es que se envió un nuevo fichero informático, pero ya no se sabe si el "Usuario Web" deja de ver la "Pantalla de Navegación" que tenía antes, o si sólo se actualizó una parte de dicha "Pantalla de Navegación", o si una nueva "Pantalla de Navegación Web" (ventana) ha aparecido. Además, se produce una inconsistencia en los tiempos de visionado registrados en dicho fichero "Log" de registro, como se ve claramente en los casos donde se actualiza parcialmente una "Página Web".Another aspect, which is empty in the "Log" log file, occurs when a "Link" calls another "Navigation Component"; then there are several possibilities: you can display a new "Web Navigation Page", you can update any of the "Frames" of the same "Web Navigation Page" or you can open another "Web Navigation Screen". Precisely, in the "Log" file for sending files sent, the only thing that tells us is that a new computer file was sent, but it is no longer known if the "Web User" stops seeing the "Navigation Screen" it had before, or if only part of said "Navigation Screen" was updated, or if a new "Web Navigation Screen" (window) has appeared. In addition, there is an inconsistency in the viewing times recorded in said "Log" log file, as clearly seen in cases where a "Web Page" is partially updated.
Se hace un seguimiento de cada fichero informático enviado y se contrasta con la Base de Datos donde se han almacenado todas las "Pantallas de Navegación" posibles, incluyendo los Elementos de Información que las integran: "Páginas de Navegación Web", "Componentes de Navegación Web" y "Objetos" adjuntos, así como todas las referencias y enlaces que contiene dichas "Pantallas de Navegación", con el fin de saber qué Elementos de Información se encontraban en la misma, aunque dichos Elementos de Información no hayan sido vueltos a descargar. Una vez localizada la "Pantalla de Navegación", se genera registros en la Base de Datos con al menos, las "Pantallas de Navegación" vistas por un "Usuario Web", junto con otro tipo de información como: tiempo visionado, tiempo descarga, "Enlace" de origen y de salida. Se guarda también información sobre los "Elementos de Información" descargado ("Pantalla de Navegación" visitada) pero se actualizan también el resto de Elementos de Información que estaban en dicha "Pantalla de Navegación". Este proceso se puede hacer de forma previa y almacenar esa información o se puede realizar on-line, en el preciso momento en que es requerido por el Proceso de Reconstrucción de la Actividad del "Uusuario Web"; de esta forma, sólo se analizarían los ficheros informáticos enviados que sean estrictamente necesarios, ahorrando espacio en la Base de Datos, aunque pueda resultar más lento. Este planteamiento es práctico para aquellas "Páginas de Navegación Web" que se generan de modo dinámico y/o que son especificas para cada "Uusuario Web", pudiéndose a dar el caso incluso que todas ellas sean diferentes . La actividad real del "Usuario Web" en su visita al "Web Site" es reconstruida a través de la información contenida en el fichero "Log" de registro, completando las carencias de información del fichero "Log" de registro con la información obtenida de la "Estructura" y contenido que proporciona la Base de Datos debido al proceso anterior, y un posterior tratamiento integrado. Esto de realiza a través de un "Proceso de Reconstrucción de la Actividad del Usuario Web". Dicho proceso se traduce en un software que realiza el estudio del fichero "Log" de registro del "Sitio Web", para transformarlo en un fichero de registro más correcto y completo que denominaremos ficheroEach computer file sent is tracked and contrasted with the Database where all possible "Navigation Screens" have been stored, including the Information Elements that comprise them: "Web Navigation Pages", "Navigation Components Web "and" Objects "attached, as well as all references and links contained in these" Navigation Screens ", in order to know what Information Elements were in it, even if these Information Elements have not been downloaded again . Once the "Navigation Screen" is located, records are generated in the Database with at least the "Navigation Screens" seen by a "Web User", along with other information such as: time viewed, download time, "Link" of origin and output. Information about the downloaded "Information Elements"("NavigationScreen" visited) is also saved, but the rest of the Information Elements that were in said "Navigation Screen" are also updated. This process can be done in advance and store that information or it can be done online, at the precise moment in which it is required by the Process of Reconstruction of the "Web User"Activity; this However, only sent computer files that are strictly necessary would be analyzed, saving space in the Database, although it may be slower. This approach is practical for those "Web Browsing Pages" that are generated dynamically and / or that are specific to each "Web User", and it may be the case that all of them are different. The actual activity of the "Web User" during his visit to the "Web Site" is reconstructed through the information contained in the "Log" log file, completing the lack of information in the "Log" log file with the information obtained from the "Structure" and content provided by the Database due to the previous process, and a subsequent integrated treatment. This is done through a "Web User Activity Reconstruction Process". This process is translated into software that performs the study of the "Log" file of the "Website" record, to transform it into a more correct and complete log file that we will call file
"MetaLog" de registro."MetaLog" registration.
Estos nuevos ficheros de registro: "MetaLogs" son generados a partir de la información acumulada en la Base de Datos por parte de los dos programas mencionados anteriormente (el programa de identificación de la estructura de las "Pantallas Web" y el programa de reconstrución de las pantallas visionadas por cada "Usuario Web") , conservando el formato y los campos del estándar del fichero "Log" de registro (según el Consorcio "W3C") , con el fin de que puedan posteriormente ser analizados sin problemas por los programas comerciales de análisis de ficheros "Log" de registro.These new log files: "MetaLogs" are generated from the information accumulated in the Database by the two programs mentioned above (the program to identify the structure of the "Web Screens" and the reconstruction program of the screens viewed by each "Web User"), preserving the format and fields of the standard "Log" log file (according to the "W3C" Consortium), so that they can later be analyzed without problems by commercial programs of analysis of log files.
Con el fin de usar el potencial de los informes estadísticos de los programas existentes en el mercado, se realiza una transformación del fichero "Log" de registro del "Servidor Web" en distintos tipos de ficheros "MetaLog" que pueden ser:In order to use the potential of statistical reports of existing programs in the market, a transformation of the log file "Log" is performed of the "Web Server" in different types of "MetaLog" files that can be:
Ficheros de registro "MetaLog" con las "Pantallas de Navegación Web" vistas por los "Usuarios Web". - Ficheros de registro "MetaLog" con las "Pantallas de Navegación Web" y los "Componentes de Navegación Web" visitados por los "Usuarios Web"; es decir, los ficheros informáticos "Web" que el usuario ha visitado (los cuales no deben ser confundidos con los ficheros informáticos "Web" descargados) ."MetaLog" log files with the "Web Navigation Screens" seen by the "Web Users". - "MetaLog" log files with the "Web Navigation Screens" and the "Web Navigation Components" visited by the "Web Users"; that is, the "Web" computer files that the user has visited (which should not be confused with the downloaded "Web" computer files).
Ficheros de registro "MetaLog" con todos los Elementos de Información que integran las "Pantallas de Navegación Web": ("Páginas de Navegación Web", "Componentes de Navegación Web" y "Objetos" adjuntos) visitados por el "Usuario Web" al máximo detalle."MetaLog" log files with all the Information Elements that integrate the "Web Navigation Screens": ("Web Navigation Pages", "Web Navigation Components" and "Objects" attached) visited by the "Web User" at maximum detail
Ficheros de registro "Log +" o ficheros de registro "Log Ampliados": dichos ficheros son el resultado de la transformación de ficheros de registro "Log" (que sólo reflejan qué ficheros informáticos han sido enviados al "Usuario Web") , en nuevos ficheros "Log" ampliados con todos los elementos del fichero de registro "Log" original, pero corregido y completado de acuerdo con lo que realmente ve el "Usuario Web" (que como se ha explicado anteriormente no tiene por qué coincidir con los ficheros informáticos enviados a dicho "Usuario Web") . Estos ficheros de registro "Log Ampliados" siguien el mismo formato estándar, pero se registran de nuevo todos los objetos y componentes que está visualizando el "Usuario Web" (aunque no se haya registrado en el fichero "Log", al haberse descargado ya una la primera vez) . Un ejemplo, sería el de una "Pantalla de Navegación Web" con dos "Marcos" en la que sólo uno de dichos Marcos es actualizado, permaneciendo visible el otro Marco. Un fichero de registro "Log" ampliado volvería a registrar de nuevo el Marco que permanece visible, ya que la actualización del primerLog files "Log +" or log files "Log Expanded": these files are the result of the transformation of log files "Log" (which only reflect which computer files have been sent to the "Web User"), in new "Log" files expanded with all the elements of the original "Log" log file, but corrected and completed according to what the "Web User" really sees (which as explained above does not have to match the computer files sent to said "Web User"). These "Extended Log" log files follow the same standard format, but all the objects and components that the "Web User" is displaying are registered again (even if it has not been registered in the "Log" file, after having already downloaded a the first time) . An example would be that of a "Web Navigation Screen" with two "Frames" in which only one of these Frames is updated, the other Framework remaining visible. A log file "Log" extended would re-register the Framework that remains visible, since the first update
Marco no afectaría a la visibilidad del segundo.Marco would not affect the visibility of the second.
Pueden existir otros tipos de informaciones generadas, combinaciones o agrupaciones de estos utilizando estos conceptos. Así como un nuevo formato de fichero de registro "Log", en los que aparezcan nuevos Campos por cada registro, y que se pueden activar a gusto delThere may be other types of information generated, combinations or groupings of these using these concepts. As well as a new log file format "Log", in which new Fields appear for each record, and which can be activated to suit the
"Usuario Aplicación". Para poder interpretar correctamente la información que los analizadores de ficheros de' registro "Log" muestran al "Usuario Aplicación", se construyen tablas de correspondencia entre: "Pantallas de Navegación Web", "Componentes de Navegación Web", "Objetos" adjuntos y datos sobre "Estructura" del "Sitio Web" (desde el punto de vista de "Pantalla de Navegación Web", lo que denominamos como "MetaSite") , así como un manual para la correcta interpretación de los informes de los programas de análisis de ficheros de registro "Log". A continuación se muestra un ejemplo para clarificar la diferencia entre los análisis actuales de los ficheros "Log", y lo que aportan (a partir del concepto de "Pantalla de Navegación Web") tanto el fichero de registro "Log Ampliado", como los ficheros de registro "MetaLog". Las Figuras 1 y 2 muestran dos "Pantallas de Navegación"User Application". In order to correctly interpret the information that the ' Log "log" file analyzers show to the "Application User", correspondence tables are constructed between: "Web Navigation Screens", "Web Navigation Components", "Attached Objects" and data on "Structure" of the "Website" (from the point of view of "Web Navigation Screen", what we call as "MetaSite"), as well as a manual for the correct interpretation of the analysis program reports log files "Log". Below is an example to clarify the difference between the current analyzes of the "Log" files, and what they provide (from the "Web Navigation Screen" concept) both the "Extended Log" log file, as well as the log files "MetaLog". Figures 1 and 2 show two "Navigation Screens
Web" sucesivas, tal y como serían vistas por un "Usuario Web" . El "Usuario Web", ve en primer lugar la "Pantalla de Navegación Web" (PT1) de la Figura 1 y, al pulsar sobre el "Enlace 2" del elemento (PG1-C1) , accede a la "Pantalla de Navegación Web" (PT2) del la Figura 2.Web "successive, as they would be seen by a" Web User. "The" Web User ", first see the" Web Navigation Screen "(PT1) of Figure 1 and, when clicking on" Link 2 " of the element (PG1-C1), access the "Web Navigation Screen" (PT2) of Figure 2.
- En la Figura 1: se aprecia que la "Pantalla de- In Figure 1: it is appreciated that the "Screen of
Navegación Web" (PT1) está integrada por una "Página deWeb Navigation "(PT1) is composed of a" Page of
Navegación Web" (PG1) que contiene un "Objeto Adjunto"Web Navigation "(PG1) containing an" Attachment Object "
(PG1-01) y dos Marcos en los que se ubican dos "Componentes Web" (PG1-C1) y (PG1-C2) . El "Componente de Navegación Web" (PG1-C2) contiene a su vez dos "Objetos" adjuntos (PG1-C2-01) y (PG1-C2-02) .(PG1-01) and two frames in which two "Web Components" (PG1-C1) and (PG1-C2) are located. The "Component of Web Navigation "(PG1-C2) contains two attached" Objects "(PG1-C2-01) and (PG1-C2-02).
- En la Figura 2 : se muestra la nueva "Pantalla de- In Figure 2: the new "Screen of
Navegación Web" de navegación (PT2) que ve el "Usuario Web" como resultado de haber accedido a uno de los enlaces de navegación del "Componente de Navegación Web"Web Navigation "navigation (PT2) that the" Web User "sees as a result of accessing one of the" Web Navigation Component "navigation links
(PG1-C1) . En dicha "Pantalla de Navegación Web" (PT2) se aprecia que han desaparecido (y por lo tanto ya no son visibles) : el "Componente de Navegación Web" (PG1-C2) y los "Objetos" Adjuntos (PG1-C2-01) y (PG1-C2-02) pues han sido reemplazados por: el "Componente de Navegación(PG1-C1). In this "Web Navigation Screen" (PT2) it can be seen that they have disappeared (and therefore are no longer visible): the "Web Navigation Component" (PG1-C2) and the attached "Objects" (PG1-C2- 01) and (PG1-C2-02) as they have been replaced by: the "Navigation Component
Web" (PG1-C3) y el "Objeto" Adjunto (PG1-C3-01) , los cuales son visibles ahora PERO no son los únicos elementos visibles, ya que permanecen visibles de la "Pantalla de Navegación Web" anterior: la "Página deWeb "(PG1-C3) and the attached" Object "(PG1-C3-01), which are now visible BUT they are not the only visible elements, since they remain visible from the" Web Navigation Screen "above: the" Page of
Navegación Web" (PG1) , el "Objeto" Adjunto (PG1-01) y elWeb Navigation "(PG1), the attached" Object "(PG1-01) and the
"Componente de Navegación Web" (PG1-C1) ."Web Navigation Component" (PG1-C1).
El en fichero de registro "Log" tradicional del "ServidorThe traditional "Log" log file of the "Server
Web", se generarían los siguientes registros: (PG1)Web ", the following records would be generated: (PG1)
(PG1-C1)(PG1-C1)
(PG1-C2) (y, al acceder al "Enlace 2") :(PG1-C2) (and, when accessing "Link 2"):
(PG1-C3) (PG1-C3)
(los elementos (PG1) , (PG1-C1) y (PG1-C2) no se vuelven a descargar, ya que residía con anterioridad en la memoria del ordenador del "Usuario Web") .(Elements (PG1), (PG1-C1) and (PG1-C2) are not downloaded again, since it previously resided in the "Web User" computer memory).
Lo que interpretaría un programa de análisis de ficheros de registro "Log", sería que el "Usuario Web" ha visto: 1 vez el elemento (PG1) , 1 vez el elemento (PG1-C1) ,What an "Log" log file analysis program would interpret would be that the "Web User" has seen: 1 time the element (PG1), 1 time the element (PG1-C1),
1 vez el elemento (PG1-C2), y 1 vez el elemento (PG1-C3); obviamente, dicho fichero de registro "Log" no reflejaría la realidad, pues el "Usuario Web" ha visto: 2 veces el elemento (PG1) , 2 veces el elemento (PG1-C1) ,1 time the element (PG1-C2), and 1 time the element (PG1-C3); obviously, said "Log" log file would not reflect reality, as the "Web User" has seen: 2 times the element (PG1), 2 times the element (PG1-C1),
1 vez el elemento (PG1-C2) , y1 time the element (PG1-C2), and
1 vez el elemento (PG1-C3) .1 time the element (PG1-C3).
A partir de este momento, toda la información que ofrecen los programas de análisis de ficheros de registro "Log" estaría desvirtuada, ya que los ficheros "Log" actuales sólo reflejan el último fichero informático que se ha cargado.From this moment on, all the information offered by the "Log" log file analysis programs would be distorted, since the current "Log" files only reflect the last computer file that has been loaded.
Por tanto se estarán desvirtuando los tiempos de visionado de los "Archivos Web", en las cuales podemos encontrarnos contenidos muy importantes para el negocio del "Web Site" como es el "Banner" del "Marco" de arriba.Therefore, the viewing times of the "Web Files" will be distorted, in which we can find very important content for the "Web Site" business, such as the "Banner" of the "Framework" above.
De acuerdo con la presente invención, en el fichero de registro "Log Ampliado", se generarían los siguientes registros :In accordance with the present invention, the following records would be generated in the "Extended Log" log file:
(PG1)(PG1)
(PG1-C1)(PG1-C1)
(PG1-C2) (y, al acceder al "Enlace 2") :(PG1-C2) (and, when accessing "Link 2"):
(PG1) (PG1-C1)(PG1) (PG1-C1)
(PG1-C3) lo cual sí se ajustaría a la realidad.(PG1-C3) which would fit reality.
De acuerdo con la presente invención, en el fichero de registro "MetaLog" de "Pantallas, de Navegación Web", se generarían los siguientes registros:In accordance with the present invention, the following records would be generated in the "MetaLog" log file of "Screens, Web Navigation":
(PT1) (y, al acceder al "Enlace 2") :(PT1) (and, when accessing "Link 2"):
(PT2) , habiéndose almacenado en una tabla de una base de datos que: (PT1) contiene a: (PG1) , (PG1-C1) y (PG1-C2) ;(PT2), having been stored in a table of a database that: (PT1) contains: (PG1), (PG1-C1) and (PG1-C2);
(PT2) contiene a: (PG1) , (PG1-C1) y (PG1-C3) ; lo cual también se ajustaría a la realidad, además de suponer un considerable ahorro de espacio en comparación con los ficheros de registro "Log" tradicionales (dado que no se registran todos los componentes de una "Pantalla de Navegación Web" cada vez que ésta es accedida, sino que dichos componentes son guardados una única vez en la base de datos, mientras que lo que se registra en el fichero de registro "MetaLog") son "Pantallas de Navegación Web" completas .(PT2) contains: (PG1), (PG1-C1) and (PG1-C3); which would also fit reality, in addition to assuming considerable space savings compared to traditional "Log" log files (since not all components of a "Display Screen" are registered Web Browsing "every time it is accessed, but these components are stored only once in the database, while what is recorded in the log file" MetaLog ") are" Web Browsing Screens "complete.
Análogamente, también podrían ser generados otros tipos de ficheros de registro "MetaLog" conteniendo agrupaciones a nivel de "Pantallas de Navegación Web" y los "Componentes de Navegación Web", o incluso conteniendo todos los Elementos de Información que integran las "Pantallas de Navegación Web", ocupando eso sí, un mayor espacio. La presente invención no se reduce a la forma concreta de realización descrita anteriormente, sino que existen otras formas de realización alternativas. Todo proceso que necesite conocer el comportamiento real en el "Web Site", requiere de un análisis del código y contenido de éste para referenciar esa información en su tratamiento, o la inclusión de algún elemento pre-establecido en el código y dicho análisis se puede hacer de forma manual o automática.Similarly, other types of "MetaLog" log files containing "Web Navigation Screens" and "Web Navigation Components" levels, or even containing all the Information Elements that make up the "Navigation Screens" could also be generated. Web ", occupying that yes, more space. The present invention is not reduced to the specific embodiment described above, but there are other alternative embodiments. Any process that needs to know the real behavior in the "Web Site", requires an analysis of the code and its content to reference that information in its treatment, or the inclusion of some pre-established element in the code and such analysis can be Do it manually or automatically.
Un modo de realización de la invención sería factible implicando a los desarrolladores del "Web Site", haciendo que en el nombre de los ficheros informáticos que contienen las "Páginas de Navegación Web" se codificase según el contenido de dichas "Páginas de Navegación Web". De esta forma, no sería necesario la parte del proceso de obtención de la "Estructura". Por ejemplo: los nombres de los ficheros informáticos que contienen las "Páginas de Navegación Web" pueden ser del tipo "1(2,3,4) .htm", indicando que la "Pantalla de Navegación Web" 1 está integrada por 3 "Componentes de Navegación Web" : 2,3 y 4. A su vez el "Componente" "4 (5, 8).htm" indicaría que el 4 está integrada por los componentes 5 y 8. Si se diseña un software que analice estas "etiquetas" a la vez que recuenta los datos estadísticos del fichero de registro "Log", sabría qué "Páginas Web" debe tener en cuenta, cuáles no, qué tiempo de visionado suman, etc. Realmente la parte de análisis que realiza el proceso de obtención de la "Estructura", lo integraría el programador "Web" en los nombres .An embodiment of the invention would be feasible involving the developers of the "Web Site", causing the name of the computer files containing the "Web Navigation Pages" to be encoded according to the content of said "Web Navigation Pages" . In this way, the part of the process of obtaining the "Structure" would not be necessary. For example: the names of the computer files containing the "Web Navigation Pages" can be of the type "1 (2,3,4) .htm", indicating that the "Web Navigation Screen" 1 is integrated by 3 " Web Navigation Components ": 2,3 and 4. In turn, the" Component "" 4 (5, 8) .htm "would indicate that 4 is composed of components 5 and 8. If a software is designed to analyze these "tags" while counting data Statistics of the log file "Log", I would know what "Web Pages" should take into account, which not, what viewing time they add, etc. Actually the part of analysis that performs the process of obtaining the "Structure", would be integrated by the "Web" programmer in the names.
Otro modo de realización de la invención consistiría, en "Objetos" descargados de forma invisible al usuario, neutros pero que expliquen que información descarga y generando un registro en el fichero de registro "Log". Procesando esos registros específicos en el fichero de registro "Log" que hacen referencia puede obtenerse este tipo de información. De nuevo, en este caso, es necesario codificar o incluir "Objetos" en las páginas para que dejen una traza en el registro y sean luego contabilizados en el fichero de registro "Log" o en un servidor dedicado a ello.Another embodiment of the invention would consist of "Objects" downloaded invisibly to the user, neutral but explaining what information is downloading and generating a record in the "Log" log file. By processing those specific records in the log file "Log" that refer to this type of information can be obtained. Again, in this case, it is necessary to encode or include "Objects" in the pages so that they leave a trace in the registry and then be counted in the "Log" log file or on a dedicated server.
Otra alternativa puede ser realizar aproximaciones en el análisis del fichero "Log", en base a suposiciones, por ejemplo, la descarga de 3 "Páginas Web" de forma seguida e inmediata significaría que pueden ser "Componentes" de la misma página. También podría utilizarse el análisis del campo "Referer" del fichero "Log" para establecer vinculaciones. Otra realización posible de la presente invención, consistiría en que el propio software del "Servidor Web" incorporen la funcionalidad de análisis de la estructura y de reconstrucción de los elementos de información visualizados por cada "Usuario Web", ya que dichos "Servidores Web" tienen el hospedaje del "WebAnother alternative may be to make approximations in the analysis of the "Log" file, based on assumptions, for example, downloading 3 "Web Pages" immediately and immediately would mean that they can be "Components" of the same page. The analysis of the "Referer" field of the "Log" file could also be used to establish links. Another possible embodiment of the present invention would be that the "Web Server" software itself incorporates the structure analysis and reconstruction functionality of the information elements displayed by each "Web User", since said "Web Servers" they have the web hosting
Site", y son los propios generadores de ficheros de registro "Log" . Mediante un proceso similar a la invención, podrían generarse ficheros "MetaLog" y ficheros "Log Ampliados" en tiempo real. Por último, cabe señalar que los beneficios de la presente invención son múltiples y no se reducen al producto "final" (consistente en la reconstrucción de los elementos de información visualizados por los usuarios durante la navegación) , ni tampoco a informes estadísticos sobre dicha reconstrucción de elementos de información visualizados, sino que se puede extender al empleo de productos "semi-elaborados" como la identificación de las propiedades de las pantallas de navegación (estructurales, de formato, de contenido,...), que permitirían realizar análisis estadísticos sobre la efectividad consguida por medio de dichas propiedades en función de multitud de parámetros como número de conexiones obtenidas, tiempos de conexión, ... Site ", and they are the generators of" Log "log files themselves. Through a process similar to the invention," MetaLog "files and" Extended Log "files could be generated in real time. Finally, it should be noted that the benefits of the present invention are multiple and are not reduced to the "final" product (consisting of the reconstruction of the information elements displayed by users during navigation), nor to statistical reports on said reconstruction. of visualized information elements, but can be extended to the use of "semi-elaborated" products such as the identification of the properties of navigation screens (structural, format, content, ...), which would allow statistical analysis on the effectiveness achieved by means of said properties based on a multitude of parameters such as number of connections obtained, connection times, ...

Claims

REIVINDICACIONES
1. SISTEMA AUTOMÁTICO DE INFERENCIA DE DATOS RELATIVOS A ELEMENTOS DE INFORMACIÓN QUE ESTÁN VISIBLES EN PANTALLAS DE NAVEGACIÓN' ACCEDIDAS DESDE TERMINALES DE COMUNICACIÓN al navegar por una red de acceso a ficheros informáticos que contienen dichos elementos de información, donde dicho sistema automático de inferencia comprende, al menos: primeros medios informáticos de identificación de los ficheros informáticos enviados a los terminales de comunicación desde al menos un servidor proveedor de ficheros informáticos, así como segundos medios informáticos de identificación de al menos un dato asociado a los ficheros informáticos enviados, seleccionado entre: terminales de comunicación destinatarios, tiempos de envío y combinaciones de los mismos; estando el sistema automático de inferencia caracterizado porque adicionalmente comprende : terceros medios informáticos de identificación de al menos una propiedad de las pantallas de navegación, seleccionada entre: propiedades estructurales de cada pantalla de navegación, determinadas a partir de al menos un código relativo a al menos uno de los ficheros informáticos que integran dicha pantalla de navegación, siendo seleccionado dicho fichero entre: primeros ficheros informáticos que contienen páginas de navegación integrantes mínimos de cada pantalla de navegación, escritos en un lenguaje de programación orientado a la navegación que permite incluir referencias a ficheros informáticos presentes en una misma pantalla de navegación, seleccionados entre: segundos ficheros informáticos, terceros ficheros informáticos y combinaciones de los mismos, segundos ficheros informáticos que contienen componentes de navegación integrantes de una ventana de navegación, referenciados desde al menos un fichero informático seleccionado entre: primeros ficheros informáticos, segundos ficheros informáticos y combinaciones de los mismos, estando escritos dichos segundos ficheros informáticos en un lenguaje de programación orientado a la navegación que permite incluir referencias a ficheros informáticos presentes en una misma pantalla de navegación, seleccionados entre: segundos ficheros informáticos, terceros ficheros informáticos y combinaciones de los mismos, terceros ficheros informáticos de objetos adjuntos cuyo contenido no es un lenguaje de programación orientado a la navegación, referenciados desde al menos un fichero informático seleccionado entre: primeros ficheros informáticos, segundos ficheros informáticos y combinaciones de los mismos, y combinaciones de dichos ficheros informáticos; propiedades de formato de cada pantalla de navegación, seleccionadas al menos entre: ubicación, tamaño, solapamiento, temporalidad, tipo de letra, tamaño de letra, color de letra, color de fondo y combinaciones de los mismos, siendo determinadas dichas propiedades de formato a partir de al menos un código relativo a al menos un fichero informático seleccionado entre: primeros ficheros informáticos, segundos ficheros informáticos, terceros ficheros informáticos y combinaciones de los mismos; propiedades de contenido de cada pantalla de navegación, determinadas a partir de al menos un código relativo a al menos un fichero informático seleccionado entre: primeros ficheros informáticos, segundos ficheros informáticos y combinaciones de los mismos; siendo seleccionadas dichas propiedades de contenido entre: enlaces de navegación existentes en dichas pantallas de navegación, mediante los cuales se posibilita un acceso a ficheros informáticos seleccionados entre primeros y segundos ficheros informáticos que, al ser accedidos por el terminal de comunicaciones, son incorporados a al menos una página de navegación seleccionada entre páginas de navegación presentes en el terminal de comunicaciones y páginas de navegación de nueva aparición; texto existente en dichas pantallas de navegación; y combinaciones de dichas propiedades de contenido; y combinaciones de dichas propiedades de las pantallas de navegación; comprendiendo asimismo: cuartos medios informáticos de inferencia de elementos de información visibles en las pantallas de navegación de cada terminal de comunicaciones que, partiendo de identificaciones : de al menos una secuencia de envío de elementos de información contenidos en los ficheros informáticos enviados, identificados mediante los primeros medios informáticos; de al menos un dato asociado a los ficheros informáticos enviados a cada terminal de comunicaciones, identificado mediante los segundos medios informáticos; y de al menos una propiedad de las páginas de navegación, identificada mediante los terceros medios informáticos ; los cuartos medios informáticos transforman dichas secuencias de envío de elementos de información, en conjuntos de elementos de información que son visibles en cada pantalla de navegación cada vez que se produce una modificación en dicha pantalla de navegación, al no coincidir necesariamente los elementos de información enviados en cada instante con los elementos de información que son visibles en dichos instantes, ya que la visibilidad de dichos elementos de información depende adicionalmente de las propiedades de las pantallas de navegación; infiriendo dichos cuartos medios informáticos al menos un dato sobre los elementos de información visibles, seleccionados entre: identificación de los elementos de información visibles, identificación de los ficheros informáticos que contienen dichos elementos de información visibles, y combinaciones de los mismos; y donde al menos uno de dichos elementos de información es seleccionado entre: pantallas de navegación, páginas de navegación, componentes de navegación, objetos adjuntos y combinaciones de los mismos.1. AUTOMATIC DATA INFERENCE SYSTEM RELATING TO INFORMATION ELEMENTS THAT ARE VISIBLE ON NAVIGATION SCREENS ' ACCESSED FROM COMMUNICATION TERMINALS when navigating through a network of access to computer files containing said information elements, where said automatic inference system comprises at least: first computer means of identification of the computer files sent to the communication terminals from at least one server providing computer files, as well as second computer means of identification of at least one data associated with the computer files sent, selected from : recipient communication terminals, shipping times and combinations thereof; the automatic inference system being characterized in that it additionally comprises: third-party computer means for identifying at least one property of the navigation screens, selected from: structural properties of each navigation screen, determined from at least one code relating to at least one of the computer files that integrate said navigation screen, said file being selected from: first computer files containing minimum integral navigation pages of each navigation screen, written in a navigation-oriented programming language that allows file references to be included informatics present in the same navigation screen, selected from: second computer files, third computer files and combinations thereof, second computer files containing navigation components integral to a navigation window, referenced from at least one computer file selected from: first computer files, second computer files and combinations thereof, said second computer files being written in an oriented programming language to the navigation that allows to include references to computer files present in the same navigation screen, selected from: second computer files, third computer files and combinations thereof, third computer files of attached objects whose content is not a programming language oriented to navigation, referenced from at least one computer file selected from: first computer files, second computer files and combinations thereof, and combinations of said computer files; formatting properties of each navigation screen, selected at least among: location, size, overlapping, temporality, typeface, font size, font color, background color and combinations thereof, said formatting properties being determined to from at least one code relating to at least one computer file selected from: first computer files, second computer files, third computer files and combinations thereof; content properties of each navigation screen, determined from at least one code relating to at least one computer file selected from: first computer files, second computer files and combinations thereof; being selected said properties of content between: navigation links existing in said navigation screens, whereby access to selected computer files between first and second computer files is allowed, which, when accessed by the communications terminal, are incorporated into at least a navigation page selected from navigation pages present in the communications terminal and newly appeared navigation pages; existing text on these navigation screens; and combinations of said content properties; and combinations of said properties of the navigation screens; also comprising: fourth computer means of inference of information elements visible on the navigation screens of each communication terminal which, based on identifications: of at least one sequence of sending information elements contained in the sent computer files, identified by means of first computer media; of at least one data associated with the computer files sent to each communication terminal, identified by the second computer means; and of at least one property of the navigation pages, identified by the third computer means; the fourth computer means transform said sequences of sending information elements, into sets of information elements that are visible on each navigation screen each time there is a modification in said navigation screen, by not the information elements sent at each moment necessarily coincide with the information elements that are visible in said instants, since the visibility of said information elements depends additionally on the properties of the navigation screens; inferring said fourth computer means at least one data on the visible information elements, selected from: identification of the visible information elements, identification of the computer files containing said visible information elements, and combinations thereof; and where at least one of said information elements is selected from: navigation screens, navigation pages, navigation components, attached objects and combinations thereof.
2. SISTEMA AUTOMÁTICO DE INFERENCIA DE DATOS RELATIVOS A2. AUTOMATIC DATA INFERENCE SYSTEM RELATING TO
ELEMENTOS DE INFORMACIÓN QUE ESTÁN VISIBLES EN PANTALLAS DE NAVEGACIÓN ACCEDIDAS DESDE TERMINALES DE COMUNICACIÓN, según la reivindicación 1, caracterizado porque los terceros medios informáticos del sistema automático de inferencia, obtienen los códigos relativos a ficheros informáticos que determinan las propiedades de las pantallas de navegación, mediante al menos un procedimiento seleccionado entre: análisis del lenguaje de programación orientado a la navegación contenido dichos ficheros informáticos; análisis de al menos un elemento seleccionado entre etiquetas, cabeceras, campos y combinaciones de los mismos, contenidos en dichos ficheros informáticos; análisis del nombre de dichos ficheros informáticos; análisis de los datos asociados a ficheros informáticos identificados por los segundos medios informáticos que, en base a tiempos de envío consecutivos de dichos ficheros informáticos a una misma sesión de un terminal de comunicaciones, permiten detectar los elementos de información integrantes de una misma pantalla de navegación; y combinaciones de dichos procedimientos.INFORMATION ELEMENTS THAT ARE VISIBLE ON NAVIGATION SCREENS ACCESSED FROM COMMUNICATION TERMINALS, according to claim 1, characterized in that the third computer means of the automatic inference system, obtain the codes relating to computer files that determine the properties of the navigation screens, by at least one procedure selected from: analysis of the programming language oriented to the navigation of said computer files; analysis of at least one element selected among labels, headers, fields and combinations thereof, contained in said computer files; analysis of the name of said computer files; analysis of the data associated to computer files identified by the second computer means that, based on consecutive delivery times of said computer files to the same session of a communications terminal, allow to detect the information elements that are part of the same navigation screen; and combinations of said procedures.
3. SISTEMA AUTOMÁTICO DE INFERENCIA DE DATOS RELATIVOS A ELEMENTOS DE INFORMACIÓN QUE ESTÁN VISIBLES EN PANTALLAS DE NAVEGACIÓN ACCEDIDAS DESDE TERMINALES DE COMUNICACIÓN, según cualquiera de las reivindicaciones anteriores, caracterizado porque al menos uno de los primeros, segundos, terceros y cuartos medios informáticos del sistema automático de inferencia, operan en al menos un modo de funcionamiento seleccionado entre: modo de funcionamiento en línea, monitorizando en tiempo real información relativa a los ficheros informáticos enviados en cada instante; modo de funcionamiento fuera de línea, recopilando a posteriori información relativa a los ficheros informáticos enviados desde al menos un cuarto fichero informático de registro de ficheros informáticos enviados, habiendo sido obtenida dicha información mediante los primeros y segundos medios informáticos desde al menos una ubicación seleccionada entre: servidores proveedores de ficheros informáticos, terminales de comunicaciones, puntos intermedios de la red de acceso a ficheros informáticos, y combinaciones de dichas ubicaciones; y combinaciones de dichos modos de funcionamiento.3. AUTOMATIC DATA INFERENCE SYSTEM RELATING TO INFORMATION ELEMENTS THAT ARE VISIBLE ON NAVIGATION SCREENS ACCESSED FROM COMMUNICATION TERMINALS, according to any of the preceding claims, characterized in that at least one of the first, second, third and fourth computer means of the automatic inference system, they operate in at least one mode of operation selected from: online mode of operation, monitoring in real time information related to computer files sent at any time; off-line mode of operation, subsequently collecting information related to the computer files sent from at least a fourth computer file for the registration of computer files sent, said information having been obtained through the first and second computer means from at least one location selected from : computer file provider servers, communications terminals, intermediate points of the computer file access network, and combinations of said locations; and combinations of said modes of operation.
4. SISTEMA AUTOMÁTICO DE INFERENCIA DE DATOS RELATIVOS A ELEMENTOS DE INFORMACIÓN QUE ESTÁN VISIBLES EN PANTALLAS4. AUTOMATIC DATA INFERENCE SYSTEM RELATING TO INFORMATION ELEMENTS THAT ARE VISIBLE ON SCREENS
DE NAVEGACIÓN ACCEDIDAS DESDE TERMINALES DE COMUNICACIÓN, según la reivindicación 1, caracterizado porque dicho sistema automático de inferencia, comprende adicionalmente quintos medios informáticos de inferencia de datos de visibilidad relativos a al menos un elemento de información seleccionado entre: pantallas de navegación, páginas de navegación, componentes de navegación, objetos adjuntos y combinaciones de los mismos que, a partir de al menos una identificación de: al menos uno de los ficheros informáticos enviados a cada terminal de comunicaciones, identificados mediante los primeros medios informáticos; al menos un dato asociado a los ficheros informáticos enviados a cada terminal de comunicaciones, identificado mediante los segundos medios informáticos y seleccionado entre, al menos: terminales de comunicación destinatarios, tiempos de envío, tamaño de los ficheros informáticos enviados, órdenes de petición procedentes de terminales de comunicación, tipo de terminales de comunicación, información sobre preferencias de usuarios de terminales de comunicación, peticiones sobre los ficheros informáticos enviados, preguntas a terminales comunicación sobre elementos de información visibles en las pantallas de los te inales de comunicaciones, información de identificación del terminales de comunicación, situación de medios informáticos implicados, situación de ficheros informáticos solicitados y combinaciones de los mismos; al menos una propiedad de las páginas de navegación, identificada mediante los terceros medios informáticos; y de combinaciones de dichas identificaciones; dichos quintos medios informáticos infieren al menos un dato de visibilidad seleccionado entre: tiempo total de permanencia visible del elemento de información, tiempo medio de permanencia visible del elemento de información por sesión de terminal de comunicaciones, grado medio de solapamiento del elemento de información por otro elemento de información, elemento de información visible a primera vista, índice de legibilidad del elemento de información, índice de usabilidad del elemento de información, índice de accesibilidad del elemento de información, índice de interactividad del elemento de información, índice de optimización del elemento de información, índice de efectividad del elemento de información, índice de visionado del elemento de información, índice medio de lectura de un elemento de información asumiendo un tiempo arbitrario por palabra leída, porcentaje visionado de un elemento de información en función de sus propiedades, clasificación de usuarios de terminales de comunicación en función de una graduación de velocidad de media de visionado en combinación con una cobertura e índice de lectura, clasificación de usuarios de terminales de comunicación en función de visitas concurrentes a elemento de información de inicio de conexión, clasificación de perfiles de usuarios de terminales de comunicación según al menos un tipo de comportamiento de navegación seleccionado entre: fiel, de fuga, de abandono, de recuerdo y combinaciones de los mismos, número de usuarios de terminales de comunicación que navegan de forma concurrente, número de usuarios de terminales de comunicación que navegan de forma no concurrente, porcentaje de tamaño de texto legible en un elemento de información en relación a su tamaño total, porcentaje de tamaño de imágenes en un elemento de información en relación a su tamaño total, relación entre tamaño en texto y tamaño en imágenes en un elemento de información, características de terceros ficheros informáticos en función de que dichos terceros ficheros informáticos sean: de texto, de imagen, de sonido, ejecutables, multimedia y combinaciones de los mismos, características de terceros ficheros informáticos en función de que dichos terceros ficheros informáticos sean referenciados desde al menos un fichero informático seleccionado entre: primeros ficheros informáticos, segundos ficheros informáticos y combinaciones de los mismos, situación física de al menos un elemento seleccionado entre: páginas de navegación, componentes de navegación, objetos adjuntos y combinaciones de los mismos, en las pantallas de navegación de los terminales de comunicación, color predominante en un elemento de información, estilo de fuente predominante en un elemento de información, listado de palabras de referencia contenidas en al menos un elemento de información, listado de palabras más redundantes contenidas en al menos un elemento de información, listado de palabras más buscadas contenidas en al menos un elemento de información, densidad de texto en función de un ratio entre número de palabras por párrafo y tiempo de lectura, número de usuarios de terminales de comunicación por tipo de navegación definida en función del grado de solapamiento, porcentaje total de lectura por sesión de terminal de comunicaciones, porcentaje total de lectura por conexión de terminal de comunicaciones, porcentaje total de lectura por usuario de terminal de comunicaciones, porcentaje total de lectura por elemento de información, porcentaje total de visionado por sesión de terminal de comunicaciones, porcentaje total de visionado por conexión de terminal de comunicaciones , porcentaje total de visionado por usuario de terminal de comunicaciones , porcentaje total de visionado por elemento de información, número de usuarios por cobertura, relación entre tiempos de conexión y número máximo de solapamientos, relación entre tiempos de conexión y número medio de solapamientos, elemento de información más leído con visitas recurrentes, elemento de información más leído sin visitas recurrentes, calidad del elemento de información en función de un ratio entre tiempo de visibilidad y tiempo de descarga, ratio de lectura del elemento de información, clasificación del elemento de información en función de su rapidez de descarga, clasificación por tipo de elemento de información que se visita recurrentemente, origen de visitas recurrentes a elementos de información, comparativa de tiempos de visitas recurrentes en relación con el tiempo de primeras visitas a elementos de información, reiteración de cada origen de visitas recurrentes a elementos de información, porcentaje de visitas recurrentes sobre cada elemento de información, ratio entre frecuencia de visitas recurrentes y frecuencia de visitas no recurrentes a elementos de información, clasificación de trayectorias más frecuentes de los usuarios en las conexiones del terminal de comunicación sobre los elementos de información, relación entre elementos de información y las trayectorias que apuntan a dichos elementos de información, clasificación de trayectorias más concurrentes asociadas a una finalización de una conexión del terminal de comunicaciones, clasificación de las trayectorias más concurrentes asociadas a la finalización de una sesión del terminal de comunicaciones, clasificación de las trayectorias más concurrentes asociadas a un comienzo de una sesión del terminal de comunicaciones, tiempo pasivo como comparación de tiempo entre pulsaciones de ratón en una conexión del terminal de comunicaciones y tiempo entre pulsaciones de ratón en una sesión de terminal de comunicaciones, número medio de pulsaciones de ratón por sesión de terminal de comunicaciones, calidad del elemento de información como relación entre tiempos de usabilidad y tiempos de descarga por cada usuario de terminal de comunicaciones, calidad del elemento de información como relación entre tiempos de usabilidad y tamaños de archivos de descarga por cada usuario de terminal de comunicaciones, grado de optimización de lenguaje de programación orientado a navegación, clasificación de día semanal según actividad de conexión de usuarios de terminales de comunicación, clasificación de franja horaria según actividad de conexión de usuarios de terminales de comunicación, clasificación de nivel de actividad de usuarios de terminales de comunicación dependiendo de duración de la conexión y en la franja horaria donde se produce dicha conexión, clasificación de usuarios de terminales de comunicación según referencias geográficas, clasificación según plataformas más utilizadas en las conexiones, informe de errores producidos, informes estadísticos de los elementos de información de un sitio web en relación con otros sitios web de una misma agrupación en una clasificación jerarquizada sectorialmente según contenidos de los elementos de información, palabra relacionada más leída, imagen relacionada más vista, frecuencia de pulsación de ratón por elemento de información, palabras descargadas por sesión de terminal de comunicaciones , palabras descargadas por conexión de terminal de comunicaciones, imágenes descargadas por sesión de terminal de comunicaciones, imágenes descargadas por conexión de terminal de comunicaciones, clasificación de terminales de comunicaciones por tamaño de datos descargados, primer elemento de información visible al comenzar una conexión del terminal de comunicaciones, primer elemento de información visible al comenzar una sesión del terminal de comunicaciones, último elemento de información visible al terminar una conexión del terminal de comunicaciones, último elemento de información visible al terminar una sesión del terminal de comunicaciones, importancia de cada objeto de un elemento de información en función de un porcentaje de pulsaciones de ratón en relación con un total de pulsaciones de ratón, nube de palabras próximas a una pulsación de ratón, elemento de información más visto, y combinaciones de los mismos. OF NAVIGATION ACCESSED FROM COMMUNICATION TERMINALS, according to claim 1, characterized in that said automatic inference system additionally comprises fifth computer means of inference of visibility data relating to at least one element of information selected from: navigation screens, navigation pages, navigation components, attached objects and combinations thereof, based on at least one identification of: at least one of the computer files sent to each communications terminal, identified by the first computer means; at least one data associated to the computer files sent to each communications terminal, identified by the second computer means and selected from at least: target communication terminals, delivery times, size of the computer files sent, request orders from communication terminals, type of communication terminals, information about preferences of users of communication terminals, requests about the computer files sent, questions to communication terminals about information elements visible on the screens of the communication materials, identification information of the communication terminals, status of computer media involved, status of requested computer files and combinations thereof; at least one property of the navigation pages, identified by the third computer means; and of combinations of said identifications; said fifth computer means infers at least one visibility data selected from: total time of visible permanence of the information element, average time of visible permanence of the information element per communication terminal session, average degree of overlap of the information element by another information element, information element visible at first sight, readability index of the information element, usability index of the information element, accessibility index of the information element, interactivity index of the information element, optimization index of the information element information element, effectiveness index of the information element, viewing index of the information element, average reading index of an information element assuming arbitrary time per word read, percentage view of an information element based on its properties, classification of users of communication terminals based on a graduation of average viewing speed in combination with a coverage and reading index, classification of users of communication terminals based on concurrent visits to connection initiation information element, classification Profile is of users of communication terminals according to at least one type of navigation behavior selected from: faithful, leaking, abandonment, recall and combinations thereof, number of users of communication terminals that browse concurrently, number of users of communication terminals that browse non-concurrently, percentage of readable text size in an information element in relation to its total size, percentage of image size in an information element in relation to its total size, relationship between size in text and size in images in an information element, characteristics of third-party computer files in function that said third computer files are: text, image, sound, executable, multimedia and combinations thereof, characteristics of third computer files depending on whether said third computer files are referenced from at least one computer file selected from : first computer files, second computer files and combinations thereof, physical situation of at least one element selected from: navigation pages, navigation components, attached objects and combinations thereof, on the navigation screens of the communication terminals , predominant color in an information element, predominant font style in an information element, list of reference words contained in at least one information element, list of more redundant words contained in at least one information element, list of words most searched contained in at least one element of information, text density based on a ratio between number of words per paragraph and reading time, number of users of communication terminals per type of navigation defined according to the degree of overlap, total percentage of reading per communications terminal session, total reading percentage per communication terminal connection, total reading percentage per communications terminal user, total reading percentage per information element, Total viewing percentage per communication terminal session, total viewing percentage per communication terminal connection, total viewing percentage per communication terminal user, total viewing percentage per information element, number of users per coverage, relationship between connection times and maximum number of overlaps, relationship between connection times and average number of overlaps, most read information element with recurring visits, most read information element without recurring visits, quality of the information element based on a ratio between time of visibility and download time, reading ratio of the information element, classification of the information element according to its speed of download, classification by type of information element that is visited repeatedly, origin of recurring visits to information elements, comparative of visiting times as recurring in relation to the time of first visits to information elements, reiteration of each origin of recurring visits to information elements, percentage of recurring visits on each element of information, ratio between frequency of recurring visits and frequency of non-recurring visits to information elements, classification of the most frequent trajectories of the users in the connections of the communication terminal on the information elements, relationship between information elements and the trajectories which point to said information elements, classification of more concurrent paths associated with an end of a communication terminal connection, classification of the most concurrent paths associated with the termination of a session of the communications terminal, classification of the associated more concurrent paths at the beginning of a communication terminal session, passive time as a comparison of time between mouse clicks on a communication terminal connection and time between mouse presses in a communications terminal session, average number of mouse clicks per session of communication terminal, quality of the information element as a relationship between usability times and download times for each user of communications terminal, quality of the information element as a relationship between usability times and download file sizes for each user of ter communications minal, degree of optimization of navigation-oriented programming language, weekly day classification according to connection activity of communication terminal users, time slot classification according to connection activity of communication terminal users, activity level classification of users of communication terminals depending on the duration of the connection and in the time slot where said connection occurs, classification of users of communication terminals according to geographical references, classification according to most used platforms in the connections, report of errors produced, statistical reports of the information elements of a website in relation to other websites of the same grouping in a sectorially ranked classification according to the contents of the information elements, related word more read, related image more view , mouse click frequency per information element, words downloaded per communication terminal session, words downloaded per communication terminal connection, images downloaded per communication terminal session, images downloaded per communication terminal connection, terminal classification of communications by size of downloaded data, first visible information element at the beginning of a communication terminal connection, first visible information element at the beginning of a communications terminal session, last visible information element at the end of a communication terminal connection, last element of information visible at the end of a session of the communications terminal, importance of each object of an information element based on a percentage of mouse clicks in relation to a total of mouse clicks, cloud of words close to a mouse click, most viewed information element, and combinations thereof.
5. SISTEMA AUTOMÁTICO DE INFERENCIA DE DATOS RELATIVOS A ELEMENTOS DE INFORMACIÓN QUE ESTÁN VISIBLES EN PANTALLAS DE NAVEGACIÓN ACCEDIDAS DESDE TERMINALES DE COMUNICACIÓN, según cualquiera de las reivindicaciones anteriores, caracterizado porque dicho sistema automático de inferencia comprende adicionalmente al menos una base de datos relacional donde se realiza al menos una operación seleccionada entre: almacenamiento de propiedades de las pantallas de navegación identificadas por los terceros medios informáticos; almacenamiento de asociaciones entre elementos de información integrantes de una misma pantalla de navegación, seleccionados entre: pantallas de navegación, páginas de navegación, componentes de navegación, objetos adjuntos y combinaciones de los mismos, identificados por los terceros medios informáticos; almacenamiento de al menos un dato identificado por los primeros y segundos medios informáticos; agrupación por terminal de comunicación destinatario, de al menos un dato identificado por los primeros y segundos medios informáticos; almacenamiento de al menos uno de los datos inferidos por los cuartos medios informáticos; almacenamiento de al menos uno de los datos inferidos por los quintos medios informáticos; recuperación de datos previamente almacenados; y combinaciones de dichas operaciones. 5. AUTOMATIC DATA INFERENCE SYSTEM RELATING TO INFORMATION ELEMENTS THAT ARE VISIBLE ON NAVIGATION SCREENS ACCESSED FROM COMMUNICATION TERMINALS, according to any of the preceding claims, characterized in that said automatic inference system additionally comprises at least one relational database where at least one operation selected is performed between: storing properties of the navigation screens identified by the third computer means; storage of associations between information elements that are part of the same navigation screen, selected from: navigation screens, navigation pages, navigation components, attached objects and combinations thereof, identified by the third computer means; storage of at least one data identified by the first and second computer means; grouping by recipient communication terminal, of at least one data identified by the first and second computer means; storage of at least one of the data inferred by the fourth computer means; storage of at least one of the data inferred by the fifth computer means; recovery of previously stored data; and combinations of said operations.
6. SISTEMA AUTOMÁTICO DE INFERENCIA DE DATOS RELATIVOS A ELEMENTOS DE INFORMACIÓN QUE ESTÁN VISIBLES EN PANTALLAS DE NAVEGACIÓN ACCEDIDAS DESDE TERMINALES DE COMUNICACIÓN, según cualquiera de las reivindicaciones anteriores, caracterizado porque dicho sistema automático de inferencia comprende al menos un medio informático adicional seleccionado entre : sextos medios informáticos de registro de datos inferidos que, a partir de la información almacenada en la base de datos relacional, generan quintos ficheros informáticos de registro de datos inferidos, donde dichos datos inferidos son relativos a al menos un tipo de agrupación de elementos de información visibles, seleccionado entre: agrupación por pantallas de navegación, agrupación por componentes de navegación, agrupación por objetos adjuntos, y agrupación por combinaciones de agrupaciones, sin agrupación, donde cada elemento de información es registrado cada vez que se produce una modificación en la pantalla de navegación y sea visible dicho elemento de información; séptimos medios informáticos de análisis estadísticos que, a partir de la información almacenada en la base de datos relacional, generan sextos ficheros informáticos con información estadística sobre datos inferidos por medios informáticos seleccionados entre: terceros medios informáticos, cuartos medios informáticos, quintos medios informáticos, sextos medios informáticos, y combinaciones de los mismos; octavos medios informáticos de ínterfaz, parametrización y gobierno de al menos un medio informático seleccionado entre: primeros, segundos, terceros, cuartos, quintos, sextos, séptimos medios informáticos y combinaciones de los mismos; y combinaciones de dichos medios informáticos.6. AUTOMATIC DATA INFERENCE SYSTEM RELATING TO INFORMATION ELEMENTS THAT ARE VISIBLE ON NAVIGATION SCREENS ACCESSED FROM COMMUNICATION TERMINALS, according to any of the preceding claims, characterized in that said automatic inference system comprises at least one computer medium additional selected from: sixth computer means of recording inferred data that, from the information stored in the relational database, generates fifth computer files of inferred data record, where said inferred data are related to at least one type of grouping of visible information elements, selected from: grouping by navigation screens, grouping by navigation components, grouping by attached objects, and grouping by combinations of groupings, without grouping, where each information element is registered every time a modification occurs on the navigation screen and that information element is visible; Seventh computer means of statistical analysis that, from the information stored in the relational database, generate sixth computer files with statistical information on data inferred by computer means selected from: third computer media, fourth computer media, fifth computer media, sixth computer means, and combinations thereof; eighth computer media interface, parameterization and governance of at least one computer medium selected from: first, second, third, fourth, fifth, sixth, seventh computer media and combinations thereof; and combinations of said computer means.
7. SISTEMA AUTOMÁTICO DE INFERENCIA DE DATOS RELATIVOS A ELEMENTOS DE INFORMACIÓN QUE ESTÁN VISIBLES EN PANTALLAS DE NAVEGACIÓN ACCEDIDAS DESDE TERMINALES DE COMUNICACIÓN, según cualquiera de las reivindicaciones anteriores, caracterizado porque la red de acceso a los ficheros informáticos donde opera dicho sistema automático de inferencia es la red de Internet, verificándose al menos una de las siguientes correspondencias: al menos uno de los terminales de comunicaciones es un terminal dotado con acceso a Internet seleccionado entre: ordenadores, teléfonos, agendas electrónicas, televisores y equipos electrónicos; al menos un medio de identificación de los terminales de comunicación destinatarios consiste en una identificación de su dirección IP; al menos uno de los servidores proveedores de ficheros informáticos, es un servidor de páginas Web y de ficheros adjuntos a dichas páginas Web; al menos un medio de identificación de órdenes de petición procedentes de terminales de comunicación, consiste en una identificación de comandos "Get"; al menos un medio de identificación de elementos de información visualizados consiste en una identificación de consultas realizadas; al menos un medio de identificación de estados de medios informáticos implicados consiste en una identificación de recursos "Referer"; al menos un medio de identificación de estados de envío de ficheros informáticos solicitados consiste en una identificación de recursos accedidos; las páginas de navegación contenidas en los primeros ficheros informáticos, son páginas Web; los componentes de navegación contenidos en los segundos ficheros informáticos son con componentes Web integrantes de páginas Web; al menos uno de los terceros ficheros informáticos de objetos adjuntos, es un fichero adjunto a páginas Web seleccionado entre: ficheros de texto, de imagen, de sonido, ejecutables, multimedia y combinaciones de los mismos; los elementos de información son elementos seleccionados entre páginas Web, componentes Web y ficheros adjuntos a páginas Web; las pantallas de navegación son pantallas de navegación de Internet integradas por todos los elementos de información visibles desde un terminal con acceso a7. AUTOMATIC DATA INFERENCE SYSTEM RELATING TO INFORMATION ELEMENTS THAT ARE VISIBLE ON NAVIGATION SCREENS ACCESSED FROM COMMUNICATION TERMINALS, according to any of the preceding claims, characterized in that the file access network computer systems where said automatic inference system operates is the Internet network, at least one of the following correspondences being verified: at least one of the communications terminals is a terminal equipped with Internet access selected from: computers, telephones, electronic agendas, televisions and electronic equipment; at least one means of identification of the destination communication terminals consists of an identification of their IP address; at least one of the servers providing computer files, is a server of Web pages and files attached to said Web pages; at least one means of identifying request orders from communication terminals, consists of an identification of "Get"commands; at least one means of identifying displayed information elements consists of an identification of queries made; at least one means of identifying states of computer media involved consists of an identification of "Referer"resources; At least one means of identifying the requested file delivery states consists of an identification of accessed resources; the navigation pages contained in the first computer files are Web pages; the navigation components contained in the second computer files are with Web components integrating Web pages; at least one of the third computer files of attached objects, is a file attached to Web pages selected from: text, image, sound, executable, multimedia files and combinations thereof; Information elements are elements selected from Web pages, Web components and files attached to Web pages; the navigation screens are Internet navigation screens integrated by all the information elements visible from a terminal with access to
Internet; los primeros, segundos, terceros, cuartos, quintos, sextos, séptimos y octavos medios informáticos, son implementados mediante aplicaciones informáticas ejecutabas en al menos un computador; al menos uno de los lenguajes de programación orientados a la navegación es seleccionado entre: HTML, DHTML, XML,Internet; the first, second, third, fourth, fifth, sixth, seventh and eighth computer means, are implemented through computer applications running on at least one computer; At least one of the navigation-oriented programming languages is selected from: HTML, DHTML, XML,
JAVA, JAVASCRIPT, ASP, PHP y FLASH; y al menos uno de los cuartos ficheros informáticos es un archivo "Log" de registro de ficheros informáticos enviados por al menos un servidor de Internet. JAVA, JAVASCRIPT, ASP, PHP and FLASH; and at least one of the fourth computer files is a "Log" file for registering computer files sent by at least one Internet server.
PCT/ES2002/000524 2001-11-14 2002-11-12 Automatic system for inferring data relating to items of information visible on navigation screens which are accessed from communication terminals WO2003042831A1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
ESP0102516 2001-11-14
ES200102516A ES2192463B1 (en) 2001-11-14 2001-11-14 AUTOMATIC DATA INFERENCE SYSTEM RELATING TO INFORMATION ELEMENTS THAT ARE VISIBLE ON NAVIGATION SCREENS ACCESSED FROM COMMUNICATION TERMINALS.

Publications (1)

Publication Number Publication Date
WO2003042831A1 true WO2003042831A1 (en) 2003-05-22

Family

ID=8499444

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/ES2002/000524 WO2003042831A1 (en) 2001-11-14 2002-11-12 Automatic system for inferring data relating to items of information visible on navigation screens which are accessed from communication terminals

Country Status (2)

Country Link
ES (1) ES2192463B1 (en)
WO (1) WO2003042831A1 (en)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000075827A1 (en) * 1999-06-04 2000-12-14 Websidestory, Inc. Internet website traffic flow analysis
US20020087679A1 (en) * 2001-01-04 2002-07-04 Visual Insights Systems and methods for monitoring website activity in real time

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000075827A1 (en) * 1999-06-04 2000-12-14 Websidestory, Inc. Internet website traffic flow analysis
US20020087679A1 (en) * 2001-01-04 2002-07-04 Visual Insights Systems and methods for monitoring website activity in real time

Also Published As

Publication number Publication date
ES2192463A1 (en) 2003-10-01
ES2192463B1 (en) 2005-02-16

Similar Documents

Publication Publication Date Title
CN106933722B (en) Webpage application monitoring method, server and system
US9916293B2 (en) Module specification for a module to be incorporated into a container document
US8997081B1 (en) Analytics for mobile applications
US7725530B2 (en) Proxy server collection of data for module incorporation into a container document
ES2555291T3 (en) Method for remote monitoring and reproduction of a user's interaction with a web page
US7730082B2 (en) Remote module incorporation into a container document
US10079737B2 (en) Method and system for generating comparable visual maps for browsing activity analysis
EP2089813B1 (en) Diagnostics and error reporting for common tagging issues
US20070136201A1 (en) Customized container document modules using preferences
US20140136944A1 (en) Real time web development testing and reporting system
CA2962009A1 (en) Method and system for using interchangeable analytics modules to provide tax return preparation systems
WO2007130547A2 (en) Remote module syndication system and method
US10360133B2 (en) Analyzing analytic element network traffic
CN103605739A (en) Method and device for displaying thermodynamic diagrams
CN103336794B (en) For providing the corresponding method and apparatus that information is presented in target pages
US7752308B2 (en) System for measuring web traffic
CN111026485B (en) Data processing method and device
CN108280144A (en) Information displaying method, device and electronic equipment
US10867006B2 (en) Tag plan generation
CN103530338A (en) Frame for carrying out page rendering on calculation equipment and page generation method
US8302017B2 (en) Definition for service interface
Viscomi et al. Using WebPageTest: web performance testing for novices and power users
CN110737853B (en) Multi-platform display static page data synchronization method and B2B system
US20090112976A1 (en) Method for measuring web traffic
CN110532494A (en) Users' personal allocation method, system and the computer equipment of B/S application

Legal Events

Date Code Title Description
AK Designated states

Kind code of ref document: A1

Designated state(s): US

AL Designated countries for regional patents

Kind code of ref document: A1

Designated state(s): AT BE BG CH CY CZ DE DK EE ES FI FR GB GR IE IT LU MC NL PT SE SK TR

121 Ep: the epo has been informed by wipo that ep was designated in this application
122 Ep: pct application non-entry in european phase