一、点击数和页读数Web服务器能记录它得到的每次请求的信息。对我们有用的请求的信息包括:点击的日期和时间、主机名、请求、被授权的访问者的登录名、Web服务器的反应码、涉及者、访问者的useragent、访问者的IP地址、访问者的主机名(如果其IP地址可以被翻译出来)、传输的字节数、被访问的文件的路径、访问者发送的Cookies、Web服务器发送的Cookies。上述能收集到的访问量数据不多,而且得到的信息也不可靠。可用的信息不准确,但不是完全不可用。虽然数据不精确,但仍然可以知道有多少人在用我们的网站。正如我们知道的,用计数器可以很容易地知道有多少点击数,但对于更精确的分析,我们将不得不存储得到的点击数。一个简单的办法是把信息存储在Web服务器的log文件中,然后定期地加载数据库的table或直接把信息写到数据库的table中。点击是我们的服务器收到的任何文件请求,包括图像、声音文件和任何出现在页面上的东西。如果直接加载数据到数据库中,我们需要一个已经实现这种功能的Web服务器(如Microsoft肾IS),或需要源代码。也可以用第三方的API,如Apache的DBILogger。实现了这样的功能,就可以收集失败点击的次数(只需计算状态码为4xx的点击的数量)。页读数更准确些,因为它把一页当作一个整体,而不是它的各个部分。计算点击数不如计算页读数得到的信息量大,而且点击数计算的结果与其它网站很难进行比较。页读数就不同了:按时间块的页读数,可以查看每5分钟的页读数变化;按访问者的域名分类的页读数,可以确定他们是在工作时,工作前还是工作后访问我们的网站;按登录用户的页读数和非登录用户分类的页读数,可以确定允许用户登录是否值得;按信息来源分类的页读数,可以确定访问者进入页面是通过一个连接还是一个旗帜广告?他们从哪里来?这些信息可以帮我们了解访问者的兴趣,可以确定往哪儿投资,与哪些人合作;按访问者的硬件平台、操作系统、浏览器及其平台统计的页读数,可以确定Mac用户和PC用户的比例各为多少?Netscape和IE的用户各为多少;按访问者主机统计的页读数,可以确定访问者中有多少人用AOL?有多少人用Earthling?总之,页读数的统计,也就电子商务网站访问量的统计鼻子二、页读数的统计为了计算页读数,需要制定一些把页读数从点击数中区分出来的方法。下面是电子商务网站经常考虑到的一些因素:文件名、文件类型(HTML、GIF、WAV等)、Web服务器的反应码、访问者的主机。一旦确定了哪些点击是页读数,哪些不是,就可以计算网站的页读数了。我们按照文件的路径确定页读数算在哪个具体部分,如:http://www。hotw。com/web/99/13/index0a。html算做Web的页读数;而http://www。hotw。com/sys/99/12/index3a。html则算做Sys的页读数。如果这种标准在网站的各个层次上实行,可以得到网站的详细统计。我们有时希望把一个页读数算在某一部分,在其它部分算在另一部分。电子商务网站页读数的统计方法通常有如下几种。
1.远程数据跟踪页读数增长的速度是多少?年底的时候我们期望的页读数是多少?网站的哪部分页读数增长得最快?哪部分最慢?各种浏览器的比例随着时间变化的趋势是怎样的?人们过多久访问我们的网站一次?从其它网站的旗帜广告第一次进入我的网站的人,他们随后读了多少页?一旦我们看到可用的各种类型的信息,我们就会得到需要长距离回答的各种问题。如果我们对回答这些问题感兴趣,那么多天的跟踪就会有用。进行远程数据跟踪,可以考虑使用数据库。我们可以编写程序从点击数日志中提取想要的信息。如果数据库设计得合理,查询信息的时间比用程序从日志文件中提取信息快好多倍。数据量越大,这种差别越明显。如果只存储感兴趣的点击,可以节省大量的数据空间。也可用SQL从数据库中提取数据。SQL是一种小型的、简练的只需学很少的命令和语法的语言。而且,其命令结构简单明晰,好的程序员建立一个SQL查询比编程做同样的事快得多。而且其结果错误更少,更容易理解。如果不想用SQL,可以用一种数据库访问工具如MSAccess或Excel。这些工具都很好用,而且是图形界面。
2.计算访问时间电子商务网站的市场部和广告部都喜欢统计访问时间,即某人在离开我们的站点前停留了多长时间。但是,用HTTP是不可能确定这个数值的。假设一个客户在正午时访问Hot的一个页,然后该客户在12:28p。m。访问Hot的另一页,那么该客户对Hot的访问时间是多长呢?该客户可能在这28分钟内一直盯着第一个Hot页,但是该客户也可能在这28分钟内新开了一个窗口,浏览另一个网站。但是,我们的用户确实需要这种信息,那么该怎么告诉他们呢?我们可以去InternetAdvertisingBureau,它定义了一个访问为"没有连续30分钟的不活动的访问者的一系列页面请求"。当有人问起我们的网站的访问时间时,我们也可以在IAB的定义的基础上告诉他们。
3.计算访问来源如果访问者点击某个连接或某个旗帜广告到达我们的网站,他的浏览器会随着这个请求发送他刚离开的站点的URL,这个URL称为"referer"。Netscape和IE对访问的来源的处理方式不同。如果我们点击原始页到一个有frame的页,Netscape将把原始页作为对包含frame的页和每个frame中的页的来源;IE把原始页作为包含frame的页的来源,这个包含frame的页反过来把它本身作为各个frame页的来源。进一步,我们可能还会得到每页的页读数的数据。如果把网站分成频道或部分,则可能得到每部分的数据。需要注意的是,上述方法计算出的页读数不是我们的网站的实际页读数。这是因为我们统计的是在Web服务器的访问日志中计算访问记录,而很多请求从不在访问日志中留下痕迹。因为没有十全十美的方案,所以使用哪种统计方法取决于网站的实际情况。
三、计算访问人数计算访问人数比计算页读数难得多,而且没有绝对可靠的计算访问者人数的方法。基本上有三种信息可以用来跟踪访问者:IP地址、成员名(如果网站使用成员注册)和cookie。最简单的办法是计算log文件中的唯一IP地址的数量。但是,最容易的办法通常不是最好的办法。这种方法是可用的最不准确的办法。大多数人在每次连接时得到不同的IP地址。这是因为很多ISP为用户赋予动态的IP地址,例如,当一个AOL用户上网时,AOL给他一个IP地址,当他断开连接时,AOL把这个地址赋给另一个用户。这样,当我们进行统计时,我们不知道这是两个用户。如果要求用户使用成员身份登录,统计将很容易和准确。但很多人不喜欢需要登录的网站,这就使得跟踪成员名的统计没有实际意义。最后,可以使用cookies。为每个访问者定义一个包含唯一值的cookie,我们把它称为机器ID。如果某人访问我们的网站时没有提供机器ID(可能她是第一次访问,或者她的浏览器不接受cookies),把她当作新用户,并为她访问的页发送一个cookie。使用这种方法要注意的是:1.很多人关掉了cookies的功能;(责任编辑:一枝笔写作)