tomcat访问(access)日志配置和记录Post请求参数
author:一佰互联 2019-04-23   click:186

一、配置与说明

tomcat访问日志格式配置,在config/server.xml里Host标签下加上

<Valve className="org.apache.catalina.valves.AccessLogValve" directory="logs"
        prefix="localhost_access_log." suffix=".txt"
        pattern="%h %l %u %t "%r" [%{postdata}r] %s %{Referer}i %{User-Agent}i %T %b" />

我们在日志文件中将看到如下文本:

10.217.14.16 - - [21/Oct/2016:15:48:54 +0800] "POST /updates/related_notice_num.json HTTP/1.0" [channel=App Store&gid=92391918-2173-4A66-8B31-B2FB3F8FB3DF&os=2&plat=2&sver=10.000000&token=MzM1OTc0MjQ1MkB3ZWliby55bXguY29tfHdlaWJvfDQ5ZGFmMjk0YjQ5YWQxMTZiZjBmYWM4ZDdhYzg3ZWQ0&ua=&ver=4.2.1] 200 - AllApp/4.2.1 (iPhone; iOS 10.0.2; Scale/3.00) 0.004 91

 参数说明:

className        官方文档上说了:This MUST be set to org.apache.catalina.valves.AccessLogValve to use the default access log valve。
directory 日志文件存放的目录。通常设置为tomcat下已有的那个logs文件。
prefix 日志文件的名称前缀。
suffix 日志文件的名称后缀。
pattern 最主要的参数。下面会细讲。
resolveHosts 如果是true,tomcat会将这个服务器IP地址通过DNS转换为主机名;如果是false,就直接写服务器IP地址啦。默认false。
rotatable  默认为true,tomcat生成的文件名为prefix(前缀)+.+时间(一般是按天算)+.+suffix(后缀),如:localhost_access_log.2007-09-22.txt。设置为false的话,tomcat会忽略时间,不会生成新文件,文件名就是:localhost_access_log.txt。长此以往,这个日志文件会超级大
condition 这个参数不太实用,可设置任何值,比如设置成condition="tkq",那么只有当ServletRequest.getAttribute("tkq")为空的时候,该条日志才会被记录下来。

fileDateFormat                                                                                 
顾名思义,就是时间格式嘛。但这个时间格式是针对日志文件名起作用的。咱们生成的日志文件全名:localhost_access_log.2016-09-22.txt,这里面的2016-09-22就是这么来的。如果想让tomcat每小时生成一个日志文件,也很简单,将这个值设置为:fileDateFormat="yyyy-MM-dd.HH",当然也可以按分钟生成什么的,自己改改吧^_^

下面着重讲下pattern。它的参数比较多。可以设置成common,combined两种格式。

  1. common的值:%h %l %u %t %r %s %b
  2. combined的值:%h %l %u %t %r %s %b %{Referer}i %{User-Agent}i        (至于combined的值的最后两个为什么会这样,我也不太清楚)
%a  这是记录访问者的IP,在日志里是127.0.0.1 
%A  这是记录本地服务器的IP,在日志里是192.168.254.108 
%b  发送信息的字节数,不包括http头,如果字节数为0的话,显示为- 
%B  发送信息的字节数,不包括http头。 
%h  服务器的名称。如果resolveHosts为false的话,这里就是IP地址了,例如我的日志里是10.217.14.16 
%H  访问者的协议,这里是HTTP/1.0 
%l  官方解释:Remote logical username from identd (可能这样翻译:记录浏览者进行身份验证时提供的名字)(always returns "-") 
%m  访问的方式,是GET还是POST 
%p  本地接收访问的端口  
%q  比如你访问的是aaa.jsp?bbb=ccc,那么这里就显示?bbb=ccc,就是querystring的意思 
%r  First line of the request (method and request URI) 请求的方法和URL 
%s  http的响应状态码  
%S  用户的session ID,这个session ID大家可以另外查一下详细的解释,反正每次都会生成不同的session ID 
%t  请求时间 
%u  得到了验证的访问者,否则就是"-" 
%U  访问的URL地址,我这里是/rightmainima/leftbott4.swf 
%v  服务器名称,可能就是你url里面写的那个吧,我这里是localhost 
%D  Time taken to process the request,in millis,请求消耗的时间,以毫秒记 
%T  Time taken to process the request,in seconds,请求消耗的时间,以秒记 

附:参考官方文档: http://tomcat.apache.org/tomcat-5.5-doc/config/valve.html

二、配置打印POST参数

另外%r参数能打印出请求的url和get参数。如果url指定访问方式是post,post的参数是打印不出来的。当需要打印post参数,该怎么办?

大家注意到我开篇举例Valve配置里的%{postdata}r。没错,这个combined格式的patterrn可以实现。但是只在valve里配置这个东东还不够。因为postdata使我们自定义的参数名。需要在request中设置这个值。下面附上设置postdata到request中的代码。

package com.xiaoxiliu  
import java.io.IOException; 
import java.util.Enumeration;  
import javax.servlet.Filter; 
import javax.servlet.FilterChain; 
import javax.servlet.FilterConfig; 
import javax.servlet.ServletException; 
import javax.servlet.ServletRequest; 
import javax.servlet.ServletResponse;  
import org.slf4j.Logger; 
import org.slf4j.LoggerFactory;  
public final class PostDataDumperFilter implements Filter {  
  Logger logger = LoggerFactory.getLogger(getClass());  
  private FilterConfig filterConfig = null;  
  public void destroy() { 
    this.filterConfig = null; 
  } 
 
  public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain) 
      throws IOException, ServletException { 
    if (filterConfig == null) 
      return;  
    Enumeration<String> names = request.getParameterNames(); 
    StringBuilder output = new StringBuilder(); 
    while (names.hasMoreElements()) { 
      String name = (String) names.nextElement(); 
      output.append(name).append("="); 
      String values[] = request.getParameterValues(name); 
      for (int i = 0; i < values.length; i++) { 
        if (i > 0) { 
          output.append("" "); 
        } 
 
        output.append(values[i]); 
      } 
      if (names.hasMoreElements()) 
        output.append("&"); 
    } 
    request.setAttribute("postdata", output); 
    logger.debug("postdata: " + output); 
    chain.doFilter(request, response); 
  } 
 
  public void init(FilterConfig filterConfig) throws ServletException { 
    this.filterConfig = filterConfig; 
  } 
} 

在web.xml中添加配置该filter:

<filter> 
    <filter-name>post-data-dumper-filter</filter-name> 
    <filter-class>com.xiaoxiliu.PostDataDumperFilter</filter-class> 
  </filter> 
  <filter-mapping> 
    <filter-name>post-data-dumper-filter</filter-name> 
    <url-pattern>/*</url-pattern> 
  </filter-mapping> 

三、查询访问最耗时的接口

这就要用到万能的awk了 我们的日志倒数第二列显示的访问时间。cat logs/localhost_access_log.2016-10-25.txt | awk "{print $(NF-1)" "$0}" | sort -n -r| awk "{$1="";print $0}"  按照倒数第二列由大到小显示接口以及访问时间。这样我们就能找出那些借口耗时较大,然后对其进行优化,提高用户体验。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持网页设计。