Apache 简单页面缓存

维护一套网站系统,因为时间久远,已不知道他的静态化系统要如何开启和如何运作,而首页及部分频道页因为查询太多,导致运行缓慢,急需一种简单有效的方法来提高访问效率。

因为问题主要出在页面中内容的查询上,优化方法自然是要减少或杜绝查询,在不动网站系统代码的前提下,可通过 Apache 的 URLRewrite 来达到目的。

建立一个目录(如 cache)来存放静态化后页面文件,在网站根目录的 .htaccess 中写入规则, 没有就创建一个:

RewriteCond %{DOCUMENT_ROOT}/cache/%{REQUEST_URI}.cache -fRewriteRule ^(.*)$ cache/$1.cache [L]

此规则判断 cache 目录下是否存在当前 URI 对应的 .cache 后缀的文件, 如果有则将请求定向到该文件. 但是网站页面本身已采用了 URLRewrite 将 url 映射到了程序脚本上, 而其路径规则可能对尾部的 "/" 不敏感, 如 /abc/def 与 /abc/def/ 可以是同一个页面, RewriteCond 并不支持字符串截取、正则替换等操作, 故另添加以下规则来匹配 "/" 结尾的缓存:

RewriteCond %{DOCUMENT_ROOT}/cache/%{REQUEST_URI}/.cache -fRewriteRule ^(.*)$ cache/$1/.cache [L]

现在, 我们还需要一个简单脚本来将页面输出存入缓存文件中, 可编写一个 bash 脚本来实现:

!/bin/bash

WD=$(cd dirname $0; pwd)

cache ()
{
ln="$1"
fn="$WD/$1.cache"
tn="$WD/$1.cachx"
dn=dirname $fn

rm    -f "$fn"rm    -f "$tn"mkdir -p "$dn"wget  -O "$tn" "http://www.xxx.com/$ln"mv "$tn" "$fn"

}

if [ "@" != "$1" ]
then
cache "$1"
else
cache ""
cache xxx/
cache xxx/xxx
fi
可见脚本中 wget 将输出存入了临时文件后更名为目标文件, 这是因为 wget 在执行开始时就会打开文件, 此时请求开始, apache 因文件存在而重定向, 最后拿到的文件就成空的了. 为减少网络请求时间, 可在 /etc/hosts 中加入 127.0.0.1 www.xxx.com

此脚本使用方法为:

./cache.sh # 缓存首页
./cache.sh xxx/ # 缓存 xxx 频道页(网站内链接可能用 / 结尾)
./cache.sh xxx/xxx # 缓存 xxx 文章页(网站内链接不会用 / 结尾)
./cache.sh @ # 缓存所有经常访问的页面(脚本 else 部分)
可以把经常访问的页面加入脚本 else 部分, 将此脚本设为计划任务, 每隔一段时间刷新缓存一次, 能有效减少请求对数据库的查询次数.

但这还不够, 编辑可能需要在发布文章后立即更新缓存, 以便查看首页、频道页等位置的新闻、推荐等是否正确. 可采用以下 PHP 脚本来执行(如果网站系统是 PHP 编写):

\r\n";
system(DIR.'/cache.sh \''.$uri.'\' 2>&1');
echo "\r\n";
只需在需要刷新缓存时请求 /cache/cache.php 即可, 可通过 n 参数来指定仅刷新哪个页面. 为防止恶意利用此脚本执行危险命令(如: abc'; rm -rf 'xxx), 以上判断了仅能刷新指定的页面; 当然文件改名或加上密码等措施可能更可靠些.

关键字:Apache, bash, wget, php

版权声明

本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部