CodeIgniter中URL含有中文字符串的解决方案

本文转自 http://newyorkphper.javaeye.com/blog/547726

codeIgniter默认的配置下是不允许URL中包含非ASCII字符的,如果我们有这样一个字符串:

http://www.example.com/photo/北京/鸟巢.jpg
那么CI会毫不客气的告诉你:
The URI you submitted has disallowed characters.

你可能会说,那我把这个URL使用函数urlencode一下呢?不行。因为Web Server会在接收到一个被urlencode的URL后自动将其decode,然后在PHP里得到的这些字符串转换成他原来所代表的含义,并使用 Web Server自己的URL编码字符集(IIS6 中文版是GBK,Apache 2.2是UTF-8)传送给应用程序,这就使得CI得到的URL已经是一个解码过的,无论你有没有对URL进行urlencode,浏览器在发出请求时会自动检测,若没有,则会自动进行编码。所以,手动的进行urlencode并不能解决问题。那么我们应该怎么做来解决这个问题呢?

对于CI这种框架,用到现在,我的观点是尽量不要去修改它,而是去扩展他,CI提供了很好的扩展机制,我们只需要在application/libraries/下增加一个文件MY_URI.php,其内容为:

[codesyntax lang=”php”]
class MY_URI extends CI_URI {  
function _filter_uri($str)  
{  
if ($str != ” AND $this->config->item(‘permitted_uri_chars’) != ”)  
{  
$str = urlencode($str); // 红色部分  
            if ( ! preg_match(“|^[“.preg_quote($this->config->item(‘permitted_uri_chars’)).”]+$|i”, $str))  
{  
exit(‘The URI you submitted has disallowed characters.’);  
}  
$str = urldecode($str); // 红色部分  
}  
return $str;  
}  
  
}  
[/codesyntax]

红色的两行是我新加入的代码,我覆盖了原来CI_URI中的_filter_uri方法,这样就可以使得中文的URL通过检测。但是,如果URL里有空格,也不行了,怎么办呢?原来,urlencode会将空格转换成+,而CI的默认配置中是不允许+出现在URL里的,OK,把

[codesyntax lang=”php”]
$config [‘permitted_uri_chars’] = ‘a-z 0-9~%.:_\-‘;
[/codesyntax]

改成

[codesyntax lang=”php”]
$config[‘permitted_uri_chars’] = ‘a-z 0-9~%.:_\+\-‘;
[/codesyntax]

就可以了。

或者

第一步把config.php 中的

[codesyntax lang=”php”]
$config[‘permitted_uri_chars’] = ‘a-z 0-9~%.:_\-‘;    
[/codesyntax]

改成

[codesyntax lang=”php”]
$config[‘permitted_uri_chars’] =’a-z 0-9~%.:_-u4e00-u9fa5′;
[/codesyntax]