|
昨天做一個(gè)項(xiàng)目,其中有一個(gè)需求是每一張圖片對(duì)應(yīng)一小段文字對(duì)圖片的說明,普通的做法是新建一個(gè)表然后把圖片名與說明文字都記錄到數(shù)據(jù)庫(kù)內(nèi)。仔細(xì)考慮后感覺這個(gè)應(yīng)用不要數(shù)據(jù)庫(kù)也能完成,我實(shí)現(xiàn)的方案是把說明文字URLENCODE后當(dāng)做文件名,這樣當(dāng)我讀取文件的時(shí)候再把文件名URLDECODE就可以后驅(qū)圖片的文字說明了。
可是通過瀏覽器訪問圖片時(shí)卻提示找不到文件,如有一張圖片的說明文字為“瓊臺(tái)博客”,URLENCODE后生成的文件名如下
復(fù)制代碼 代碼如下:
%E7%90%BC%E5%8F%B0%E5%8D%9A%E5%AE%A2.jpg
于是我通過瀏覽器訪問圖片,提示找不到
仔細(xì)看了一下,發(fā)現(xiàn)瀏覽器訪問的時(shí)候自動(dòng)把文件名給轉(zhuǎn)回中文了
火狐
chrome
IE
Safari
IE與Safari從地址欄上沒有看出轉(zhuǎn)為漢字,但也同樣都提示找不到文件。但我感覺應(yīng)該是它請(qǐng)求的時(shí)候也都自動(dòng)轉(zhuǎn)了,只不過地址欄上的沒有顯示轉(zhuǎn)換后的。從Nginx的訪問記錄看訪問圖片時(shí)的請(qǐng)求情況
復(fù)制代碼 代碼如下:
192.168.6.30 - - [12/Oct/2012:10:09:44 +0800] "GET /%E7%90%BC%E5%8F%B0%E5%8D%9A%E5%AE%A2.jpg HTTP/1.1" 404 199 "-" "Mozilla/5.0 (compatible; MSIE 9.0; Windows NT 6.1; Trident/5.0)"
請(qǐng)求URL處理沒發(fā)現(xiàn)什么異常,最后通過反復(fù)研究編碼后的文件名,發(fā)現(xiàn)都是由百分號(hào)與字母數(shù)字組成,我感覺應(yīng)該是瀏覽器在遇到百分號(hào)時(shí)可能會(huì)做些其它轉(zhuǎn)換處理了,所以導(dǎo)致瀏覽器訪問URLENCODE后的文件提示找不到。
于是我把所有URLENCODE后的文件名里的百分號(hào)都用下劃線替換
復(fù)制代碼 代碼如下:
%E7%90%BC%E5%8F%B0%E5%8D%9A%E5%AE%A2.jpg
替換為
復(fù)制代碼 代碼如下:
_E7_90_BC_E5_8F_B0_E5_8D_9A_E5_AE_A2.jpg
重新使用瀏覽器訪問,問題解決
如要獲取圖片的文字說明,直接把文件名的“_”替換回"%”再使用URLDECODE即可。
最后需要注意的是,Linux下文件名跟Win系統(tǒng)一樣都有長(zhǎng)度限制,目前最常用的格式為ext3,這中格式允許255個(gè)字符長(zhǎng)度,扣除大約5個(gè)作為拓展名后大約剩余250個(gè)長(zhǎng)度純文件名,而一個(gè)漢字經(jīng)過URLENCODE后的長(zhǎng)度為9個(gè),因此最大可以編碼27個(gè)漢字做為文件名。
雖然這種方式存儲(chǔ)的漢字比較少,但可以利用一些加密方法獲得較短的一串密文,再把這段密文URLENCODE即可,具體實(shí)現(xiàn)方式我就不一一舉例,動(dòng)手做做思考一下吧!
php技術(shù):訪問編碼后的中文URL返回404錯(cuò)誤的解決方法,轉(zhuǎn)載需保留來源!
鄭重聲明:本文版權(quán)歸原作者所有,轉(zhuǎn)載文章僅為傳播更多信息之目的,如作者信息標(biāo)記有誤,請(qǐng)第一時(shí)間聯(lián)系我們修改或刪除,多謝。