版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、1.MIME1.MIME郵件的編碼方式郵件的編碼方式由于每個II碼字符只占用一個字節(jié)(8個bit位),且最高bit位總為0,即II碼字符中的有真正意義的信息只是后面的7個低bit位,而傳統(tǒng)的SMTP協(xié)議又是基于II碼字符設(shè)計的,因此,一些基于傳統(tǒng)SMTP協(xié)議設(shè)計的SMTP服務(wù)器在處理郵件內(nèi)容時只取出每個字節(jié)中的7個低bit位進(jìn)行處理,而將最高bit位忽略不計。顯然,這樣的SMTP服務(wù)器在處理包含有非II碼字符的郵件內(nèi)容時,會出現(xiàn)嚴(yán)重的問
2、題,這就限制了郵件中只能出現(xiàn)英文的II碼字符,而不能出現(xiàn)中文字符或二進(jìn)制數(shù)據(jù)。為了能夠在郵件內(nèi)容中包含中文、圖像或聲音等非II字符的數(shù)據(jù),人們想到了采用某種編碼方式將非II字符的數(shù)據(jù)轉(zhuǎn)換成可打印的II字符后再發(fā)送,郵件閱讀程序則按照相應(yīng)的解碼方式從郵件中還原出原始數(shù)據(jù)即可,比較常用的兩種郵件編碼方式為BASE64和Quotedprintable。后來的擴(kuò)展SMTP協(xié)議允許直接在郵件中傳遞二進(jìn)制數(shù)據(jù),而不用對它們進(jìn)行郵件編碼,人們將這種沒
3、有進(jìn)行郵件編碼的二進(jìn)制數(shù)據(jù)的郵件內(nèi)容稱為8bit編碼,為了與此相區(qū)別,人們將沒有進(jìn)行郵件編碼的純II碼字符的郵件稱為7bit編碼。MIME消息體的郵件編碼方式通過MIME消息頭中的ContentTransferEncoding頭字段指定,每種郵件編碼方式的介紹如下:—7Bit7Bit指消息體內(nèi)容全部是沒有經(jīng)過編碼的II字符?!?Bit8Bit指消息體內(nèi)容是沒有經(jīng)過編碼的原始數(shù)據(jù),且其中包含有非II字符的數(shù)據(jù)?,F(xiàn)在的郵件服務(wù)器基本上都支持
4、8Bit編碼,使用支持8Bit編碼的郵件服務(wù)器可以簡化郵件的處理過程?!狟ASE64BASE64Base64是將二進(jìn)制數(shù)據(jù)轉(zhuǎn)換成可打印的II字符的一種最常見的編碼方式,它的基本原理是將一組連續(xù)的字節(jié)數(shù)據(jù)按6個bit位進(jìn)行分組,然后對每組數(shù)據(jù)用一個II字符來表示。6個bit位最多能表示26=64個數(shù)值,因此可以使用64個II字符來對應(yīng)這64個數(shù)值,這64個II字符為:“ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghi
5、jklmnopqrstuvwxyz0123456789“其中每個字符表示的數(shù)值就是該字符在上面的排列中的索引號,索引號從0開始編號。假設(shè)在內(nèi)存中有如下三個連續(xù)的字節(jié)數(shù)據(jù):[01100001][01100010][01100011]將它們按6個bit位進(jìn)行分組后的形式如下:[011000][010110][001001][100011]2.2.常用字符集編碼常用字符集編碼—IIIIII碼是7位編碼,編碼范圍是0x000x7F。II字符集包
6、括英文字母、阿拉伯?dāng)?shù)字和標(biāo)點符號等字符。其中0x000x20和0x7F共33個控制字符。只支持II碼的系統(tǒng)會忽略每個字節(jié)的最高位,只認(rèn)為低7位是有效位。HZ字符編碼就是早期為了在只支持7位II系統(tǒng)中傳輸中文而設(shè)計的編碼。早期很多郵件系統(tǒng)也只支持II編碼,為了傳輸中文郵件必須使用BASE64或者其他編碼方式?!狦B2312GB2312GB2312是基于區(qū)位碼設(shè)計的,區(qū)位碼把編碼表分為94個區(qū),每個區(qū)對應(yīng)94個位,每個字符的區(qū)號和位號組合起
7、來就是該漢字的區(qū)位碼。區(qū)位碼一般用10進(jìn)制數(shù)來表示,如1601就表示16區(qū)1位,對應(yīng)的字符是“啊”。在區(qū)位碼的區(qū)號和位號上分別加上0xA0就得到了GB2312編碼。區(qū)位碼中0109區(qū)是符號、數(shù)字區(qū),1687區(qū)是漢字區(qū),1015和8894是未定義的空白區(qū)。它將收錄的漢字分成兩級:第一級是常用漢字計3755個,置于1655區(qū),按漢語拼音字母筆形順序排列;第二級漢字是次常用漢字計3008個,置于5687區(qū),按部首筆畫順序排列。一級漢字是按照拼
8、音排序的,這個就可以得到某個拼音在一級漢字區(qū)位中的范圍,很多根據(jù)漢字可以得到拼音的程序就是根據(jù)這個原理編寫的。GB2312字符集中除常用簡體漢字字符外還包括希臘字母、日文平假名及片假名字母、俄語西里爾字母等字符,未收錄繁體中文漢字和一些生僻字??梢杂梅斌w漢字測試某些系統(tǒng)是不是只支持GB2312編碼。GB2312的編碼范圍是0xA1A10x7E7E,去掉未定義的區(qū)域之后可以理解為實際編碼范圍是0xA1A10xF7FE。EUCCN可以理解為
9、GB2312的別名,和GB2312完全相同。區(qū)位碼更應(yīng)該認(rèn)為是字符集的定義,定義了所收錄的字符和字符位置,而GB2312及EUCCN是實際計算機(jī)環(huán)境中支持這種字符集的編碼。HZ和ISO2022CN是對應(yīng)區(qū)位碼字符集的另外兩種編碼,都是用7位編碼空間來支持漢字。區(qū)位碼和GB2312編碼的關(guān)系有點像Unicode和UTF8。—GBKGBKGBK編碼是GB2312編碼的超集,向下完全兼容GB2312,同時GBK收錄了Unicode基本多文種平
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 英文電子郵件常用句式
- 支持基數(shù)-91編碼的安全電子郵件系統(tǒng).pdf
- 電子郵件禮儀及郵件管理-課件
- 信息交換用漢字編碼字符集
- 實訓(xùn)四電子郵件推廣
- 電子郵件加密
- 電子郵件的申請及使用
- 電子郵件報名指南
- 一種基于Unicode字符集編碼的動態(tài)口令身份認(rèn)證技術(shù).pdf
- 電子郵件外文翻譯
- 電子郵件外文翻譯
- 電子郵件系統(tǒng)
- 我發(fā)電子郵件
- 電子郵件終端.pdf
- 電子郵件溝通規(guī)范
- 《電子郵件》教學(xué)設(shè)計及反思
- 電子郵件的證據(jù)效力
- 發(fā)電子郵件的禮儀
- 英文電子郵件范例
- 電子郵件收發(fā)管理規(guī)定
評論
0/150
提交評論