关键词不能为空

当前您在: 主页 > 高中公式大全 >

吏组词(精选)软件开发---编码方式

作者:高考题库网
来源:https://www.bjmy2z.cn/gaokao
2020-12-10 23:17
tags:编码方式

刘伶-肛毛

2020年12月10日发(作者:席时熙)
个人收集整理 仅供参考学习
编码
用预先规定的方法将文字、数字或其他对象 编成数码,或将信息、数据转换成规定的
电脉冲信号。编码在电子计算机、电视、遥控和通讯等方面广泛 使用。编码是信息从一种
形式或格式转换为另一种形式的过程。解码,是编码的逆过程。
1.文件编码
用windows的记事本编写的txt文件,保存后有4中编码格式:ANSI 、unicode、
unicode big endian、UTF-8。
不同编码的文本 ,大部分可以根据文本的前两个字节来判断其编码格式。Unicode、
Unicode big e ndian和UTF-8编码的txt文件的开头会多出几个字节,分别是FF、FE(Unicode),FE 、
FF(Unicode big endian),EF、BB、BF(UTF-8)
ANSI码介绍

1.概述
目前计算机中用得最广泛的字符集及其编码 ,是由美国国家标准局(ANSI)制定的ASCII
码(American Standard Code for Information Interchange,美国标准信息交换码),它
已 被国际标准化组织(ISO)定为国际标准,称为ISO 646标准。
适用于所有拉丁文字字母,A SCII码有7位码和8位码两种形式。7位ASCII码是用七
位二进制数进行编码的,可以表示12 8个字符。
第0~32号及第127号(共34个)是控制字符或通讯专用字符,如控制符:LF(换 行)、
CR(回车)、FF(换页)、DEL(删除)、BEL(振铃)等;通讯专用字符:SOH(文 头)、EOT
(文尾)、ACK(确认)等;
第33~126号(共94个)是字符,其中第 48~57号为0~9十个阿拉伯数字;65~90号
为26个大写英文字母,97~122号为26个 小写英文字母,其余为一些标点符号、运算符号
等。
注意:在计算机的存储单元中,一个AS CII码值占一个字节(8个二进制位),其最高位
(b7)用作奇偶校验位。所谓奇偶校验,是指在代 码传送过程中用来检验是否出现错误的一种
方法,一般分奇校验和偶校验两种。奇校验规定:正确的代码 一个字节中1的个数必须是奇
数,若非奇数,则在最高位b7添1;偶校验规定:正确的代码一个字节中 1的个数必须是
偶数,若非偶数,则在最高位b7添1。

个人收集整理 仅供参考学习
ASCII值
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
16
进制
00H
01H
02H
03H
04H
05H
06H
07H
08H
09H
0AH
0BH
0CH
0DH
0EH
0FH
10H
11H
12H
13H
14H
15H
16H
17H
18H
19H
1AH
1BH
1CH
1DH
1EH
1FH
控制
字符
NUT
SOH
STX
ETX
EOT
ENQ
ACK
BEL
BS
TAB
LF
VT
FF
CR
SO
SI
DLE
DCI
DC2
DC3
DC4
NAK
SYN
ETB
CAN
EM
SUB
ESC
FS
GS
RS
US
ASCII值
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
16
进制
20H
21H
22H
23H
24H
25H
26H
27H
28H
29H
2AH
2BH
2CH
2DH
2EH
2FH
30H
31H
32H
33H
34H
35H
36H
37H
38H
39H
3AH
3BH
3CH
3DH
3EH
3FH
控制
字符
(space)


#
$$
%
&
,
(
)
*
+

-
.

0
1
2
3
4
5
6
7
8
9
:
;
<
=
>
?
ASCII值
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
16
进制
40H
41H
42H
43H
44H
45H
46H
47H
48H
49H
4AH
4BH
4CH
4DH
4EH
4FH
50H
51H
52H
53H
54H
55H
56H
57H
58H
59H
5AH
5BH
5CH
5DH
5EH
5FH
控制
字符
@
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
X
T
U
V
W
X
Y
Z
[

]
^

ASCII值
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
16
进制
60H
61H
62H
63H
64H
65H
66H
67H
68H
69H
6AH
6BH
6CH
6DH
6EH
6FH
70H
71H
72H
73H
74H
75H
76H
77H
78H
79H
7AH
7BH
7CH
7DH
7EH
7FH
控制
字符

a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
p
q
r
s
t
u
v
w
x
y
z
{
|
}
~
DEL

控制字符注释
ASCII值
0
1
2
3
4
5
16进制
00H
01H
02H
03H
04H
05H
控制字符
NUL
SOH
STX
ETX
EOT
ENQ
注释

头标开始
正文开始
正文结束
传输结束
查询
ASCII值
17
18
19
20
21
22
16进制
11H
12H
13H
14H
15H
16H
控制字符
DCI
DC2
DC3
DC4
NAK
SYN
注释
设备控制1
设备控制2
设备控制3
设备控制4
反确认
同步空闲
个人收集整理 仅供参考学习
6
7
8
9
10
11
12
13
14
15
16
06H
07H
08H
09H
0AH
0BH
0CH
0DH
0EH
0FH
10H
ACK
BEL
BS
TAB
LF
VT
FF
CR
SO
SI
DLE
确认
震铃
退格
水平制表符
换行
垂直制表符
换页新页
回车
移出
移入
数据链路转

23
24
25
26
27
28
29
30
31


17H
18H
19H
1AH
1BH
1CH
1DH
1EH
1FH


ETB
CAN
EM
SUB
ESC
FS
GS
RS
US


传输块结束
取消
媒体结束
替换
转意
文件分割符
组分割符
记录分割符
单元分割符



++的转义字符
所有的ASCII码 都可以用“”加数字(一般是8进制数字)来表示。而C中定义了一些字
母前加来表示常见的那些不能显 示的ASCII字符,如0,t,n等,就称为转义字符,因为后
面的字符,都不是它本来的ASCII 字符意思了。
转义字符 意义 ASCII码值(十进制)
a 响铃(BEL) 007
b 退格(BS) 008
f 换页(FF) 012
n 换行(LF) 010
个人收集整理 仅供参考学习
r 回车(CR) 013
t 水平制表(HT) 009
v 垂直制表(VT) 011
反斜杠 092
? 问号字符 063
' 单引号字符 039
双引号字符 034
0 空字符(NULL) 000
ddd 任意字符 三位八进制
xhh 任意字符 二位十六进制
a:蜂鸣,响铃
b:回退:向后退一格
f:换页
n:换行,光标到下行行首
r:回车,光标到本行行首
t:水平制表
v:垂直制表
:反斜杠
':单引号
双引号
?:问号
ddd:三位八进制
xhh:二位十六进制
0:空字符(NULL),什么都不做
注:
1,v垂直制表和f换页符对屏幕没有任何影响,但会影响打印机执行响应操作。
2,n其 实应该叫回车换行。换行只是换一行,不改变光标的横坐标;回车只是回到行首,
不改变光标的纵坐标。
3,t 光标向前移动四格或八格,可以在编译器里设置
4,' 在字符里(即单引号里)使用。在字符串里(即双引号里)不需要,只要用 ' 即可。
5,? 其实不必要。只要用 ? 就可以了(在windows VC6 和tc2 中验证)。

4.键盘常用ASCII码
ESC键 VK_ESCAPE (27)
回车键: VK_RETURN (13)
TAB键: VK_TAB (9)
Caps Lock键: VK_CAPITAL (20)
Shift键: VK_SHIFT ($$10)
Ctrl键: VK_CONTROL (17)
Alt键: VK_MENU (18)
空格键: VK_SPACE ($$2032)
退格键: VK_BACK (8)
个人收集整理 仅供参考学习
左徽标键: VK_LWIN (91)
右徽标键: VK_LWIN (92)
鼠标右键快捷键:VK_APPS (93)
Insert键: VK_INSERT (45)
Home键: VK_HOME (36)
Page Up: VK_PRIOR (33)
PageDown: VK_NEXT (34)
End键: VK_END (35)
Delete键: VK_DELETE (46)
方向键(←): VK_LEFT (37)
方向键(↑): VK_UP (38)
方向键(→): VK_RIGHT (39)
方向键(↓): VK_DOWN (40)
F1键: VK_F1 (112)
F2键: VK_F2 (113)
F3键: VK_F3 (114)
F4键: VK_F4 (115)
F5键: VK_F5 (116)
F6键: VK_F6 (117)
F7键: VK_F7 (118)
F8键: VK_F8 (119)
F9键: VK_F9 (120)
F10键: VK_F10 (121)
F11键: VK_F11 (122)
F12键: VK_F12 (123)
Num Lock键: VK_NUMLOCK (144)
小键盘0: VK_NUMPAD0 (96)
小键盘1: VK_NUMPAD0 (97)
小键盘2: VK_NUMPAD0 (98)
小键盘3: VK_NUMPAD0 (99)
小键盘4: VK_NUMPAD0 (100)
小键盘5: VK_NUMPAD0 (101)
小键盘6: VK_NUMPAD0 (102)
小键盘7: VK_NUMPAD0 (103)
小键盘8: VK_NUMPAD0 (104)
小键盘9: VK_NUMPAD0 (105)
小键盘.: VK_DECIMAL (110)
小键盘*: VK_MULTIPLY (106)
小键盘+: VK_MULTIPLY (107)
小键盘-: VK_SUBTRACT (109)
小键盘: VK_DIVIDE (111)
Pause Break键: VK_PAUSE (19)
Scroll Lock键: VK_SCROLL (145)

个人收集整理 仅供参考学习
编码
2312编码
每个汉字 及符号以两个字节来表示。第一个字节称为“高位字节”(也称“区字节)”,第
二个字节称为“低位字 节”(也称“位字节”)。
GB2312编码适用于汉字处理、汉字通信等系统之间的信息交换,通行 于中国大陆;新
加坡等地也采用此编码。中国大陆几乎所有的中文系统和国际化的软件都支持GB 2312。
基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区
有94个位。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区
位码 。
编码
GBK是汉字编码标准之一,全称《汉字内码扩展规范》(GBK即“国标”、“扩 展”汉语拼
音的第一个字母,英文名称:Chinese Internal Code Specification)。
GBK编码,是在GB2312-80标准基础上的内码扩展规范, 使用了双字节编码方案,其
编码范围从8140至FEFE(剔除xx7F),共23940个码位,共 收录了21003个汉字,完全兼
容GB2312-80标准,支持国际标准ISOIEC10646- 1和国家标准GB13000-1中的全部中日韩汉
字,并包含了BIG5编码中的所有汉字
GBK 向下与 GB 2312 编码兼容,向上支持 ISO 10646.1 国际标准,是前者向后者过渡
过程中的一个承上启下的标准。
缺陷
当txt文档中一切字符都在 C0≤AA(第一个字节)≤DF; 80≤BB(第二个字节)≤BF 这
个范围时,notepad都无法确认文档地格式,没有自动依照UTF-8格式来。
当新建文本文档只输入“联通”2字保存 再打开时将是乱码,联通就是C1 AA CD A8,
刚好在上面地范围内,所以不能正常显现。
记事本默认是以ANSI编码保存文本文档 的,而正是这种编码存在的bug招致了上述怪
现象。假如保存时选择Unicode、Unicode (big endian)、UTF-8编码就正常了。此外,假如以
ANSI编码保存含有某些特别符 号的文本文档,再次打开后符号也会变成英文问号。
UnicodeUCS
e码、UTF
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码, 是统一码联
盟为了世界上大多数文字系统进行整理和编码。
个人收集整理 仅供参考学习
Unicode码扩展自ASCII字元集,使用全16位元字元集使得它功能表示世界上所有的书写语言中可能用于电脑通讯的字元、象形文字和其他符号。
Unicode码是一种国际标准编码 ,采用二个字节编码,与ANSI码不兼容。目前,在网
络、Windows系统和很多大型软件中得到 应用。
Unicode2.0后基本和ISO 10646规范保持一致.
UTF,是 UnicodeTransformationFormat的缩写,意为Unicode转换格式。如果UNI CODE
字符由2个字节表示,则编码成UTF-8很可能需要3个字节,而如果UNICODE字符由 4个
字节表示,则编码成UTF-8可能需要6个字节。
事实证明,对可以用ASCⅡ表示的 字符使用UNICODE并不高效,因为UNICODE比ASC
Ⅱ占用大一倍的空间,而对ASCⅡ来 说高字节的0对他毫无用处。为了解决这个问题,就出
现了一些中间格式的字符集,他们被称为通用转换 格式,即UTF(Universal Transformation
Format)。目存在的U TF格式有:UTF-7,UTF-7.5,UTF-8,UTF-16,以及 UTF-32。本文讨论UTF-8
字符集的基础。

和Unicode类似,ISO组织也在做同样的事情,ISO开展了 ISOIEC 10646项目,名字叫
“ Universal Multiple-Octet Coded Character Set”,简称UCS。
UCS有两种格式:UCS-2和UCS-4。顾名思 义,UCS-2就是用两个字节编码,UCS-4就是
用4个字节(实际上只用了31位,最高位必须为 0)编码。
后来,双方意识到时间上不需要2套通用的字符集,所以双方开始进行整合,到
U nicode2.0时,Unicode的编码和UCS的编码都基本一致。
3.编码标准
Unicode在编码上和UCS保持一致,在实现上有自己的规则,而UCS只定义了编码标
准。Un icode的实现形式上 有UTF-8,UTF-16,UTF-32,还有UTF-7等。UCS编码也有自 己的格
式:UCS-2和UCS-4等等。
Unicode的编码可以和UCS-2和UCS -4保持一致。但是又略有不同。UTF-16是UCS-2的
扩展,UTF-32是UCS-4的子集 。也就是说,UTF-16的实现上对code point的支持范围超过
UCS-2,而UTF-32对code point的表示却又在UCS-4的范围之内。
在编码层面上,UCS-2就是用两个字节编码,U CS-4就是用4个字节(实际上只用了31
位,最高位必须为0)编码。
-8编码
UTF-8(8-bit Unicode Transformation Format)是一种针对Unicode的可变长度字符编码,
又称万国码,现在已标准化为RFC 3629。
个人收集整理 仅供参考学习
标准UTF-8编码的文件是以0XEF 0X BB开头,如果读到该标志,则可以以UTF-8方式进
行UCS-2的转码。但是当程序读取部分内容 进行编码的时候则与UCS-2方式有很大的不同!
根据规范,采用UTF-8方式进行编码的字符可以 有从1到6个字节的不等长度。因此程序必
须从缓冲区末尾开始判断最后一个UTF-8字符出现的位置 ,以防出现只包含字符的部分内容
从而导致转码失败。
1. 编码规则
如果UNI CODE字符由2个字节表示,则编码成UTF-8很可能需要3个字节。而如果
UNICODE字符由 4个字节表示,则编码成UTF-8可能需要6个字节。用4个或6个字节去编
码一个UNICODE字 符可能太多了,但很少会遇到那样的UNICODE字符。
UTF-8转换表表示如下:
UnicodeUCS-4
0000 ~007F
0080 ~07FF
bit数
0~7
8~11
UTF-8
0XXX XXXX
110X XXXX
10XX XXXX
1110XXXX
0800 ~FFFF 12~16 10XX XXXX
10XX XXXX
1111 0XXX
1 0000 ~1F FFF
F
17~21
10XX XXXX
10XX XXXX
10XX XXXX
1111 10XX
20 0000 ~3FF F
FFF
10XX XXXX
22~26 10XX XXXX
10XX XXXX
10XX XXXX
1111 110X
10XX XXXX
400 0000 ~7FFF
FFFF
27~31
10XX XXXX
10XX XXXX
10XX XXXX
10XX XXXX
6
5
说明:此非unicode编码范围,属于UCS-4 编码
早期的规范UTF-8可以到达 6字节序列,可以覆盖到31位元
(通用字符集原来的极限)。尽管如此,2003年11月UTF-8
被 RFC 3629 重新规范,只能使用原来Unicode定义的区域,
U+0000到U+10FFFF。根据规范,这些字节值将无法出现在
合法 UTF-8序列中
4
Unicode6.1定义范围:0~10 FFFF
3
基本定义范围:0~FFFF
byte数
1
2
备注


实际表示ASCII字符的UNICODE字符,将会编码成1个字节,并且UT F-8表示与ASCII
字符表示是一样的。所有其他的UNICODE字符转化成UTF-8将需要至 少2个字节。每个字
节由一个换码序列开始。第一个字节由唯一的换码序列,由n位连续的1加一位0组 成, 首
字节连续的1的个数表示字符编码所需的字节数。
Unicode转换为UTF-8 时,可以将Unicode二进制从低位往高位取出二进制数字,每次
取6位,如上述的二进制就可以分 别取出为如下示例所示的格式,前面按格式填补,不足8
位用0填补。
注:Unicode转换为UTF-8需要的字节数可以根据Unicode 二进制的位数除以6来计
个人收集整理 仅供参考学习
算。
2. 实例

UNICODE uCA(1100 1010) 编码成UTF-8将需要2个字节:
uCA -> C3 8A
UNICODE uF03F (11110000 0011 1111) 编码成UTF-8将需要3个字节:
u F03F -> EF 80 BF
Unicode 16进制
CA
F0 3F
Unicode 2进制
1100 1010
11110000 0011 1111
bit数
8
16
UTF-8 2进制
1100 00111000 1010
0 00001011 1111
UTF-8 16进制
C3 8A
EF 80 BF
3. 缺点
-16编码
16位UCS转换格式,字节顺序由流中的前两字节中字节顺序标记来确定。
UTF-16比起UTF-8,好处在于大部分字符都以固定长度的字节 (2字节) 储存,但UTF -16
却无法兼容于ASCII编码。c#中默认的就是UTF-16,所以在处理c#字符串的时候只 能是
byte,stream等方式去处理
UTF-16是Unicode字符编码五层次模型的第三层:字符编码表(Character Encoding Form,
也称为 )的一种实现方式。即把Unicode字符集的抽象码位映射 为16位长
的整数(即码元)的序列,用于数据存储或传递。Unicode字符的码位,需要1个或者 2个
16位长的码元来表示,因此这是一个变长表示。
1.编码模式
UTF-16的大尾序和小尾序储存形式都在用。
一般来说,以Macintosh制作或储 存的文字使用大尾序格式,以Microsoft或Linux制作
或储存的文字使用小尾序格式。 < br>为了弄清楚UTF-16文件的大小尾序,在UTF-16文件的开首,都会放置一个U+FEFF字符作为Byte Order Mark(UTF-16LE以FF FE代表,UTF-16BE以FE FF代表),以显示这个文
字档案是以UTF-16编码,其中U+FEFF字符在UNICODE中代 表的意义是ZERO WIDTH
NO-BREAK SPACE,顾名思义,它是个没有宽度也没有断字的空白。
-16BE
16位UCS转换格式,最低地址存放高位字节。
UCS-2 Big Endia文件以0XFE 0XFF开头作为文件标记。当读取UCS-2编码的大文件时,
如果因为 内存限制而无法一次性将所有内容都读出来的话,就需要分批读取。
个人收集整理 仅供参考学习
UCS-2是长度固定的编码方式 (两个字节表示一个UNICODE字符),因此只要保证每次都采用偶数长度的缓冲区进行读取,转换就不会出现乱码。
-16LE
16位UCS转换格式,最高地址存放高位字节。
UCS-2 Big Endia文件以0XFF 0XFE开头作为文件标记。
4.常用字符
回车符:000D
换行符:000A
5.U
TF-16与UCS-2的关系

UTF-16可看成是UCS-2的父集。在没有辅助平面字符(surrogate code po ints)前,UTF-16
与UCS-2所指的是同一的意思。但当引入辅助平面字符后,就称为UT F-16了。现在若有软
件声称自己支援UCS-2编码,那其实是暗指它不能支援在UTF-16中超 过2bytes的字集。对
于小于0x10000的UCS码,UTF-16编码就等于UCS码。

犀牛是什么软件-英王陈玉成


simen-mms是什么意思


世界禁烟日-banger


地理知识大全-g店


sweaters-数虎


求黄站-竹海大观


原材料-汶川地震捐款排行榜


苯妥英钠的合成-sonor



本文更新与2020-12-10 23:17,由作者提供,不代表本网站立场,转载请注明出处:https://www.bjmy2z.cn/gaokao/479791.html

(精选)软件开发---编码方式的相关文章

  • 爱心与尊严的高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊严高中作文题库

    1.关于爱心和尊严的作文八百字 我们不必怀疑富翁的捐助,毕竟普施爱心,善莫大焉,它是一 种美;我们也不必指责苛求受捐者的冷漠的拒绝,因为人总是有尊 严的,这也是一种美。

    小学作文
  • 爱心与尊重的作文题库

    1.作文关爱与尊重议论文 如果说没有爱就没有教育的话,那么离开了尊重同样也谈不上教育。 因为每一位孩子都渴望得到他人的尊重,尤其是教师的尊重。可是在现实生活中,不时会有

    小学作文
  • 爱心责任100字作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任心的作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文
  • 爱心责任作文题库

    1.有关爱心,坚持,责任的作文题库各三个 一则150字左右 (要事例) “胜不骄,败不馁”这句话我常听外婆说起。 这句名言的意思是说胜利了抄不骄傲,失败了不气馁。我真正体会到它

    小学作文