N56*_* dH 10 format encoding file
我对文件,文件编码和文件格式的概念缺乏清晰的理解.谷歌帮助达到了一定程度. 从目前我了解,所有的文件是二进制的,也就是说,在这样的文件中的每个字节可以包含任何位的256个可能的字符串.ASCII文件(以及我们到达编码部分的地方)是二进制文件的子集,其中每个字节仅使用7位.
而这里的事情变得混乱了.文件格式似乎是解释文件中字节的一种方式,文件扩展名似乎是识别文件格式最常用的方法之一.
这是否意味着为ASCII文件定义的二进制文件和格式定义了格式?格式如xml,pdf,doc,rtf,html,xls,sql,tex,java,cs"引用"ASCII文件?而像jpg,mp3,avi,eps,obj,out,dll这样的格式是我们谈论二进制文件的线索吗?
Pab*_*ruz 10
我不认为你可以谈论ASCII和BINARY文件,但TEXT和BINARY文件.
从这个意义上说,这些是文本文件:XML,HTML,RTF,SQL,TEXT,JAVA,CSS,EPS.
这些是二进制文件:PDF,DOC,XLS,JPG,MP3,AVI,OBJ,DLL.
ASCII只是在计算开始时用于表示文本的字符表,但现在有点不鼓励,因为它不能用中文,阿拉伯语,西班牙语(带有ñ,Ñ,tildes的单词),法语等语言表示文本.和别的.现在鼓励其他CHARACTER REPRESENTATIONS而不是ASCII.最着名的可能是UTF-8.但还有其他像ISO-8859-1,ISO-8859-3等.看看这个文章乔尔斯波斯基在谈论UNICODE.这很有启发性.
文件格式只是另一个非常不同的问题.文件格式是程序同意的协议,用于表示信息.从这个意义上讲,JPG文件是一种具有某种(众所周知的)内部格式的图像,允许程序(浏览器,电子表格,字处理器)将它们用作图像.
文本文件也有格式(IE,有XML和HTML等文本文件的规范).它的格式,如JPG和其他二进制文件允许应用程序以连贯和特定的方式使用它们来实现某些东西:IE,呈现WEB PAGE(HTML和XHTML文件格式).