Chapter1 文字和语言 vs 数字和信息
2018-02-22 21:36
232 查看
1、不同的文字系统在记录信息上的能力是等价的。进一步讲,文字只是信息的载体,而非信息本身。
2、信息的冗余是信息安全的保障。罗塞塔石碑上的内容是同一信息重复三次,因此只要有一份内容完好保留下来,原有的信息就不会丢失,这对信道编码有指导意义。
3、语言的数据,我们称之为语料,尤其是双语或多语的对照语料对翻译至关重要。
4、对于不同位数数字的表示,中国人和罗马人都用明确的单位来表示数字的不同量级,中国人是用个十百千万亿兆(兆本身又有两个含义:百万和万亿);罗马人用字符Ⅰ代表1,Ⅴ代表5,Ⅹ代表10,L代表50,C代表100,D代表500,M代表1000,再往上就没有了。这两种表示法都不自觉地引入了朴素的编码的概念。首先,它们都是用不同的符号代表不同的数字概念;第二,它们分别制定了解码的规则。在中国,解码的规则是乘法。200万的写法含义是2×100×10000;而在罗马,解码的规则是加减法—小数字出现在大数字左边为减,右边为加。比如ⅠⅤ表示5-1=4,ⅤⅡ表示5+2=7,ⅡⅩⅩ表示20-2=18。这个规则不仅复杂,而且很难描述大的数字和分数。
5、在通信时,如果信道较宽,信息不必压缩就可以直接传递;而如果信道很窄,信息在传递前需要尽可能地压缩,然后在接收端进行解压缩。
6、犹太人发明了一种类似于我们今天计算机和通信中校验码的方法。他们把每一个希伯来字母对应于一个数字,这样每行文字加起来便得到一个特殊的数字,同样对于每一列也是这样处理。在抄写《圣经》时,要检查每一行,每一列的校验是正确。
7、如果说从字母到词的构词法是词的编码规则,那么语法则是语言的编码和解码规则。
Reading notes —— The beauty of math. 2018/2/22
2、信息的冗余是信息安全的保障。罗塞塔石碑上的内容是同一信息重复三次,因此只要有一份内容完好保留下来,原有的信息就不会丢失,这对信道编码有指导意义。
3、语言的数据,我们称之为语料,尤其是双语或多语的对照语料对翻译至关重要。
4、对于不同位数数字的表示,中国人和罗马人都用明确的单位来表示数字的不同量级,中国人是用个十百千万亿兆(兆本身又有两个含义:百万和万亿);罗马人用字符Ⅰ代表1,Ⅴ代表5,Ⅹ代表10,L代表50,C代表100,D代表500,M代表1000,再往上就没有了。这两种表示法都不自觉地引入了朴素的编码的概念。首先,它们都是用不同的符号代表不同的数字概念;第二,它们分别制定了解码的规则。在中国,解码的规则是乘法。200万的写法含义是2×100×10000;而在罗马,解码的规则是加减法—小数字出现在大数字左边为减,右边为加。比如ⅠⅤ表示5-1=4,ⅤⅡ表示5+2=7,ⅡⅩⅩ表示20-2=18。这个规则不仅复杂,而且很难描述大的数字和分数。
5、在通信时,如果信道较宽,信息不必压缩就可以直接传递;而如果信道很窄,信息在传递前需要尽可能地压缩,然后在接收端进行解压缩。
6、犹太人发明了一种类似于我们今天计算机和通信中校验码的方法。他们把每一个希伯来字母对应于一个数字,这样每行文字加起来便得到一个特殊的数字,同样对于每一列也是这样处理。在抄写《圣经》时,要检查每一行,每一列的校验是正确。
7、如果说从字母到词的构词法是词的编码规则,那么语法则是语言的编码和解码规则。
Reading notes —— The beauty of math. 2018/2/22
相关文章推荐
- 数学之美札记:文字和语言 vs 数字和信息
- 文字和语言vs数字和信息
- 《数学之美》 第1章 文字和语言VS数字和信息&第2章:自然语言处理
- 《数学之美》(吴军 著)读书笔记:第1章 文字和语言 vs 数字和信息
- 《数学之美》(吴军 著)读书笔记:第1章 文字和语言 vs 数字和信息
- 易语言数字指令编程大全(发送信息代码数据集合)
- 易语言数字指令编程大全(发送信息代码数据集合)
- 《数学之美》一 文字、数字及语言的历史
- 易语言发送信息代码数字指令编程整理
- 《数学之美》第一章脑图:文字,数字与信息
- ASP.net验证码(C#语言),含多种模式(文字,数字,字母等)
- 一段易懂的Java语言学生信息管理代码
- 以软件开放平台化解数字家庭的<信息孤岛>
- 为什么计算机语言中的变量名都不能以数字开头呢?
- [Python] 解释型语言 VS 编译型语言
- c 语言中混合输入字符和数字( c primer plus 中的程序 )
- chapter 6 系统数据文件和信息
- 剑指Offer:和为 S 的两个数字 VS 和为 S 的连续正数序列
- codevs 4511 信息传递 NOIP2015 day1 T2
- Python 语言及其应用 Chapter_5_Note_5 标准库杂项