首先要承认标题只是个噱头,语言学一般认为语言没有先进落后之分。大家都有自己的看法,见仁见智吧。但是总看到有人在争论到底汉语是先进还是落后。虽然我不是专业人士,但是就用点通讯和存储上的概念来聊聊为什么汉语是一种非常先进的语言。需要注意的是,虽然以下的论证都是基于实际的实验数据,但是计算都很粗糙,而且实验的规模都不大。换句话说就是,虽然在这里汉语占优,但是换一批实验参与者,可能就倒过来了。现在实在没有什么特别全面的测试。所以下面的数字大家看看就行,不必太过认真。世界主要语言的效率其实都已经达到当前人脑的一个瓶颈了,总体看差异不大。我的目的也主要是打击一下逆向民族主义者。
一、语言水平高低的评判准则
口语,放在今天来分析,实际上是一种通讯协议。就是说,语言实际上是把人的思想通过发音器官变成一串频率不同、波形不同的声波,然后有另一个个体的听觉器官和相关的脑部组织重新转变回思想。通讯协议,就是一个规则,一个规定了应该如何把思想/信息转变为易于传输的信号的规则。计算机上,通讯协议基本上有这么两个评判标准:传输效率和抗噪能力。所谓传输效率,是说,在单位时间里,按照该通讯协议能够传输多少信息。所谓抗噪能力,是说这种通讯方式能够在多大的噪音下仍然保证绝大多数信息正确传输。
传输效率又有两个方面,一个是编码效率,一个是传输速度。编码效率是说,这个通讯协议能够把一个信息用多短的一串信号来表达。传输速度是说一段信号,能够以多快的速度传输。
评价一种语言的口语是否先进,就要分析上面这几个问题。
文字,则是一种数据存储方式。存储格式的要求与通讯协议不同。存储格式要求存空间小、读写速度快。相比于读取速度,书写速度是次要的。这是因为平均下来一次书写对应很多次阅读,而人在阅读文字上花的时间一般远远大于书写。尤其是现代社会,手写越来越少,计算机输入、打印、印刷都大大加快了记录文字的速度。而阅读速度却没有多少提升。因此在现代社会,阅读速度就在定义文字水平上占据了更重要的地位。
需要注意的是,下面的讨论中“音节”均采用西方语言学定义。粗略地讲就是一组连续元音与其前后的辅音共同构成一个音节。比如To、Bliss、Strength是单音节,汉语Ba、Chuang也是单音节。虽然单音节词的发音长度并不完全相同,但至少是可比的。
二、语言的分类
这个世界上的语言大致分为两种,一种叫做分析语(或称孤立语),一种叫做综合语(其下又划分为黏着语、屈折语等子类型)。简单地说,综合语可以通过改变词的形态来表达不同的意思。而分析语则单纯通过词与词之间的关系来表达不同的意思。
我们举个简单的例子:
中文(分析语):我昨天告诉他了。
英文(综合语):Itoldhimyesterday。
英文你首先可以看到told和him两个变形。其中把tell变成told表示过去发生的动作,把he变成him表示客体。而中文用昨天来直接指明时间,如果不指明时间则需要用“已经”、“过”之类来表示过去,而并不改变词的形态。中文还通过各自的位置来体现谁是主体谁是客体。
实际上,英语已经是综合语中非常接近分析语的了。比方说英语的未来时态用的词形和一般时态没有区别。而很多其他语言中不同的时态都是用不同的词形来表达的。再比方说英文对于各个词的位置有明确的规定。而很多其他综合语,诸如拉丁语中,词的位置可以不固定。换句话说就是可以说出这样的句子:HimyesterdaytoldI。然后通过词形里的主格词形和宾格词形来判断究竟是谁告诉了谁。
这是非常糟糕的,因为在读取的时候,总是有先后的差别。我们希望的读取顺序是:先读取我们的大脑需要先处理的部分。分析语天然就有这种优势。很多综合语在逐步的发展中也确立了类似的规则,比如拉丁语的后裔之一——法语。
上古古汉语也曾是一种综合语。但是由于汉字的限制,古汉语的词形变化仅存在于口头中。比方说文言文中的使动用法,如“文王以百里之壤而臣诸侯”中的臣(使臣服),在上古时期,是需要在汉字发音前加“s-”音来标识的。这就是一个典型的综合语的词形变化。
有人认为现在的汉语仍然带有一定的综合语色彩,他们认为加入诸如“了”、“的”这种助词实际上就是词的变形。这种看法就只能见仁见智了。
从整体发展趋势来看,世界各地的口语都是从综合语向分析语发展。虽然不能说分析语就一定优于综合语。但是这个趋势说明分析语的某种特性符合历史的发展。这个优势就是数据的压缩。
三、数据压缩:分析语的高超之处
当年计算机发展到了新的时代,人们开始研究如何在计算机