语言学(上 - FULL) - Oxford 通识读本线上阅读活动
时代的症结在自信心。
年轻人自信心越少,胆量就越少;胆量越少,能做的事情就越少。
来翻转电台,用知识充实你对周遭世界的了解,培养你的安全和自信心。
来翻转电台,用知识充实你的自信,通知识充实你对周遭世界的自信心,用知识充实你对周遭世界的自信心。
事实上,语言是直接编制这个意义之网的材料。
所以说我们,比如说我们从文学批判,从社会学领域开始对这些意义进行理解。
但是,维特根斯坦之所以伟大(我们之前也介绍过维特根斯坦,对吧),就是因为他开始对这个构成意义之网的材料,这个语言进行详细的分析。
当然,不仅能够从哲学方面来进行分析,透过语言学的角度呢,依然可以对语言问题进行分辨。
所以,今天我们就是从这个角度来聊一聊这个话题。
今天我们大概分成三个部分啊。
第一部分讲熟视无睹的语言现象,我们来列举一些和语言有关的现象。
很多现象是我们之前要么是我们忽略的,要么是我们所不知道的。
透过这些现象的我们可能对语言本身有更深的了解。
那第二部分呢,讲语言起源问题。
那第三部分呢,讲语言学研究什么,就大概对语言学的这个范畴和语言学的视域呢,有一定的了解。
所以今天大概是这一部分。
那么,下一周下的部分呢,我们对语言学里面的某一些具体的理论,包括索旭尔的和乔姆斯基的理论能够做更深的一些介绍吧。
那还有个最最重要的问题呢,就是讲语言与思考,就到底语言与我们的思考具有什么样的关系,我们好好分别一下。
那虽然这期还是顶着这个牛津通识读本这本小书的这个基础上讲的,但其实这可能是跟书关系最远的一次了。
今天里面基本上内容跟那书都没什么关系,都是我自己重新组织了一下的。
好,我们现在就来进行第一部分,就熟视无睹的语言现象。
对于某一个现象,我们熟视无睹,其实已经是我们第三次遇到这样的问题了。
在我们介绍海德格尔的时候,其实接触过一个问题,就柏拉图对于存在问题的看法。
就是讲起什么东西存在,或者讲什么东西是什么。
我们每天都在说话,我是谁?你是谁?这是什么?那是什么?
我们讲是讲的非常非常多,但如果要停下来问我们一句,到底怎么样算是,怎么样才能够是,一个东西是什么?
到底是由什么的原因导致它是什么的?
就这样的问题,我们一下就显得茫然无措了,根本不知道该怎么回答。
第二次遇到这样的问题,是在量子理论的时候。
我们讲奥古斯丁在忏悔录里讲到,时间就是这样的一个对象。
就我们说时间,我们大概都对时间很有领会,包括你在考试的时候,你知道时间快到了,你要加快一点。
你每天,如果你在一个需要考勤的公司上班,每天早晚上班下班,你都在面临的时间。
包括你可能还听过一些关于相对论的直言片语,对时间的分辨。
但如果要真的问起来,什么是时间?什么是时间意识等等问题?你又不知道怎么回事了。
就语言与存在或是与时间,这种感觉非常像。
我们现在在用语言,我在用语言说,你们在用语言听。
你每天使用语言,跟人沟通和交流。
但如果我们要真的停下来问,到底什么是语言?为什么能够有语言?语言到底为什么能让我们理解?
这样的问题呢,我们就完全不知道该怎么办了。
但是怎么样能够促使我们去想一些熟视无睹的问题呢?去想一些这么复杂的问题呢?
其实之前我们在很多次的知识分享里面,也大致接触过这样的东西。
假设我们就从这个,从这门的一次知识分享的角度来讲了,你很难理解。
因为如果从你最熟悉的语言现象,你每天和人说话来讲的,你是很难从你最熟悉的事情,去分析一个你这种熟视无睹,或者说你相当陌生而模糊的现象。
就恰恰对于这种问题的分析呢,从边缘地带开始。
就是我们总是可以从边缘的语言现象,来认识语言,就像福科研究社会,就是从边缘的社会现象,开始认识社会。
但是,边缘的语言现象啊,其实是个很难的事情。
因为本来语言就是生活中几乎无处不在的一个要素。
所以说,我们到哪里去找边缘的语言?到哪里去发现边缘的语言现象呢?
那么,至少我们今天有这么几个角度来引入。
那第一个角度,其实是从我们对语言的想象开始。
在某些特定的情况之下,我们必须去构造和想象一种新的语言。
这就不得不说到去年的一部电影,就是语言学这个话题,在去年因为这部电影呢,被主流的可以说媒体的环境或者公共舆论环境,大大的提了一次,就是《降临》。
当然,为了避免今天群里有同学还没有看过这个电影啊,我大概把脉络说一下,花非常非常短的时间。
大致就是说呢,突然有外星人降临地球,然后人类开始与外星人进行接触。
那么,这些外星人呢,再使用一种(一会儿我们会详细看),一种图形文字,来与人类进行接触。
为了详细的理解外星人来的意图,那么人类不得不派出了,在以前科幻片里面出现很少的语言学家,进入到这个跟外星的沟通过程。
那么这个语言学家,开始跟外星人进行持久的交流,开始熟悉并且理解这样的图形文字。
那么之后呢,涉及到一些危机的那部分,那跟今天分享的内容可能没有那么大的关系,我们就不很详细的来说。
大致你知道这是一个人类去了解一种与人类现行语言完全无关的语言,这么一个故事。
当然,在去年结束之后呢,让很多学习语言学的人很振奋。
当时有很火的文章,就大概是说,这是一部语言学电影,他为文科生呢,出了一口气。
当然呢,也有很多研究语言学的人说呢,这是语言学被黑得最惨的一次,而且语言学呢,绝对不是文科学科,语言学呢,是一个理科学科,它是相当科学的。
这些争论,包括语言学为什么科学和语言学科学化的问题,我们也会涉及到。
事实上,在上一次科学革命下的时候呢,讲什么样的学科被科学化,我们里面就拿语言学举了例子的,今天我们会再回到这个例子去讲一讲。
那么,《降临》呢,其实掀起了这么一个语言学的关注。
但这里面就有一个很重要的话题了,因为这个电影不是真的我们跟外星接触的吧,是一部很有名的短篇小说,是一个华裔的科幻小说家撰写的。
也就是说这里面被发明出来的这个外星语言依然是人发明的。
所以说,今天第一个视角就是我们看人如何发明一种非人的语言,我们从这里面可以大致看出来语言的基本结构和样貌,其实这是一个很有意思的话题。
那么,我们大概知道啊,因为我们又学汉语又学英语,其实特别好,我们已经横跨了两种语系。
那我们大概知道英语呢,它是这种用字母构成的语言很多,包括西班牙语啊,意大利语俄语,跟这个都很像。
但汉语构成呢,是完全一种不同的状态,包括我们之前不管是我们之前那种象形文字啊,直到今天我们这种汉字的系统都不一样。
但是,《降临》之中的外星人语言呢,跟这些又都不一样,或者说你会认为它很可能跟汉语有非常相似的地方,所以我们来看一下。
那大概是一种什么样的文字啊,《降临》之中的外星人文字呢,大概就长这样,很像是类似于水墨画,或者用墨写,用我们的毛笔写出来的某种东西啊,它完全不是由字母构成的。
但你要说它是不是有字形呢?其实也是。
那么,虽然这种墨迹啊,看起来是没有什么规律可循的,但事实上在电影里面呢,它恰恰就是由这种墨迹构成这种文字。
所以说,这个墨迹上面触角产生的方向和触角与触角的结合呢,所以这个我们所想象和构形出来的外星文字,依然是由单词构成的。
也就是说,你在这么一个由这个外星的触手啊,喷出来这个墨迹之上呢,你是能看出一个或者多个单词。
其实从这个角度呢,我认为这种外星文字啊,跟汉语其实没有什么大不同。
我们可以这样想象啊,假设因为汉语其实虽然是每个字都不一样,但它也是由一些要素构成的,对吧?
比如说我们有偏旁步手,那偏旁步手之中呢,它也是由某一些笔画在一定顺序之下构成的。
假设我们现在定义啊,某种偏旁步手为某种触手的情况,比如说王字旁呢,就是往左边伸出两条短的这个墨迹,而木字旁呢,就是向右边伸出三条长的墨迹。
我们把不同的笔画也变成这样的一种规则的话,那事实上你是可以把汉语直接转译为一种另外一种形象的文字,对吧?
你甚至都可以有一种一一对应的关系啊,你构建一个打输入法,里边可能有一些你的规则啊,所以我们打汉语的跳出来的就是这样一种新的墨迹文字,这是可能的。
也就是说,那虽然电影里面似乎构建了一个和人类文字啊,完全不一样的外形文字,但你要从底层的逻辑上呢,它其实是一样的。
也就是说,这个文字呢,是由单词构成句子构成的,那人类的语言也是一样,它是由单词构成句子,因此来表达不同的意思来构成的。
当然,你们可能听到这会觉得这有什么稀奇的,单词构成句子这再平常不过了。
但恰恰的它很不寻常,在这一点上,它就与除了人类以外所有生物使用的信号语言呢,有本质的区别。
那这个东西我们讲到后面还会更详细的讲。
那我们现在来讲这个语言,也另外一个很好玩的一个方向,这个电影里面还有一个情节啊,就是说这个外星人呢,是可以预测未来的,他为什么可以预测未来呢?
就是因为他使用这种语言。
那么,在这个电影的情节之中啊,女主人公由于跟这个语言学家啊,由于和外星人学习这个语言呢,因此他也掌握了预知未来的能力。
那这个有一个著名的假说,在电影里面也提到这个假说,就是沃尔夫撒皮尔假说。
这个沃尔夫撒皮尔假说就是在去年这个《降临》上映的时候啊,网上很多,你们如果看过文章呢,应该都看过,但你们极大可能就不记得啊,这个假说听起来很有道理。
这个沃尔夫撒皮尔假说就是说,语言会决定人的思维方式,你使用什么样的语言,你就会用什么样的思维方式。
跟这个类似,有这种类似感觉意义的话,大概是这样的,比如说我们认为德语或古希腊语才可以用来进行哲学思考,汉语和英语呢,是很不容易来谈哲学的。
那这两种观点呢,都有很类似的一点,就是仿佛语言跟思维有一一的对应关系。
当然这个问题呢,就相当相当复杂了,我们会慢慢用一些例子,慢慢用一些分析来切近它。
但我们就从电影里面的这个假设来讲啊,就这个外星语言凭什么可以预测未来?
虽然这听起来很没有道理啊,或者听起来完全不合逻辑,但电影里面呢,给出的(当然,虽然给出的绝不是一个科学的解释啊),但给出的也是一个还挺好玩可以去想一想的解释。
这个解释是这样的,为什么人类的语言不可以用来预测未来?
也就是说,人类的语言如何限制了我们的思维方式呢?
就是因为在这个剧作家看来啊,人类的语言是一种一维的单向语言,就是说我们的语言是有顺序的,我们的语言呢,非常讲究句序,就是句子里面的前后顺序呢,跟语言的关系很大。
第二,我们的语言呢,内建了一种单向的时间关系,就我们学英语,你感受更多啊,因为因为这个很有意思啊,我先来讲讲为什么我们一说到这个时态啊,我们对英语感触更深呢?
包括英语有过去是,现在是,未来是。
汉语并不是没有时态,而是汉语是我们的母语,我们学汉语的时候呢,不怎么学语法,我们小时候由于母语是汉语,我们自然就知道了汉语的语法。
所以对于一个从小使用母语是英语的人呢,也未必对英语的实态语法啊,比我们有更深的认识。
所以这是一会儿我们会讲,学习语言也是很有意思的事情。
既然语言有这么多规则,但仿佛我们学习母语的时候呢,又根本没有接触这些规则,我们就自然会了。
那为什么会自然会呢?这个问题大家也需要解释。
OK,我们回到《降临》的这个问题啊,就是由于人类操执一种一维的单向语言,所以说人类在时间上呢,被这个语言禁锢住了。
我们的思维呢,就只能沿着一个线性的时间往前往后走。
在这个剧作家认为啊,这个外星的语言呢,就没有顺序,也就是说这个外星喷出这个墨迹啊,这个墨迹词汇的前后顺序,并不影响你这个句子的意思,它是二维的。
也就是说,比如说这个句子由六个词构成,你一眼同时看到这六个词,而不是一个前后的关系,在这个情况之下呢,你就能够不依赖一种时间的前后顺序来理解意义,因此呢,你就不必被束缚在单向的时间之内。
当然,这仅仅是语意上的一个逻辑啊,我认为我们可以细细来想一下,什么叫做人的语言有时序?
就比如说这样的一个句子,人咬狗,狗咬人,对吧?
不同的顺序呢,这个句子的意思就完全不同,也就是说到底是人咬狗,还是狗咬人呢?
这当然相当的重要,对吧?
这个是不可能搞混的。
但是,我们真的就据此认为,人的语言就一定有时序吗?是不是这种语言的顺序是不可打破的呢?
我们现在假设一个这个例子,假设这个咬这个动词啊,我们做一个区分,我们把它给一个规则,区分为两种咬,我们把它区分咬A和咬B。
咬A呢,是人的动词,就只能用来形容人的动词,那咬B呢,是非人的动词,它用来形容非人的动作。
那么现在我们把“狗咬人”这句话呢,如果你叫做“狗咬A人”,由于咬A是人的动词呢,那这句话就有语法的错误了。
那么也不是有语法的错误,它就“人咬狗”了,对吧?
我们现在就用咬B这个词啊,那就是“狗咬B人”。
那在这种情况之下呢,其实你无论如何打乱语序,它其实都是有道理的。
比如说,你可以叫“人狗咬B”, “狗人咬B”,“人咬B狗”,由于咬B这个词呢,仅仅能够来形容非人的动作,它是非人的动词,所以说不管这三个字怎么组合呢,最后的意思一定是狗把人咬了,而不是人把狗咬了,对吧?
假设我们能用这种方法去界定,为我们的语言生产一些新的规则,假设它Work,就你会认为,就因为刚才我们发明了咬B,我们就以一种什么样的全新的视角来看待我们的语言了吗?
其实好像没有,对吧?
好像这个“狗咬B人”、“人狗咬B”好像并没有因为我们这么去说呢,我们就摆脱了某种时间的束缚啊。
当然你可能认为这是仅仅是一个例子啊,这个例子太少了,我们如果多一些例子,如果我们语言的规则根本性的改变呢,我们是不是可以在时间上来回走啊,可以预测未来呢?
但这个这个这个,如果你有基础的科学知识,你应该能理解它不太可能啊。
但我想说的是呢,你看我们在构造一种跟我们完全无关的外星语言,但是呢,其实这个语言的整体规则和内容与人类使用的语言呢,几乎没有差别。
从这点上,我们应该可以看出某种我们思维的边界,就是如果你要构造一种这个语言跟人,我们现有的语言完全没有关系,它完全不是这个逻辑,甚至说我们就说底层逻辑,它不是由词构成句子,由句子表意来构成的,这个是很难想象的。
就在我的这个认识之中呢,我们还没有尝试发明过这样的语言。
因此,人一定是由词构成句,由句表意,这么一种方法来理解和使用我们的语言的。
就我们现在还可以举一些别的在这个电影和文学作品之中人造语言的例子。
那上面这个图呢,是英剧Doctor Who里面的一种人造语言,叫Galifrian语。
这个Galifrian语,写出来啊,你会认为它跟人,跟人用的语言啊,没有关系,就它写出来是图形的,这个图形画出来呢,相当有美感,就像是某种行星系统一样啊,你会觉得写成这样,这个人有什么关系啊?
但其实呢,它的内在逻辑也是一整套从这种拉丁字母语言演化过来的。
因此,在一个大的圆里面,一个小的圆,它是一个实心圆,还是空心圆,处在什么位置呢?
其实就代表了一个英文词汇本身的字母结构和字母的构成,包括它的前后顺序。
也就是说,我们发明了一种将英语单词里面不同的原因抽取,抽取出来变成一个图形的方法,构造在这个圆环里面,形成这么一个看起来虽然跟人的语言完全不一样,但其实也是人的语言。
所以说,在英语词汇发明的这种人造语言里面呢,就会有这么一种很典型的情况,一个是从字母来发明,比如英文有26个字母,但如果你26个字母一一对应变成一种外面的语言呢,好像就太简单了,对吧?
就没什么意思了。
所以你可以就是一般我们比如写小说啊,他们都会这么做啊,我们把一些固定的搭配变成一种单独的字母来看待呢,它看起来有意思的多。
比如说我们把拉丁话的词坠的结尾,就是表名词的那个结尾,T-I-O-N,就station后面的T-I-O-N,我们把T-I-O-N变成单独一个字母,那它写出来跟英语就很不一样。
比如说我们把S-A,sensation前面这个S-A,因为很多单词前面都是S-A打头的,或者ST啊,Stay啊,Station这样的,我们把ST单独变成另外一种字母呢,它写出来跟英语就很不一样。
因此很多很多这种人造语言都是这样构造的。
就比如说大家其实很熟悉,就是JR Tolkien在魔戒里面构造,它构造两种语言,就是矮人语和精灵语,都是它发明的。
那发明出来呢,你就是把英语做这样的转译。
所以这种语言基本构造出来呢,就还是一种字母构成的文法。
它只是你把英语跟它做这种,不仅是26个字母,把一些固定搭配也发明出来,做一种对应关系,然后给它配上一个读音,就变成一种新的语言了。
所以虽然这种语言看起来相当优美,然后跟人的语言看起来很不同,但实际上呢,它跟人的语言的相似程度还要大于《降临》里面的那种语言。
当然,原因是因为《降临》里面是个很粗糙的假说啊,《降临》里面现在它还没法跟我们现实世界单词做一对应,但比如JR Tolkien或者Doctor Who这种呢,它已经发明到能够跟现实写法做一对应了,所以它看起来跟人的语言的关系就会更近一点。
那么以上呢,是我们观察到了这样的一种语言现象,就是我们人尝试去构造一种跟人的语言无关的语言,不管它是奇幻小说里面非人种族的语言,还是科幻小说里面外星人的语言。
但我们其实发现,我们怎么构造呢?它的内在逻辑与人的语言呢,都非常非常像。
也就是说,我们无法想象一种与我们的语言完全无关,完全不在一个规则之上的语言,这个问题超出了我们理性和我们想象力的能力。
那这点说起来你会认为,这是人的界限,是人理性的边界。
但反过来,有另外一种理解的方法,如果你们还记得我们在黑格尔分享里面讲到黑格尔对意识结构的那段精妙的分析,我们就能知道黑格尔那会儿的主张是什么。
黑格尔主张,任何有意识的生物(不管他是人,是外星人,还是哪天海豚进化,他有人的意识),他都会遵循这么一个结构。
他认为呢,这就是整个宇宙意识的基本结构。
那么也有很多人认为,就是比如说乔姆斯基就会认为,任何人(不管是人,外星人,还是海豚哪天进化到能够发展出语言了),他都会遵循这样的语言结构。
也就是说,这个语言结构只能这样,并不是人的边界和人的有限性,而是如果要发明一套符号系统来表异和交流,他就只能是这样。
好,我们现在来看另外一个例子,他也来自于电影,但不是我们发明人造语言,但他包含了我们发明人造语言,但他是一个仅仅比语言本身更复杂一点的现象,就他来源于最近的很火的一个电影,但其实没有太火,最近最火的应该是《边境杀手2》,最近还有刚刚火过一点,就是那个《异形:契约》。
那《异形:契约》的上一代是那个《普罗米修斯》,里面有这么一个现象。
在电影里面有一个主人公,是一个人造人叫David。
这个大概是一个星际殖民,然后遇到异形的故事,就是细节的不表了。
那么在飞船上,其他人就冷冻了,就我们对于星际殖民的想象就是人由于寿命有限,所以就进入冰冻舱,就冰冻起来了。
那这个人造人,他是永生的,他无所谓,他就在船上,在船上他就在学习一种,不光一种了,他学习了很多种人类的语言,包括我们在非洲的语言,远古的一些语言,这个David都学会了。
因此,到达了外星人的星球上,David有一项很重要的任务,就是去解释和破译外星人的语言。
甚至这个剧里面有一个人物,他们最后当然见到外星人了,就外星人直接说话,David就能够做现场的翻译。
David能够听懂外星人话,翻译成英语,也能把人的英语呢,翻译成外星的语言,而且是spoken language,能够讲得出来的,直接讲给外星人听。
OK,那电影里面的现象大概就是这样,那我们现在要想一个问题。
第一,David学习的语言全是人的语言,是人类各种各样的语言,汉语,非洲的语言,英文,其他欧洲的语言。
David到这个外星球呢,并没有外星人教他任何东西,他仅仅看到了类似于壁画一样的文字描述,就是外星人建筑的墙上有很多符号吧,很多可能符号。
David光看这样的符号,很快就学会了这个语言。
那么现在想说的是,这个可能吗?
我们知道我们小时候学语言呢,有很多的指导,你虽然家长的指导跟语法没有关系,但家长就是这样教你的,就那个东西叫桌子,然后你就叫桌子,你介绍一个信号,那是桌子。
那么在David看到啊,就是纯的符号,就像现在没有任何人教你,有人给你一个日语吧,韩语吧,有人给你一本韩语书就能放在你面前,没有任何其他的指导,然后你就光观察这个韩语书本身,你就看懂了韩语,这可能吗?
我们知道异形系列呢,其实是一个相当严谨的科幻系列,他的背后的推顿呢,包括他自己在剧情上的衔接呢,大致不会犯太大的错误。
因此呢,对这个问题的解释其实相当有趣,就David为什么可以就这样学会外星人的语言。
在电影里面给出的是一个这样的解释,这个解释真的是非常非常有意思。
如果不是做这次知识分享的话,我也不会去搜,不搜的话我也不知道这个电影背后他们居然做了这么多的努力和工作,来构建这么一个语言。
这个呢,是2012年跟着这个电影出版的一本书,叫做A Grammar of Modern Indoor European Promythus Edition,就是现代印欧语须语法,普罗米修斯版本。
因为在这个电影里面呢,我们人啊,是这个外星人的造物,因此在电影的系统里面认为外星人不仅创造了我们,我们的语言呢,也是被这个外星人所影响的,这个语言呢,就是印欧语系。
今天我们到后面会详细的讲印欧语系啊,在我们介绍语言学家到底语言学生干什么的时候,就印欧语系在里面是很重要的一块内容。
那么在电影里面就认为,首先是这个外星人创造了我们,并且把他们的语言以古印欧语的方式交给了我们。
因此David在这个船上啊,学习的所有都是印欧语系的语言,因此他是学习了这个印欧语系之后所有的变种,而这个外星文字呢,其实就是他学习所有变种的祖先,因此他可能很快就认出了这个语言。
那在逻辑上呢,相当不错,就是这个电影,而且这本书很厚啊,这本书200多言,就详细的讲这个普罗米修斯这个语言的语法,以及跟现代英欧语系各个比如包括英语啊,俄语啊,语法对应的关系,包括跟读音的关系都很多啊,所以他们真的是相当相当的严谨,这也是找语言学家来编的。
那么从这个逻辑上呢,就相当相当有说服力了。
也就是说,如果我们能够想象(我们就不用说外星语言了),如果我们想象一个人啊,精通世界上所有印欧语系的语言以及语法,现在呢,直接给他鼓印欧语,但现在我们没有考古材料啊,因为时间太久远了。
假设我们有,我们有鼓印欧语的东西直接让他看,他有没有可能反向直接破语出那个语言呢?
是相当相当有可能的。
而这个破语大概是什么样的呢?
我们可以从我们现在每个人都可以感受到的我们接触外邦语言的这个方式上来感受出来。
也就是说,在我们看韩语电影啊,或者我们跟韩国人交流的时候,我们会非常高频的发现韩国人在非常高频的说“斯密达”。
包括我们现在在戏谑韩国人的时候,我们也很喜欢说“斯密达”。
如果你不懂韩语的话呢,你其实并不知道“斯密达”是什么意思。
但是你看,这是一个最基础的,我们能够通过它的重现,它的反复出现,来意识到这个词汇的存在。
因此我们很容易感受到韩语一定有一个词,这个词的单元就叫做“斯密达”。
接下来,即使你看一个没有中文字幕的韩文电影,你也很容易听出里面有两种句法。
一种呢,是问句。
这个全世界所有的问句呢,都有一个特征,也不能说所有了,因为我也不知道全世界所有的语言,但大概呢,大概的问句都有一个这样的特征,就问句的尾音呢,会上扬来表示疑问,不管汉语啊,英语啊,韩语都是这样。
所以如果你稍微多听一点点,如果你有语言学的思维的话,我们今天就慢慢通过这些例子来介绍,你会发现哦,语言学就是研究这样的一些东西的。
你就会慢慢发现,凡是一个人在说一句你听不懂的韩语,如果尾音上扬,包括他的神态明显是问句的时候呢,绝大多数情况之下,他是没有“smida”的。
但是他在说一个听起来像是陈述句的时候呢,绝大多数情况之下,后面都会有“smida”。
这就是为什么“smida”这么高频出现的原因。
你慢慢就会发现,虽然你不能肯定,但你至少可以构建“smida”跟陈述句之间有关系。
事实上在韩语里面,“smida”就是陈述句的句末的一个词汇,就是表示这个句子是陈述句,后面就会出现“smida”。
那么虽然仅仅从这个例子里面,仅仅从这样直接面前,你可能看半个小时的韩语电影,你还没有办法完全理解它的意义,但你至少能做到的是构建它与陈述句之间的关系。
所以说你可以想象,如果一个人熟悉印欧语系的所有语言,他在接触古印欧语的时候呢,他一旦有办法识别出来里面重复出现的单元,就能够通过其他东西来猜测这个单元的意义。
因此David很可能就通过这个,当然他脑力可能运算速度极快,跟AlphaGo一样,他很快就破译了这个Engineer工程师,这个外星人种族的语言。
我们再举另外一个例子,就是如果你去阿拉伯地区呢(当然现在有很多韩剧可以看,但阿拉伯电影挺少的),你可能没什么机会看阿拉伯电影。
如果你去阿拉伯呢,你经常会听到阿拉伯人说“habibi”,他的出现频率相当相当高,而且不像“斯密达”,“斯密达”一般出现在一个句子的句末,什么什么什么什么“斯密达”,但“habibi”这个词呢,在阿拉伯语几乎你会发现他出现的句子的各种地方。
有时候句子是以“habibi”开头的,有时候他说到一半说“habibi”,有时候他在结尾的时候呢,说“habibi”。
所以在这种情况之下,你可能很难去辨识他是什么样的意思啊。
但是呢,有另外一种情况,你就应该能够挺容易辨识出来他。
也就是说,如果你是一个男性,你去到阿拉伯地区呢,如果你单独去啊,你跟很多人说话(当然在阿拉伯地区,你几乎跟你说话都是男性啊,因为女性都都很保守,都在家里也不怎么出门),你就会经常听到人跟你说“habibi”。
但如果你是个女性自己去阿拉伯地区呢,你可能也跟很多人说话,但其实你听不到别人跟你说“habibi”。
因此如果是一男一女单独去阿拉伯地区旅行,这个男孩回来可能会说,阿拉伯语真的太有意思了,为什么大家这么高频的使用“habibi”?
但这个女孩就会觉得,不是啊,我怎么没怎么听说他们给我说“habibi”?
因此呢,你就算不明白这个词的实际意思,你也大概能够猜测的出来,他一定与某种性别相关,而且既然是在跟你对话时候老提这个词呢,他总不至于指的是男性的服装或者胡子吧?
对吧?
他大概呢,就是一种男性的称谓。
所以“habibi”就是在阿拉伯地区男性称呼男性挺亲切的一个称呼,就像朋友一样,只是他们的朋友分男女,就是分男性女性的不同称呼。
所以说你大概从这个角度呢,你都不用懂阿拉伯语,只用从简单的对比之上,你就能够看出这个词的意思很可能是什么。
所以由于人的语言啊,就具有这种单词成句,句子表意的这么一个(当然有时候单词也有其意思啊,单词当然每个单词都有其意义,但它的意义是单元性的,可能不是整体性的),那么很可能我们很容易能够发现这么一种规律,就是我们首先要找到单元,通过单元呢,再构成这个句子本身。
那么我们学习现代英语啊,这个单元很容易发现,因为英语每个单词和每个单词之间都有空格隔开,所以你很容易看出来就一个一个单词。
如果你有个计算机做分析的话呢,比如说你连续扫描一万本英文书,这个英文的单词表呢,你基本上就得出来了,对吧?
你们有哪些单词构成的,好几千个你就得,甚至一万多个你就得出来了。
汉语呢,复杂一点。
也就是说,我当然现代汉语也是有标点符号的,但我们知道古汉语比如说这下面列出来的这个龙著本的蓝听集序,它就没有标点符号。
因此如果你扫描一万份这样的文本呢,你能够提取出来的仅仅是汉字,你就把汉字的单元都提取出来了。
但是汉字构成的词汇呢,你还提取不出来。
当然,词汇你大概也能提出来,就即使你完全不通汉字也没有标点,它的重复性呢,我们能讲,如果群里有学习计算机的,你更容易想出来用什么算法。
就比如说有一个汉字前面说“我们大家”,但你可能完全不通汉语,但你就拿“我们”出来试。
如果你发现在这一万本汉语书里面“我们”这个固定组合比如出现的评测高过多少呢,你当然就能识别它是个词汇。
因此这种情况之下呢,你依然可以很快速的辨识一个语言。
当然我们也发现,英文不是从一开始词跟词之间就是有空格间隔的。
比如上面这个就是中世纪的一段文本(当然是拉丁文的文本),就中世纪的拉丁文呢,跟我们的汉语很像,就写作的时候呢,是不空格的,这个写作的时候就直接连着一起写。
你会发现就蓝听集序啊没有空格呢,就很多中文的古书你也能读,只是读起来有点累。
那对于西方人也是一样,就是中世纪这样的文本,如果你懂拉丁语呢,你也能读,就是读起来累。
这就涉及到另外一个很重要的东西啊,就是词跟词空格和标点符号是怎么来的?
最初的写作文字都是没有标点符号的,包括英文呢,最初的写作文字呢,也是不用空格的,就这么写。
因为在那个时候啊,写作是个特了不起的事情。
我们知道在在轴心时代之前(轴心时代可能一会儿我们再提一下,如果你大概应该知道什么是轴心时代),在轴心时代之前,掌握写作语言啊是个神权阶级的事情。
所以那个时候呢,他跟说话分得越开越好,他最好跟说话没什么关系,他最好让说话人有障碍的不认识是最好的,因为那会儿普通人你说话当然会说,但你是没有资格去学习写作语言的。
所以标点和英文空格的引入呢,其实是从发音到语句的变化,也就是标点符号,因为你能想象古代人即使写蓝天集序,他是一口气写下的。
他念蓝天集序,他自己的脑子里构想的时候呢,肯定不是从第一个字一口气构想到最后一个字,他依然是成句成句的。
他自己引用蓝天集序的时候呢,他当然是有停顿的,只是在古代写的时候呢,我们不把停顿标注出来。
在今天呢,我们就把停顿标注出来了,这个停顿呢,就是我们的逗号句号分号问号冒号等等等等的。
那英文呢,就把词与词之间在说话上的分别啊,就说话之中每个上一个词与下个词之间间隔的用空格就表现出来了。
所以说后面的写作文字的标点和空格呢,其实是从发音到语句的一个转化过程。
当然为什么做这样转化啊?
就是让那些只会发音不会写的人呢也看得懂,这是一个文化普及方面的一个工作啊,这是很重要的一个事情。
所以说我们都能想象啊,所以人类学习语言呢,其实是学听说,那读写呢,是后来的事情。
就如果你大家知识面稍微广一点,你们就会知道在我们建国之后做少数民族识别的时候呢,很多少数民族是只有发音的文字而没有写的文字的,就像中国彝族的文字就仅仅有发音而没法写。
所以我们知道早期民族史诗啊都是隐忧诗人传下来的,为什么呢?
就是因为那会儿的文字没有写的文字只有说的文字,所以你就口传下来的。
一旦有写之后呢,你立马可以摆脱什么口传阶级啊不需要了,你知道什么就把写下就完了,大家就拿文本往下传了。
但这个时候我要讲一个特别重要的东西,透过这点呢,我们也能发现文字的重要意义是什么,就是语言的一种重要意义是什么,以及它是如何从根本上改变我们这个社会的。
这个意义是这样的,我们可以想象比如早期格萨尔王(当然现在藏语是有写作文字的),在早期藏语没有写作文字,就是格萨尔王口传的时候呢,从上面传到下面,你是不知道有没有传错的。
也就是说你的老师交给你了呢,他也就是这样了,格萨尔王就是这样,你可能知道你老师告诉你这东西已经传了一万年了,现在传到你的手上你要把它背下来,然后你也就知道OK这样,你假设它是对的,那是你的老师告诉你。
在传的过程中呢,一共有十卷,现在呢,我们也就能背下八卷,有两卷遗失了,你也就只能知道这个信息就到此为止了。
但是一旦能够有写,假设我们格萨尔王啊写了十