你好,游客 登录 注册 搜索
背景:
阅读新闻

【大数据时代】学霸教你如何用google思维学语言

[日期:2015-01-20] 来源:网易博客  作者:雨过天未青 [字体: ]

  首先,下文所述只是一种方法,不是绝对适合每一个人,也不是每个人照做就一定可以成功,但这几乎是每一个人学好语言的精华所在;其次,如果你认真思考过你 是如何学会中文的,那么你就能理解这篇文章的意义;最后,这个方法叫做“勤能补拙”。

  Google,全球最大的搜索引擎巨头,IT大鳄,每天要处理数以亿计的PB级别数据。在如今被吹得火热的大数据时代,说Google是大数据先驱一点也不为过。 Google旗下,有一种产品叫做Google翻译,如果你这几年都在持续地使用这项工具,你一定会发现,它翻译得越来越准确。

  虽然,它还是存在很多语法错误等。但至少,用词是不是越来越精准了呢?有句语言界的俗话:环境,是你学好语言的关键。很多时候你会发现,在国外呆过的相比没出过国的,讲外语的腔调就是不一样。那么这个环境究竟有什么魔力?它到底是由什么构成的呢?我大致总结了一下:1.大家都讲外语从而导致你听到的和看到的都是外语(输入环节)2.大家都讲外语从而导致你说出的和写下的都必须是外语(输出环节)3.这句话他们都是这么讲的,那么我以后也应该这么讲(审核机制)

  所以整个流程是这样的:大家都讲外语→你听和读到的信息是外语→你大脑会将某些你熟悉的信息直接由外语思维反馈,对于你不熟悉的信息,你会用你熟悉的中文语境一个个导入外文单词、句式和语法,从而处理这条你不熟悉的信息(前者叫条件反射,后者叫逻辑思维)→你说和写出的信息是外语(→你将你说和写出的信息与你听和读到的 信息作对比,从而完善你下次说和写出的信息)→对话或阅读继续→你听和读到的信息是外语→……简单地说,这个流程就是:输入→整合再输入→处理→输出→输入→……。

  当一个项目同时输出多次,这就变成了你的习惯,变成了你对该语言的条件反 射。所以,你剩下的就是尽可能多的去丰富输入环节,并反复输出环节。这个其实就是Google翻译的自我学习机制。所以,量变是真的能产生质变。Google 翻译很勤奋,所以它现在越来越聪明,翻译工作也越来越专业。但Google翻译目前仍然有一个缺陷:语法句式等规则的学习。

  无数翻译界的先驱曾尝试将语法句式等规则整合进翻译软件,可目测前来看,效果一塌糊涂。这也就是为什么如今中国校园的外语学霸一抓一大把,可他们在实际使用环节却 相当差劲。(当然,这句话我说得绝对了些,也有无数学霸理论和实践结合得相当好。)所以外语教育的症结就在这里,所以李阳英语很疯狂。这里不谈中国教育, 因为树大根深,问题太多,改变难度相当之高,目前堪称无解。这里主要谈自我学习,这也是未来的趋势,这也是互联网的将来,这也是改变中国教育的可能之路。

  婴儿是如何学语言的?为什么要说到婴儿学语言?因为面对一种陌生的外语,你和婴儿没什么太大区别,除了你有更强大的逻辑思考能力,更多关于学习的经验以及更高的智商情 商。这里我就不搬很多学说了,我就将大家都明白的事实重新梳理一下:婴儿降生→获取听力、视觉、嗅觉和触感等感觉(感觉意味着环境信息收集器)→大家都在 哄婴儿,大家都在说话→婴儿记录下大家说话时的环境信息和语言内容信息→婴儿听到并尝试分析所得到的内容→婴儿知道什么时候该说这句话,并用什么样的语 气、表情等→反复前一个环节,当该环节反复到一定数量,婴儿学会语言。

  如果你觉得这个流程正确,那么你一定会发现,该婴儿没有学过语法等规则。这是因为:大量的语言内容信息导致人类的大脑能够分析总结出该类语言法则。这就是为什么卖油翁说:”我亦无他,唯手熟尔。“卖油翁在无数次倒油中 总结出了最佳的倒油角度,速度,方向等。倒油角度,速度,方向等,就是倒油的“语法”规则。他的师父或许教过他这几个规则,虽然没有量化精确化,但我们假 设他的师父教过他,那么你相信他第一次学习就能倒好油吗?你相信他天天计算这几个数值就能倒好油吗?

  至少,我不相信,中国教育体系相信。(再次重申,这不是教育体系这一个元素的错,是无数个元素,包括生态、历史、人文、人性等一系列与教育性质看上去无关的问题。所以,请不要继续喷中国教育怎么怎么差劲。有 本事你一条条分析产生如今教育现状的根源并搬出一套大多数人都觉得可以的解决方案并实行。如果喷,能解决问题或者督促有关部门解决问题,那我肯定比你先去 喷,比你喷的还积极,并且鼓动你一起喷。

  中国不缺评论家,缺的是实干家。简单的说,你行你上啊。)如果,卖油翁没有师父,那么他掌握倒油的过程就等相当于 于婴儿上学前学习语言的流程。一般来讲,婴儿说出的第一个词是“妈妈”,“妈妈”是什么意思?婴儿知道吗?不知道。婴儿只知道“妈妈”二字就代表眼前抱着她的这个女性。女性是 什么意思?婴儿知道吗?不知道。婴儿只知道“女性”二字就代表眼前抱着她的这个人类。

  “人类”是什么意思......这样的推断我就不写下去了。也就是 说,对于婴儿来说,“妈妈”是一种语言指向,指向抱着她的这个人,而没有涉及到家庭体系称呼的问题(这句话的概念确实很难理解)。说到这里,如果你还在解 释说:“妈妈”的意思就是“眼前抱着她的这个女性”啊。那对不起,请你多念念书,我在讨论科学逻辑,而你在从哲学或语文的角度来看待这个问题。

  另外,如果 你还问“子非婴儿安知婴儿之思?”那我只能说,傻逼,你滚吧。当我在这种环境下说出这句话时,我的表情、语气、声调、之前一句话等信息都会被婴儿记下,由 此导致下次,有人对该婴儿说:“子非婴儿安知婴儿之思?”婴儿很可能也回复:“傻逼,你滚吧。”上一段的语气会让你觉得我很高傲或粗俗,这就是语言的反馈。因为之前你所接触到的信息中,有信息是以这样的语气或方式陈述的,你通过侧面因素导致你知道那条信息是体现信息载体的高傲或粗俗,所以你会觉得我之前一段所述的内容让你觉得我很高傲或粗俗。

  如果我之前的文字是用一种你完全不懂的语言描述, 或者是你稍微学过一些的语言,你不一定能推断出“信息载体很高傲或粗俗”这个结论。而一旦,有别的人对这段内容表示了“信息载体很高傲或粗俗”,虽然你不 懂该语言或只学过一点,你也很可能会在下次碰到同样内容时得到如下结论:信息载体很高傲或粗俗。如果有人,并且人数越来越多,对这段内容表示了“信息载体 很谦虚”,虽然你不懂该语言或只学过一点,你也很可能会在下次碰到同样内容时纠正之前的结论,并重新输出如下结论:信息载体很谦虚。

  接下来就是本文的精髓Google翻译:大量输入→然后输出→大众纠错→纠错的结果反馈给Google→Google审核→把合适的纠错结果输入进Google翻译→大量输出→......→学成语言→智能说话AI所以最后的结论就是:勤能补拙,大量阅读大量听,然后大量写作大量说,接着继续大量阅读大量听。

  这个建议你肯定听无数人说过,如果你看完本文还停 留在字面意思,那希望你能继续思考我为什么用这么啰嗦的文章跟你解释什么叫“勤”。你悟透了,恭喜你,大数据时代真的在向你招手了。你看了半天,你会说,你说了那么多,好像没什么实质的东西啊。

  对此,我提前回应一下:1. 亲,我已经把学语言的本质大概给到你了,如果你还不能据此摸索出一套个性化方法,那么抱歉你浪费了很多时间阅读前文,或者说你只是读,没去思考,那么,你有可能就是我们通常认定的书呆子。2. 我的结论不一定正确,互联网精神不容许出现一个绝对权威规则的存在,我的理论可能大多数人认同。但你完全可以否定或部分否定。

  如果否定,请搬出你的论点和 论据,如果大家都认同,我会及时整改。这个规则其实就是维基百科的精髓。因为任何信息,随着时间的推移,都可能会被时代所抛弃。(“地球是宇宙的中心”这 个经典的例子我就不再阐述了,大家都知道)3. 每个人的习惯不同,学习方法不同,学习效率不同,如果你一边喊填鸭式教育坑爹,一边又在说LZ你没实质性解决方法,那么对不起,我的能力、时间和精力有限,不能针对每个人提供一套根据我的理论导出的学习方法。4. 文章开头我已经解释过这个问题了。

  最后的最后,我补充一点,我没有提到专业学习语法规则等没有用。借助语法规则你会学得更扎实,靠大数据的“勤”会让你学得更实用,哪个更好?我不 知道,每个人都不同。两者能结合,那就更好了。因为前者意味着智能AI,后者意味着大数据。在未来,两者将相辅相成,缺一不可。这,是未来,却早已存在于 过去,存在于每个人的身上。这篇文章,只是帮你梳理和挖掘。





收藏 推荐 打印 | 录入:Cstor | 阅读:
本文评论   查看全部评论 (3)
表情: 表情 姓名: 字数
点评:
       
评论声明
  • 尊重网上道德,遵守中华人民共和国的各项有关法律法规
  • 承担一切因您的行为而直接或间接导致的民事或刑事法律责任
  • 本站管理人员有权保留或删除其管辖留言中的任意内容
  • 本站有权在网站内转载或引用您的评论
  • 参与本评论即表明您已经阅读并接受上述条款