
目前的机器翻译纯粹是走算法和统计的路线。即跨语言人工智能核心要素在于两点:一是NMT(神经网络机器翻译技术),二是海量的高质量语料。这跟真正的语言学并没有什么关系。
GNMT没有利用语言学的原因就是:语言本身就是规律性极低。或者说人类对语言学及人脑处理语言技术还没有掌握其规律。人工智能的可行性就是掌握大数据并且发现其中之规律,而对于难寻规律的语言来说谷歌仅仅是掌握了目前仅有的数据。它不是真的掌握了这门语言,而是每当有人给出新句子,它就从翻译好的数据库里“学习”,根据已有的翻译 “猜”这一句的意思,意思就是“识别”出最有可能的已有翻译。正确地将英文翻译成中文,但它仍然不懂英文,也不懂中文。实际上每天都有大量的新的数据更新,涌现出来,关于之前没有“接触”过的新数据,GNMT就无法翻译。
机器翻译在重大场合犯错其实不是一次两次,比如科大讯飞、搜狗等都因为机器翻译出过事故。在2016年的乌镇互联网大会上,王小川首秀搜狗实时机器翻译,就在演示过程中不断出现“中式英语”的尴尬,甚至将“飞机落地”翻译成了有“坠机”之意的“fell down”。

因此,如果要说机器翻译的作用,它的真正作用就是解决极其简短的翻译,或者只是为了了解句子的大意,但是这也不能保证句子出现翻译错误的情况。机器翻译更多的是针对专业翻译人员的使用,在机器翻译的基础上,再对机器翻译错误的部分进行修改,缩短翻译时间,提高翻译效率。
可以看出,目前人类对语言的研究及人脑如何进行语言的模糊识别和判断没有最终明了的情况下,即便机器有数据库支撑,但对于规律性极低的语言机器翻译达到100% 的准确率是完全不可能的。语言是载体,传递的真实信息才是内核。翻译工作根本上不是纯粹依靠具体的语言工作在做翻译,而是翻译人员从多年来所掌握的与人有关的知识库中提取所需要的知识,根据被翻译人员话中的隐喻及其微表情来做具体处理的。
另外,现有的翻译软件只能是在周围环境安静、说话者音量语速适中才能正常使用。在大型会议中,机器翻译同步翻译在屏幕上,人们对着屏幕读文字,对于信息接受者而言视觉效果远不如听觉效果,吸收率低。