r />\n
张翰听见后排中国随员中有人嘀咕:“我说干嘛那么急出新版……”
\n
“开头两年我们的进步非常慢。我采纳王博士的建议,从语音而不是文字开始。一个单音节汉语字‘人’,为了让万国宝网络对所有真人发音产生自发连接,用了整整一年!男女老少,普通话的ren,吴语的nin,四川话的zen,粤语的yaen……训练它的方法,仍然是概率学ai那一套:把真人说话的语境数字化,用大规模统计来建立概率连接。我们的新设计并不排斥概率学ai方法,只是把它限制在感官接口和底层连接实现上。自然进化需要千万年实现的东西,我们摘了同行的果子。
\n
“跨语种时,第一选择当然是英语。原以为会更慢,没想到只用了1/20的时间。事后想来这是必然的:万国宝把各种汉语中的‘人’发音连起来之后,已经向上抽象了一层。在那里,它有了一个概念,虽然它还无法用其它词语表述。但摸到英语时它很快发现下面连接的都是类似的语境,于是在上面那一层直接建立连接!语法对它来说根本不存在,它对‘相似’或者‘同义’的判断,根据来源于底层的底层:真实世界。
\n
“从语言到文字的连接更是快得出乎意料。我终于明白了王博士的直觉:文字本身就是符号化的、经过抽象的语音。它介于我们定义的第一层和第二层之间,不能用来打地基。然而,我们在头一年咬牙磨出来的原始连接,被文字插在中间双向传导,整个概念网络的扩展速度提高了一个数量级。
\n
“2032年团队全体放大假,王博士带我们去语言学家的天堂——新几内亚玩。在岛上,当地的土著和她又给了我几道闪电。
\n
“第一道是和土著强行交谈时被闪到的。我和土著一对一,两个人连说带比,半天也没什么进展。比如我指着自己说‘我’,他怎么知道我的意思是人称代词,是名字,是‘你的主人’,还是‘文明的灯塔’?然而双方三对三,效率立即提高几十倍。我可以指一圈:‘我’、‘你’、‘他’、‘他’、‘他们’。这样一搞,双方还立即明白了汉语第三人称只有单数复数,而土著语有单数、双数和三数。在这之前,我们出于
本章未完,请点击下一页继续阅读! 第12页 / 共14页