写于 2017-08-11 01:06:03| 千赢国际手机版| 千赢国际
100年来,世界上7,000种语言中的许多语言已经灭绝数百年的口头故事会在几代人的时间内消失。这些语言中锁定的知识和美丽是不可替代的。它超越了有关季节和培养的有用点数不可翻译的单词和整个宇宙学的本地药物每种语言都是多代创意行为但是所有这些语言的声音,文字和故事都是在网上捕获的,例如在社区网站上和未来的YouTube网络语言学家将会有设计算法来破译在大规模灭绝事件之前所做的录音我的合作者和我想确定必须上传哪些语言数据,以确保世界上不成文的语言遗产得到保留,并使所有后代都能理解。早在2012年和2013年,我们访问了巴布亚新几内亚和巴西,教人们使用我们的Aikuma手机软件是为了记录和解释他们的语言Aikuma就像录音机一样,但它增加了保存和分享逐句评论和翻译的能力其他人通过解释体验原始录音法国研究团队最近将Aikuma带到了非洲和用三种当地语言录制了大约一百万字的语音显然,我们可以很容易地收集大量的原始语言数据但是我们如何分析它呢?我们从Rosetta Stone中获取线索:解密的关键是平行文本,或者 - 在不成文的语言的情况下 - 双语对齐的录音我们的方法是由于最近数字图像处理的进步而成为可能该方法使用人工神经网络和被称为深度学习向孩子展示一个图像并让她指向狗,她在一瞬间做到这一点算法也能做到这一点;它是什么使我们能够在网上搜索图像对于孩子 - 和算法 - 识别狗,他们必须首先找出在图像中引导注意的地方我们可以对音频做同样的事吗?我们是否可以单独使用英语转录单词并将其与源语言中的短片段相关联?我们最初的实验显示出了希望,本周将在圣地亚哥举行的国际会议上展示。最后一步是关闭循环在将源语言单词与英文翻译排成后,我们的算法报告了它的信心我们需要利用这些信息为了搜索数十或数百小时的未翻译音频,标记高价值区域,然后将这些信息呈现给人们进行翻译所有这些都有时间这听起来像是一项庞大的任务但是也许我们不需要去远程世界各地的角落毕竟,社交媒体和移动宽带现在已达到世界人口的50%,并且可能在十年结束时涵盖所有语言的发言者。因此,我们正在扩展Aikuma的社交媒体功能如果应用程序可以传播病毒,然后世界上消失的语言的发言者会用它来记录和翻译他们的故事,在我们的算法的指导下知道要翻译的内容xt一个简陋的应用程序已经解决了我们的问题但没有技术灵丹妙药世界上消失的语言的发言者正在优先考虑他们的生存他们正在采用经济上强大的语言,如中文,西班牙语或英语的发言者的心态:小语言不相关为了保护语言,我们必须超越我们的技术创新来破解主流文化这是Aikuma项目的使命由于世界人口日益增长的城市化,世界上消失的语言的发言者经常在城市中找到例如在澳大利亚,达尔文拥有最多样化的土着语言并且由于移民和难民,达尔文是澳大利亚人口最多样化的城市达尔文将成为语言演变实验的实验室我们将从达尔文的宝藏语言讲故事开始下个月的边缘艺术节:土着的讲故事表演基于我们最近在旧金山东湾举办的活动的移民语言每个故事都将使用Aikuma应用程序进行录制和分享,从而产生公众认可并唤起每位讲故事者和每种语言的自豪感 我们希望,观众中的每个双语故事听众都会被激励使用该应用程序记录和解释他们的孩子的父母的故事。这样,我们回到最古老的社交互动模式,围绕火灾讲故事但这一次,它被捕获在移动设备上,我们的算法有助于优先考虑翻译工作。而且可能,世界上的宝藏语言将持续至少另一代,

作者:苍儿沈