您的位置:首页 > 大数据 > 人工智能

将英语转移至日语的迁移学习技术 AWS将训练AI转换模型

2019-05-15 16:00 656 查看
原文链接:https://my.oschina.net/u/3906919/blog/3049925

AWS发布了一种跨语言迁移学习技术,该技术使用具有足够培训数据的语言模型,通过迁移学习转移到培训数据较少的语言。 AWS用于将英语处理模型转换为德语,这次此时,实验将英语转换为日语。

由于欧洲语言和日语之间的字符无法配对,因此很难在两种语言之间进行转换。为解决此问题,AWS使用日语字符和音译罗马字母作为日语系统AWS的输入数据。还进行了大量的实验,以找出英国模型的哪些部分可以转移到日语。

AWS的实验使用了两个公共数据集,将罗马化日语文本传输模型与相同数据进行比较,并训练de novo训练模型。在两个数据集中,转移模型的F1得分提高了5.9%。和7.4%,表明模型更稳定。

AWS英语和日语转换模型的目标是识别名称实体或标识语句中的名称类别,例如歌曲名称,运动队名称或城市名称。模型的输入数据报包含两种类型的向量:单词向量和字符向量。这些向量由神经网络生成。输入语言数据由向量或字符串表示。在将这些矢量投影到多维空间中之后,可以指出它们。在自然语言理解系统中,例如名称实体识别器,数据之间的相似性通常两个词向量的相似性越高,也意味着两者具有相似的语义。

生成字符向量的网络首先将单词拆分为城市的多个组成部分,如两个字母,三个字母等。字符向量空间的相似性可以显示单词子组件的相似性,字符向量通常可以因为单词向量可以使机器学习系统,对于不熟悉的单词的含义,根据根,前缀和后缀进行猜测。

在AWS语言模型中,每个输入字的字符被发送到双向长期和短期循环神经网络(bi-LSTM),它按顺序处理输入数据,因此每个输出可以反映先前的输入和输出数据然后,AWS将来自网络的字符向量和字向量输出放入另一个双向长期和短期循环神经网络。该fun88淘搜网网络按顺序处理输入句子的单词,产生丰富的向量表示输出,因此输出在语句中找出每个输入单词的根,词缀,意识形态和上下文信息。最后,输出数据被放置在另一个分类实体名称的网络中。

转载于:https://my.oschina.net/u/3906919/blog/3049925

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: