语言差异成AI鸿沟？牛津新研究汉语训练费用是英语2倍

2023-07-31 18:13:17 来源：互联网

【资料图】

如今各大科技企业都在加速布局AI项目，不过也许世界各国的语言成为不小的障碍。

大型语言模型（LLM）可以理解世界上很多语言，甚至是一些记载较少的语言。不过，大模型处理不同语言之间时，其性能上存在很大的差异，这是由于模型成本与其所训练的语言紧密挂钩。

牛津大学最近进行的一项研究表明，从诸多语言模型的计费方式看，英语的输入和输出比其他语言的输入和输出要便宜得多。例如，西班牙语的成本约为英语的1.5倍，简体中文的价格约为2倍以上，缅甸掸语在15倍以上。

成本差异主要是因数据标记化所带来的。标记化就是将训练文本分解成更小的单元，这个更小的单元就是标记（Token）。这是一个人工智能（AI）公司将用户输入转换为计算成本的过程。

研究显示，使用英语以外的语言访问和训练模型的成本都更高。例如中文，无论是在语法上还是在字符数量上，都有更复杂的结构，从而导致更高的标记化（Token）率。

举例来看，基于OpenAI公司的GPT2模型，对于“国家不同，所得税的结构是不同的，税率和税率等级也有很大的差异”这句话的处理来看，在简体中文处理中运用到了66个Token，在英语处理中仅用到了24个Token，而在禅语处理中使用到了468个Token。

就每次输出所需的费用而言，汉语的成本是英语的两倍。所以在AI相关的费用中，英语的成本效益是最高的。

当涉及到语言模型时，设计者的主要目标是实现低成本和高效功能之间的平衡。随着AI领域的不断发展，科技公司必须仔细考虑语言选择对成本和可访问性的影响。

这种成本差异促使中国、印度等国家纷纷开发自己的母语LLM项目。

上一篇：《重生边缘》国服定档9月8日游戏预约开启
下一篇：最后一页

猜您喜欢

时尚

1 老车主“声讨”奏效？领克汽车公布多款车型智能座舱系统更新计划

2 正海生物：上半年净利润1.1亿元同比增长5.53%

3 公牛集团：公司新能源业务目前主要包括新能源汽车充电枪、充电桩，户外便携式储能等产品

4 深汕水稻试验示范基地亩产创新高

5 注意做好防御！西安雷雨大风马上来！

6 罗体：虚拟货币公司结束和罗马、国米等合作关系

7 中超首轮最大亮点是他们，U23球员成长明显，多人进入国足视野

8 共创美好未来爱与幸福永伴新婚祝福相伴一生

9 当第一代玩电脑游戏的孩子成为父母亲子关系能否有新的打开方式

10 《卧龙：苍天陨落》后续更新计划公布 8月免费追加BOSS连战关卡第2弹

演艺

商务部新闻发言人就无人机出口管制政策应询答记者问

苏州包皮医院专业-医治包皮过长发炎的方法都有哪些？

四问6号台风“卡努”：是否登陆我国重点影响哪些地区？

敬挽的挽是车字旁还是提手旁敬挽

市场观察 | 与“蔚小理”争份额，高合HiPhi Y上市半月终端表现如何？

游戏

1. 语言差异成AI鸿沟？牛津新研究汉语训练费用是英语2倍

2. 《重生边缘》国服定档9月8日游戏预约开启

3. 从专业化到平民化，Y3编辑器或将开拓游戏开发行业下半场

4. 港服PS三档会员新增试玩游戏：《巫师3狂猎完全版》

5. 马斯克总部巨大“X”标引争议太闪亮打扰邻居休息

6. 《黑神话：悟空》宣布首次线下试玩会 8月20日杭州举办

7. 亚马逊《辐射》真人电视剧片场照流出

8. 《无职转生》第二季新主艺图魔法大学篇即将启动

9. 科学系高玩算出《王国之泪》海拉鲁重力的确比地球重

10. 《失落之魂》还将登陆PC RTX光追预告和CJ 2023 9分钟试玩

语言差异成AI鸿沟？牛津新研究汉语训练费用是英语2倍

语言差异成AI鸿沟？牛津新研究汉语训练费用是英语2倍

《重生边缘》国服定档9月8日游戏预约开启

老车主“声讨”奏效？领克汽车公布多款车型智能座舱系统更新计划

商务部新闻发言人就无人机出口管制政策应询答记者问

三花智控：征地补偿款已在2022年年报中全部体现完毕

最新发布！北京昌平区公交线路重要调整

天力锂能：尚未建设磷酸锰铁锂项目四川天力公司在建的磷酸铁锂项目产线具有一定的兼容功能

正海生物：上半年净利润1.1亿元同比增长5.53%

苏州包皮医院专业-医治包皮过长发炎的方法都有哪些？

保育员自我规划范文自我规划范文

孙子兵法与促销36计(关于孙子兵法与促销36计简述)

网贷挺过3年就没事了？看完不敢再逾期

公牛集团：公司新能源业务目前主要包括新能源汽车充电枪、充电桩，户外便携式储能等产品

四问6号台风“卡努”：是否登陆我国重点影响哪些地区？

美的置业港股涨13.45%

北京新发地市场价格平稳今日上市量2.01万吨保障“菜篮子”

chatGPT你划英语token还像样，其他语言你就瞎七八分来算钱你好意思吗？

深汕水稻试验示范基地亩产创新高

敬挽的挽是车字旁还是提手旁敬挽

汇集高精尖技术探索材料科学前沿 IPB 2023正式开幕

时尚

演艺

游戏